스마트 인재개발원/머신러닝 & 딥러닝

    (광주인공지능학원) CNN 기초공부하기 2

    Conv2D ( filters = 32, kernel_size = (5, 5), padding='valid', input_shape=(28, 28, 1), activation='relu‘, strides = (2, 2) ) 첫번째 인자 : Convolution 필터의 수. 두번째 인자 : Convolution 커널의 (행, 열). Conv2D ( filters = 32, kernel_size = (5, 5), padding='valid', input_shape=(28, 28, 1), activation='relu‘, strides = (2, 2) ) padding : 경계 처리 방법을 정의. ‘valid’ : 유효한 영역만 출력. 따라서 출력 이미지 사이즈는 입력 사이즈보다 작다. ‘same’ : 출력 ..

    (광주인공지능학원) CNN 딥러닝 기초다지기

    MLP 이미지 분석 MLP은 층이 깊어지고 뉴런의 수가 많아지면 가중치 수가 급격히 늘어 난다. MLP 신경망을 이미지 처리에 사용한다면 이미지의 어떤 특정 패턴이 존재하는 위치에 민감하게 동작하며 패턴의 위치에 종속적인 결과를 얻는다. MLP는 아래 세 개의 5는 패턴이 다르다고 판단한다. MLP로 이러한 숫자 인식을 하려면 숫자의 크기를 비슷하게 맞추어야 한다. (광주인공지능학원) CNN (Convolution Neural Network) 광주인공지능학원 이명훈연구원님 설명에 의하면 1998년 Yann Lecun 교수에 의해 1950년 대 수행했던 고양이의 뇌 파 실험에 영감을 얻어 이미지 인식을 획기적으로 개선 할 수 있는 CNN 제안 이미지를 가까운 거리에서 본다면 조금 더 떨어져서 보면 더 떨어..

    (광주인공지능학원) 활성화함수, 오차역전파, 경사하강법

    활성화 함수란? (Activation Function) 신경망은 선형회귀와 달리 한 계층의 신호를 다음 계층으로 그대로 전달하지 않고 비선형적인 활성화 함수를 거친 후에 전달한다. 이렇게 하는 이유는 신경망을 모방하여 사람처럼 사고하는 인공지능 기술을 구현하기 위함이다. 실제로 비선형의 활성화 함수를 도입한 신경망이 잘 동작하고 있다. 오차역전파 오차역전파란 역전파는 계산 결과와 정답의 오차를 구해서 이 오차에 관여하는 노드 값들의 가중치와 편향을 수정하는데, 이때 오차역전파(backpropagation)는 오차가 작아지는 방향으로 반복해서 수정합니다. 이 횟수가 커지면 그만큼 정확성은 높아지지만 시간이 오래 걸리는 단점이 있고, 횟수가 작아지면 정확성은 떨어지지만 시간이 단축되는 장점이 있습니다. 이 ..

    (스마트인재개발원) Kaggle대회 참가 - 전자 상거래 물품 배송 예측(분류)

    ID: ID 고객 번호입니다. 창고 블록: 회사에는 A,B,C,D,E와 같은 블록으로 나누어진 큰 창고가 있습니다. 배송 모드:회사는 제품을 선박, 비행 및 도로와 같은 다양한 방법으로 배송합니다. 고객 관리 전화: 발송물 조회를 위한 문의로 걸려온 전화 수. 고객 등급: 그 회사는 모든 고객들로부터 등급을 매겼다. 1이 가장 낮음(최악), 5가 가장 높음(최악)입니다. 제품 비용: 제품 비용(미국 달러) 이전 구매: 이전 구입 횟수입니다. 제품 중요도: 회사는 제품을 저, 중, 고 등 다양한 파라미터로 분류했습니다. 성별: 남성과 여성. 할인 혜택: 그 특정 제품에 대한 할인이 제공됩니다. 가중치: 그것은 그램 단위의 무게이다. 정시에 도달함: 이 값은 목표 변수입니다. 여기서 1 제품이 제시간에 도달..

    (스마트인재개발원) 머신러닝 KNN 실습

    목표 - iris(붓꽃)데이터를 활용 - 꽃잎 길이, 꽃잎 너비, 꽃받침 길이, 꽃받침 너비 - KNN모델의 이웃의 숫자를 조절해보자(하이퍼파라미터 튜닝) 2. 데이터 수집 - sklearn에서 제공하는 붓꽃 데이터 사용 (1) kNN 모델 정의 및 개념 k-Nearest Neighbor 모델의 약자입니다. 미리 학습을 하지 않고, 새로운 데이터의 Task 요청이 올때 그 때 분류를 수행하는 절차로 이루어지며, 기본 개념은 새로운 데이터가 어느 그룹에 속하는지를 분류하기 위해 가장 가까이 있는 학습데이터의 그룹을 알아보는 것 k=1일 때를 살펴보면 테스트 데이터에서 가장 가까운 학습 데이터는 동그라미 클래스에 속함을 알 수 있다. 따라서 테스트 데이터의 클래스를 동그라미 클래스로 정해준다. k=3일 때를..

    (스마트인재개발원) 머신러닝 기초 데이터 전처리

    데이터 전처리란? 주어진 원데이터를 그대로 사용하기보다는 원하는 형태로 변형해서 분석하는 경우가 굉장히 많다. 따라서 분석에 적합하게 데이터를 가공하는 작업을 ’데이터 전처리’라고 한다. 자주사용되는 함수들 미리 알아보자! 1.특정 Column 선택하기 df[ 'Humidity' ] : 특정 Column(Humidity)의 데이터들을 뽑아냅니다.(출력 형태 : Pandas Series) df[[ 'Humidity' ]] : 특정 Column(Humidity)을 뽑아냅니다.(출력형태 : Pandas DataFrame) df[[ 'Humidity, 'Outlook' ]] : 특정 Column들(Humidity, Outlook)을 뽑아냅니다.(출력형태 : Pandas DataFrame) 2. 특정 Row 선택..