데이터전처리

    (광주인공지능학원) 2차프로젝트 마무리 및 다니면서 느낀점

    2차프로젝트 시연 동영상 2차프로젝트가 마무리 되었다. 그동안 밀린 티스토리 업데이트도 남아있지만 오늘은 스마트인재개발원은 다니면서 느낀점을 써보려 한다. 이글을 읽는 누군가는 도움이 되었으면 좋겠다. 터닝포인트라는 말이 있다. 인생에서는 사람마다 시기와 방법은 다르겠지만 어떠한 변곡점이 있는데 인공지능에 미친 우리들은 요즘 이걸 시그모이드 함수에 0.5가 넘어 가게 해주는 마지막 0.001이 스마트인재개발원이 아니였을까? 말한다 글을 읽는 당신에게 좀 더 필자는 신뢰감을 주기위해서 아래와 같은 증거를 제시한다. 1. 2021 K디지털 해커톤 200여개의 팀 중 본선진출 (우리가 그린) 2. 1차프로젝트 최우수상, 2차프로젝트 우수상, 자바페스티벌 우수상 3. 딥러닝의 이해와 본인의 관심분야 설정 (Yo..

    (스마트인재개발원) 머신러닝 KNN 실습

    목표 - iris(붓꽃)데이터를 활용 - 꽃잎 길이, 꽃잎 너비, 꽃받침 길이, 꽃받침 너비 - KNN모델의 이웃의 숫자를 조절해보자(하이퍼파라미터 튜닝) 2. 데이터 수집 - sklearn에서 제공하는 붓꽃 데이터 사용 (1) kNN 모델 정의 및 개념 k-Nearest Neighbor 모델의 약자입니다. 미리 학습을 하지 않고, 새로운 데이터의 Task 요청이 올때 그 때 분류를 수행하는 절차로 이루어지며, 기본 개념은 새로운 데이터가 어느 그룹에 속하는지를 분류하기 위해 가장 가까이 있는 학습데이터의 그룹을 알아보는 것 k=1일 때를 살펴보면 테스트 데이터에서 가장 가까운 학습 데이터는 동그라미 클래스에 속함을 알 수 있다. 따라서 테스트 데이터의 클래스를 동그라미 클래스로 정해준다. k=3일 때를..

    (스마트인재개발원) 머신러닝 기초 데이터 전처리

    데이터 전처리란? 주어진 원데이터를 그대로 사용하기보다는 원하는 형태로 변형해서 분석하는 경우가 굉장히 많다. 따라서 분석에 적합하게 데이터를 가공하는 작업을 ’데이터 전처리’라고 한다. 자주사용되는 함수들 미리 알아보자! 1.특정 Column 선택하기 df[ 'Humidity' ] : 특정 Column(Humidity)의 데이터들을 뽑아냅니다.(출력 형태 : Pandas Series) df[[ 'Humidity' ]] : 특정 Column(Humidity)을 뽑아냅니다.(출력형태 : Pandas DataFrame) df[[ 'Humidity, 'Outlook' ]] : 특정 Column들(Humidity, Outlook)을 뽑아냅니다.(출력형태 : Pandas DataFrame) 2. 특정 Row 선택..