데이터시각화
(스마트인재개발원) 머신러닝 KNN 실습
목표 - iris(붓꽃)데이터를 활용 - 꽃잎 길이, 꽃잎 너비, 꽃받침 길이, 꽃받침 너비 - KNN모델의 이웃의 숫자를 조절해보자(하이퍼파라미터 튜닝) 2. 데이터 수집 - sklearn에서 제공하는 붓꽃 데이터 사용 (1) kNN 모델 정의 및 개념 k-Nearest Neighbor 모델의 약자입니다. 미리 학습을 하지 않고, 새로운 데이터의 Task 요청이 올때 그 때 분류를 수행하는 절차로 이루어지며, 기본 개념은 새로운 데이터가 어느 그룹에 속하는지를 분류하기 위해 가장 가까이 있는 학습데이터의 그룹을 알아보는 것 k=1일 때를 살펴보면 테스트 데이터에서 가장 가까운 학습 데이터는 동그라미 클래스에 속함을 알 수 있다. 따라서 테스트 데이터의 클래스를 동그라미 클래스로 정해준다. k=3일 때를..