데이터사이언스

    (스마트인재개발원) 머신러닝 기초 데이터 전처리

    데이터 전처리란? 주어진 원데이터를 그대로 사용하기보다는 원하는 형태로 변형해서 분석하는 경우가 굉장히 많다. 따라서 분석에 적합하게 데이터를 가공하는 작업을 ’데이터 전처리’라고 한다. 자주사용되는 함수들 미리 알아보자! 1.특정 Column 선택하기 df[ 'Humidity' ] : 특정 Column(Humidity)의 데이터들을 뽑아냅니다.(출력 형태 : Pandas Series) df[[ 'Humidity' ]] : 특정 Column(Humidity)을 뽑아냅니다.(출력형태 : Pandas DataFrame) df[[ 'Humidity, 'Outlook' ]] : 특정 Column들(Humidity, Outlook)을 뽑아냅니다.(출력형태 : Pandas DataFrame) 2. 특정 Row 선택..