딥러닝

    (스마트인재개발원) Kaggle대회 참가 - 전자 상거래 물품 배송 예측(분류)

    ID: ID 고객 번호입니다. 창고 블록: 회사에는 A,B,C,D,E와 같은 블록으로 나누어진 큰 창고가 있습니다. 배송 모드:회사는 제품을 선박, 비행 및 도로와 같은 다양한 방법으로 배송합니다. 고객 관리 전화: 발송물 조회를 위한 문의로 걸려온 전화 수. 고객 등급: 그 회사는 모든 고객들로부터 등급을 매겼다. 1이 가장 낮음(최악), 5가 가장 높음(최악)입니다. 제품 비용: 제품 비용(미국 달러) 이전 구매: 이전 구입 횟수입니다. 제품 중요도: 회사는 제품을 저, 중, 고 등 다양한 파라미터로 분류했습니다. 성별: 남성과 여성. 할인 혜택: 그 특정 제품에 대한 할인이 제공됩니다. 가중치: 그것은 그램 단위의 무게이다. 정시에 도달함: 이 값은 목표 변수입니다. 여기서 1 제품이 제시간에 도달..

    (스마트인재개발원) 머신러닝 기초 데이터 전처리

    데이터 전처리란? 주어진 원데이터를 그대로 사용하기보다는 원하는 형태로 변형해서 분석하는 경우가 굉장히 많다. 따라서 분석에 적합하게 데이터를 가공하는 작업을 ’데이터 전처리’라고 한다. 자주사용되는 함수들 미리 알아보자! 1.특정 Column 선택하기 df[ 'Humidity' ] : 특정 Column(Humidity)의 데이터들을 뽑아냅니다.(출력 형태 : Pandas Series) df[[ 'Humidity' ]] : 특정 Column(Humidity)을 뽑아냅니다.(출력형태 : Pandas DataFrame) df[[ 'Humidity, 'Outlook' ]] : 특정 Column들(Humidity, Outlook)을 뽑아냅니다.(출력형태 : Pandas DataFrame) 2. 특정 Row 선택..