머신러닝 3

[Python] 04장_고객의 행동을 예측하는 테크닉

파이썬 데이터 분석 실무 테크닉 100 04장 _ 고객의 행동을 예측하는 테크닉 [ 머신러닝 ] 3장에서 분석한 스포츠 센터 회원의 행동 정보를 이용해서 머신러닝으로 예측 해보자 - 클러스터링 기법 이용 1. 데이터 불러오고 확인하기 import pandas as pd use_log = pd.read_csv("c:/data/use_log.csv") use_log.isnull().sum() customer = pd.read_csv("c:/data/customer_join.csv") customer.isnull().sum() end_date 외에는 결측치가 0이다. 2. 클러스터링으로 회원 그룹화하기 customer 데이터를 사용해서 회원 그룹화를 해보자 customer.head() 이 중 고객의 한달 이용..

[ML] 02-1 훈련 세트와 테스트 세트

혼자 공부하는 머신러닝+딥러닝 책을 바탕으로 공부한 내용입니다. CH2 데이터 다루기 ① 훈련 모델 평가 이전에는 train, test data를 따로 준비하지 않고 훈련한 데이터로 모델 학습 후 평가했기 때문에 정확도가 100%였다. 머신러닝 알고리즘의 성능을 제대로 평가하기 위해 훈련 세트와 테스트 세트를 나눠서 학습해보자. ▶ 훈련 세트와 테스트 세트 먼저, 도미와 빙어의 데이터를 합쳐 하나의 파이썬 리스트로 준비한 후 2차원 리스트로 만들어주자 # 도미, 빙어의 길이와 무게 데이터 fish_length = [25.4, 26.3, 26.5, 29.0, 29.0, 29.7, 29.7, 30.0, 30.0, 30.7, 31.0, 31.0, 31.5, 32.0, 32.0, 32.0, 33.0, 33.0,..

[Python] 03장 _ 고객의 전체 모습을 파악하는 테크닉

파이썬 데이터 분석 실무 테크닉 100 03장 _ 고객의 전체 모습을 파악하는 테크닉 [ 머신러닝 ] 1. 데이터 불러오고 확인하기 import pandas as pd use_log = pd.read_csv("c:/data/use_log.csv") customer_m = pd.read_csv("c:/data/customer_master.csv") class_m = pd.read_csv("c:/data/class_master.csv") campaign_m = pd.read_csv("c:/data/campaign_master.csv") use_log.head() customer_m.head() class_m.head() campaign_m.head() 2. 고객 데이터 가공하기 customer_m에 clas..