Python/데이터분석 공부 5

[Python] 05장_회원 탈퇴를 예측하는 테크닉

파이썬 데이터 분석 실무 테크닉 100 05장 _ 회원 탈퇴를 예측하는 테크닉 [ 머신러닝 ] 이미 탈퇴한 회원과 계속해서 이용하는 회원의 데이터에 대해 '의사결정 트리'라는 지도학습 분류 알고리즘을 이용해 탈퇴를 예측해보자 1. 데이터 불러오기 & 이용 데이터 수정하기 import pandas as pd customer = pd.read_csv("C:/data/customer_join.csv") uselog_months = pd.read_csv("C:/data/use_log_months.csv") customer.head() uselog_months.head() 우리는 미래를 예측하기 위해 그 달과 1개월 전의 이용 이력만 데이터로 사용할 것이다. 4장처럼 과거 6개월의 데이터로 이용횟수를 예측하는 경..

[Python] 04장_고객의 행동을 예측하는 테크닉

파이썬 데이터 분석 실무 테크닉 100 04장 _ 고객의 행동을 예측하는 테크닉 [ 머신러닝 ] 3장에서 분석한 스포츠 센터 회원의 행동 정보를 이용해서 머신러닝으로 예측 해보자 - 클러스터링 기법 이용 1. 데이터 불러오고 확인하기 import pandas as pd use_log = pd.read_csv("c:/data/use_log.csv") use_log.isnull().sum() customer = pd.read_csv("c:/data/customer_join.csv") customer.isnull().sum() end_date 외에는 결측치가 0이다. 2. 클러스터링으로 회원 그룹화하기 customer 데이터를 사용해서 회원 그룹화를 해보자 customer.head() 이 중 고객의 한달 이용..

[Python] 03장 _ 고객의 전체 모습을 파악하는 테크닉

파이썬 데이터 분석 실무 테크닉 100 03장 _ 고객의 전체 모습을 파악하는 테크닉 [ 머신러닝 ] 1. 데이터 불러오고 확인하기 import pandas as pd use_log = pd.read_csv("c:/data/use_log.csv") customer_m = pd.read_csv("c:/data/customer_master.csv") class_m = pd.read_csv("c:/data/class_master.csv") campaign_m = pd.read_csv("c:/data/campaign_master.csv") use_log.head() customer_m.head() class_m.head() campaign_m.head() 2. 고객 데이터 가공하기 customer_m에 clas..

[Python] 02장 _ 대리점 데이터를 가공하는 테크닉

파이썬 데이터 분석 실무 테크닉 100 02장 _ 대리점 데이터를 가공하는 테크닉 [ 데이터 가공 ] 1. 데이터 불러오기 import pandas as pd uriage_data = pd.read_csv("C:/data/uriage.csv") uriage_data.head() kokyaku_data = pd.read_excel("C:/data/kokyaku_daicho.xlsx") kokyaku_data.head() item_name 에는 오류, item_price에는 결측치가 존재하는 것을 확인할 수 있다. 2. 데이터의 오류 살펴보기 uriage_data["item_name"] item_name에 공백이 포함되거나 대문자, 소문자가 섞여있는 오류를 확인할 수 있다. uriage_data["item_..

[Python] 01장 _ 웹에서 주문 수를 분석하는 테크닉

파이썬 데이터 분석 실무 테크닉 100 01장 _ 웹에서 주문 수를 분석하는 테크닉 [ 데이터 가공 ] 1. 데이터 불러오기 import pandas as pd customer_master = pd.read_csv("C:/data/customer_master.csv") customer_master.head() item_master = pd.read_csv("C:/data/item_master.csv") item_master.head() transaction_1 = pd.read_csv("C:/data/transaction_1.csv") transaction_2 = pd.read_csv("C:/data/transaction_2.csv") transaction_detail_1 = pd.read_csv("C:..