파이썬 6

[Python] 04장_고객의 행동을 예측하는 테크닉

파이썬 데이터 분석 실무 테크닉 100 04장 _ 고객의 행동을 예측하는 테크닉 [ 머신러닝 ] 3장에서 분석한 스포츠 센터 회원의 행동 정보를 이용해서 머신러닝으로 예측 해보자 - 클러스터링 기법 이용 1. 데이터 불러오고 확인하기 import pandas as pd use_log = pd.read_csv("c:/data/use_log.csv") use_log.isnull().sum() customer = pd.read_csv("c:/data/customer_join.csv") customer.isnull().sum() end_date 외에는 결측치가 0이다. 2. 클러스터링으로 회원 그룹화하기 customer 데이터를 사용해서 회원 그룹화를 해보자 customer.head() 이 중 고객의 한달 이용..

[Python] pd.where과 np.where의 차이

[Python] pd.where과 np.where의 차이 1. pd.where 판다스의 Series객체.where() 함수 Series객체.where(Series객체에 대한 조건문, 거짓 일 때의 대체 값) 형태로 사용 조건문의 참값에 Series객체 값을 넣어줌 2. np.where np.where(배열에 대한 조건문, 참일 때 값, 거짓일 때 값) 형태로 사용 array(배열)로 반환함 ▶ 하나의 데이터 프레임 만들기 import pandas as pd import numpy as np df = pd.DataFrame({'a':[1, 2, 3, 4, 5], 'b':[6, 7, 8, 9, 10]}) df ▶ pd.where 예시 a열 중 4보다 작은 값에는 그대로 a열의 값, 그 외의 값에는 100 넣..

Python/Study 2022.02.18

[Python] 03장 _ 고객의 전체 모습을 파악하는 테크닉

파이썬 데이터 분석 실무 테크닉 100 03장 _ 고객의 전체 모습을 파악하는 테크닉 [ 머신러닝 ] 1. 데이터 불러오고 확인하기 import pandas as pd use_log = pd.read_csv("c:/data/use_log.csv") customer_m = pd.read_csv("c:/data/customer_master.csv") class_m = pd.read_csv("c:/data/class_master.csv") campaign_m = pd.read_csv("c:/data/campaign_master.csv") use_log.head() customer_m.head() class_m.head() campaign_m.head() 2. 고객 데이터 가공하기 customer_m에 clas..

[Python] 02장 _ 대리점 데이터를 가공하는 테크닉

파이썬 데이터 분석 실무 테크닉 100 02장 _ 대리점 데이터를 가공하는 테크닉 [ 데이터 가공 ] 1. 데이터 불러오기 import pandas as pd uriage_data = pd.read_csv("C:/data/uriage.csv") uriage_data.head() kokyaku_data = pd.read_excel("C:/data/kokyaku_daicho.xlsx") kokyaku_data.head() item_name 에는 오류, item_price에는 결측치가 존재하는 것을 확인할 수 있다. 2. 데이터의 오류 살펴보기 uriage_data["item_name"] item_name에 공백이 포함되거나 대문자, 소문자가 섞여있는 오류를 확인할 수 있다. uriage_data["item_..

[Python] 01장 _ 웹에서 주문 수를 분석하는 테크닉

파이썬 데이터 분석 실무 테크닉 100 01장 _ 웹에서 주문 수를 분석하는 테크닉 [ 데이터 가공 ] 1. 데이터 불러오기 import pandas as pd customer_master = pd.read_csv("C:/data/customer_master.csv") customer_master.head() item_master = pd.read_csv("C:/data/item_master.csv") item_master.head() transaction_1 = pd.read_csv("C:/data/transaction_1.csv") transaction_2 = pd.read_csv("C:/data/transaction_2.csv") transaction_detail_1 = pd.read_csv("C:..

[DACON_101] Lv.1 의사결정회귀나무로 따릉이 데이터 예측하기

https://dacon.io/competitions/open/235698/overview/description ▶ [ Lv.1 의사결정회귀나무로 따릉이 데이터 예측하기 ] 를 공부했습니다. ▶ EDA _ 탐색적 자료 분석 1. 라이브러리, 파일 불러오기 데이터분석을 하기 위해 pandas 라이브러리와 파일을 불러오기 import pandas as pd train = pd.read_csv('C:/data/train.csv') test = pd.read_csv('C:/data/test.csv') 2. 행, 열 개수 관찰하기 shape를 이용해 train, test의 행/열 개수 파악 train.shape # 행 1459개, 열 11개 test.shape # 행 715개, 열 10개 3. 데이터 확인하기 h..