전체 글 61

[DL] 09-2 순환 신경망으로 IMDB 리뷰 분류하기 (+ 09-1)

혼자 공부하는 머신러닝+딥러닝 책을 바탕으로 공부한 내용입니다. CH9 텍스트를 위한 인공 신경망 ①② 케라스 API로 순환 신경망 구현하기 텐서플로를 사용해 순환 신경망을 만들어 영화 리뷰 데이터셋에 적용해 리뷰를 긍정과 부정으로 분류해보자 ▶ 09-1장 순환 신경망의 개념을 설명한 단원이라 키워드만 정리하고 넘어가겠습니다 순차 데이터 텍스트나 시계열 데이터와 같이 순서에 의미가 있는 데이터 대표적으로 글, 대화, 일자별 날씨, 일자별 판매 실적 등을 예로 들 수 있음 순환 신경망 순차 데이터에 잘 맞는 인공 신경망의 한 종류 순차 데이터를 처리하기 위해 고안된 순환층을 1개 이상 사용한 신경망 순환 신경망에서는 종종 순환층을 셀이라 부름 - 하나의 셀은 여러 개의 뉴런으로 구성 순환 신경망에서는 셀의..

[Tableau] Data Analyst, Data Scientist Dashboard

https://www.kaggle.com/datasets/nikhilbhathi/data-scientist-salary-us-glassdoor Data scientist salary Data science jobs dataset cleaned for data analysis and modelling www.kaggle.com 이 데이터를 이용하여 데이터 분석 후 대시보드를 만들었습니다. https://public.tableau.com/app/profile/.84822189/viz/DataAnalystDataScientistDashboard/2_1 Data Analyst, Data Scientist Dashboard Data Analyst, Data Scientist Dashboard Dataset : h..

TABLEAU/Dashboard 2022.04.06

[DL] 08-3 합성곱 신경망의 시각화

혼자 공부하는 머신러닝+딥러닝 책을 바탕으로 공부한 내용입니다. CH8 이미지를 위한 인공 신경망 ③ 시각화로 이해하는 합성곱 신경망 합성곱 층의 가중치와 특성 맵을 시각화하여 신경망이 이미지에서 어떤 것을 학습하는지 이해해보자 이 전 절의 코드에 이어서 실행했습니다. ▶ 가중치 시각화 08-2에서 만들었던 모델이 어떤 가중치를 학습했는지 확인하기 위해 체크포인트 파일을 읽고 확인해보자 from tensorflow import keras model = keras.models.load_model('best-cnn-model.h5') # 케라스에 추가한 층 확인 model.layers 케라스 모델에 추가한 층은 layers 속성에 저장되어 있다. Conv2D, MaxPooling2D 층이 번갈아 2번, Fl..

[DL] 08-2 합성곱 신경망을 사용한 이미지 분류 (+ 08-1)

혼자 공부하는 머신러닝+딥러닝 책을 바탕으로 공부한 내용입니다. CH8 이미지를 위한 인공 신경망 ①② 케라스 API로 합성곱 신경망 구현하기 케라스 API를 사용해 합성곱 신경망 모델을 만들어 패션 MNIST 이미지를 분류해보자 ▶ 08-1장 합성곱 신경망의 개념을 설명한 단원이라 키워드만 정리하고 넘어가겠습니다 합성곱 밀집층과 비슷하게 입력과 가중치를 곱하고 절편을 더하는 선형 계산 밀집층과 달리 각 합성곱은 입력 전체가 아닌 일부만 사용하여 선형 계산을 수행함 합성곱 층의 필터는 밀집층의 뉴런에 해당 (필터의 가중치와 절편을 종종 커널이라고 부름) 자주 사용되는 커널의 크기는 (3, 3) 또는 (5, 5), 커널의 깊이는 입력의 깊이와 같음 특성 맵 합성곱 층이나 풀링 층의 출력 배열을 의미 필터 ..

[DL] 07-3 신경망 모델 훈련

혼자 공부하는 머신러닝+딥러닝 책을 바탕으로 공부한 내용입니다. CH7 딥러닝 시작 ③ 최상의 신경망 모델 얻기 케라스 API를 사용해 모델을 훈련하는데 필요한 다양한 도구들을 알아보자 ▶ 손실 곡선 먼저, 패션 MNIST 데이터셋을 불러와 훈련 세트와 검증 세트로 나누자 from tensorflow import keras from sklearn.model_selection import train_test_split (train_input, train_target), (test_input, test_target) = keras.datasets.fashion_mnist.load_data() train_scaled = train_input / 255.0 train_scaled, val_scaled, trai..

[DL] 07-2 심층 신경망

혼자 공부하는 머신러닝+딥러닝 책을 바탕으로 공부한 내용입니다. CH7 딥러닝 시작 ② 케라스 API를 활용한 심층 신경망 인공 신경망에 층을 여러 개 추가하여 패션 MNIST 데이터셋을 분류하면서 케라스로 심층 신경망을 만드는 법을 자세히 배워보자 ▶ 2개의 층 먼저, 데이터셋을 먼저 불러오자 from tensorflow import keras (train_input, train_target), (test_input, test_target) = keras.datasets.fashion_mnist.load_data() 7-1장에서 했던 것을 똑같이 해보자 from sklearn.model_selection import train_test_split train_scaled = train_input / 25..

[DL] 07-1 인공 신경망

혼자 공부하는 머신러닝+딥러닝 책을 바탕으로 공부한 내용입니다. CH7 딥러닝 시작 ① 인공 신경망 모델로 성능 향상 딥러닝과 인공 신경망 알고리즘을 이해하고 텐서플로를 사용해 간단한 인공 신경망 모델 만들어보기 ▶ 패션 MNIST 텐서플로의 케라스 패키지를 import하고 패션 MNIST 데이터를 다운로드하자 from tensorflow import keras (train_input, train_target), (test_input, test_target) = \ keras.datasets.fashion_mnist.load_data() keras.datasets.fashion_mnist 모듈 아래 load_data()는 훈련 데이터와 테스트 데이터를 나누어 반환해준다. 이 데이터의 크기를 확인해보자 p..

[Python] 05장_회원 탈퇴를 예측하는 테크닉

파이썬 데이터 분석 실무 테크닉 100 05장 _ 회원 탈퇴를 예측하는 테크닉 [ 머신러닝 ] 이미 탈퇴한 회원과 계속해서 이용하는 회원의 데이터에 대해 '의사결정 트리'라는 지도학습 분류 알고리즘을 이용해 탈퇴를 예측해보자 1. 데이터 불러오기 & 이용 데이터 수정하기 import pandas as pd customer = pd.read_csv("C:/data/customer_join.csv") uselog_months = pd.read_csv("C:/data/use_log_months.csv") customer.head() uselog_months.head() 우리는 미래를 예측하기 위해 그 달과 1개월 전의 이용 이력만 데이터로 사용할 것이다. 4장처럼 과거 6개월의 데이터로 이용횟수를 예측하는 경..

[Python] 04장_고객의 행동을 예측하는 테크닉

파이썬 데이터 분석 실무 테크닉 100 04장 _ 고객의 행동을 예측하는 테크닉 [ 머신러닝 ] 3장에서 분석한 스포츠 센터 회원의 행동 정보를 이용해서 머신러닝으로 예측 해보자 - 클러스터링 기법 이용 1. 데이터 불러오고 확인하기 import pandas as pd use_log = pd.read_csv("c:/data/use_log.csv") use_log.isnull().sum() customer = pd.read_csv("c:/data/customer_join.csv") customer.isnull().sum() end_date 외에는 결측치가 0이다. 2. 클러스터링으로 회원 그룹화하기 customer 데이터를 사용해서 회원 그룹화를 해보자 customer.head() 이 중 고객의 한달 이용..

[Python] Numpy 반올림, 올림, 버림, 내림 하는 법

[Python] Numpy 반올림, 올림, 버림, 내림 하는 법 반올림 np.round(수, 자리수) 올림 np.ceil(수) 버림 np.trunc(수) 내림 np.floor(수) ▶ 반올림 np.round(수, 자리수) import numpy as np np.round(10.259,1) #10.3 np.round(10.259,2) #10.26 np.round(10.252,2) #10.25 지정한 소숫점 자릿수까지 반올림해서 나타낸다 ▶ 올림 np.ceil(수) np.ceil(10) #10.0 np.ceil(10.4) #11.0 np.ceil(10.9) #11.0 np.ceil(-3.4) #-3.0 np.ceil(-3.9) #-3.0 입력값보다 같거나 큰 정수 중 가장 가까운 값을 반환한다 ▶ 버림 np..

Python/Study 2022.03.12