R/ML & DL 공부 7

[R] 콘크리트 내구성 예측 - 인공신경망

콘크리트 내구성 예측 인공신경망 콘크리트 압축 내구력에 대한 데이터 1030개의 콘크리트 예제, 구성요소를 나타내는 8개의 속성으로 이루어져 있음 mount of cement 콘크리트의 총량, slag 슬래그, ahs 회분, water 물superplasicizer 고성능감수제, coarse aggregate 굵은 골재fine aggregate 잔골재, aging time 숙성 시간 1. 데이터 준비와 탐구 > concrete = read.csv("C:/R/concrete.csv", header=T) > str(concrete) 'data.frame':1030 obs. of 9 variables: $ cement : num 141 169 250 266 155 ... $ slag : num 212 42.2..

R/ML & DL 공부 2022.06.03

[R] 와인 등급 예측 - 회귀트리, 모델트리

와인 등급 예측 회귀트리, 모델트리 11가지 화학적 특성과 4,898가지 와인 표본에 대한 데이터 acidity 신맛, sugar content 당도, chlorides 염화물 sulfur 황, alcohol 알코올, pH 산성도, density 농도 3명의 와인 감정위원이 블라인드 테스트로 표본을 0(매우 나쁨)부터 10(매우 좋음)까지 등급을 매김 1. 데이터 준비와 탐구 > wine = read.csv("C:/R/whitewines.csv", header=T) > str(wine) 'data.frame':4898 obs. of 12 variables: $ fixed.acidity : num 6.7 5.7 5.9 5.3 6.4 7 7.9 6.6 7 6.5 ... $ volatile.acidity : ..

R/ML & DL 공부 2022.04.22

[R] 의료비 예측 - 선형 회귀

의료비 예측하기 선형 회귀 미국의 환자 의료비를 포함한 가상의 데이터셋 1,338개의 관측치와 7개의 변수로 구성되어 있음 - age : 제 1순위 보험금 수령인의 나이를 나타내는 정수 - sex : 성별 - bmi : 체질량 지수 - children : 보험에서 보장하는 아이들의 수 - smoker : 흡연 여부에 따라 yes, no - region : 미국 내 약관자의 거주지 4개 지역 (northeast, southeast, southwest, northwest) 1. 데이터 준비와 탐구 > insurance = read.csv("C:/R/insurance.csv", stringsAsFactors = T) > str(insurance) 'data.frame':1338 obs. of 7 variabl..

R/ML & DL 공부 2022.04.22

[R] 휴대폰 스팸 분류 - Naive bayes

휴대폰 스팸 분류 Naive bayes로 휴대폰 스팸 여부 구별하기 데이터 셋 5,572개의 SMS 메세지와 메세지의 type이 포함되어 있음 SMS type는 ham (일반 메세지) 또는 spam (스팸 메세지)로 분류됨 1. 데이터 준비와 탐구 > sms_raw = read.csv("C:/R/SMSSpamCollection.csv", stringsAsFactors=FALSE) > str(sms_raw) 'data.frame':5573 obs. of 2 variables: $ ham : chr "ham" "spam" "ham" "ham" ... $ Go.until.jurong.point..crazy...Available.only.in.bugis.n.great.world.la.e.buffet....Cin..

R/ML & DL 공부 2022.04.20

[R] 은행 대출 채무 여부 분류 - 의사결정트리

은행 대출 채무 이행/불이행 예측 C5.0 결정 트리 17개의 변수와 1,000개의 관측치로 이루어진 데이터 default 변수 - yes (채무 불이행), no (채무 이행) 1. 데이터 준비 > credit = read.csv("C:/R/credit.csv", stringsAsFactors = F) > str(credit) 'data.frame':1000 obs. of 17 variables: $ checking_balance : chr "< 0 DM" "1 - 200 DM" "unknown" "< 0 DM" ... $ months_loan_duration: int 6 48 12 42 24 36 24 36 12 30 ... $ credit_history : chr "critical" "good" "c..

R/ML & DL 공부 2022.04.15

[R] Breast Cancer Wisconsin Diagnostic - K-NN

Breast Cancer Wisconsin Diagnostic K-NN알고리즘으로 유방암 여부 진단 Breast Cancer Wisconsin (Diagnostic) Data Set Predict whether the cancer is benign or malignant www.kaggle.com radius (mean of distances from center to points on the perimeter) texture (standard deviation of gray-scale values) smoothness (local variation in radius lengths) compactness (perimeter^2 / area - 1.0) concavity (severity of concav..

R/ML & DL 공부 2022.04.15