Multiple Regression
R square
- 선형회귀 모델의 예측값과 관측값의 유사 정도, 1에 가까울 수록 설명력이 높다
from sklearn.metrics import r2_score
plotly
- 3D 시각화
px.scatter_3d(
train,
x='GrLivArea',
y='OverallQual',
z='SalePrice',
title='House Prices'
)
회귀모델 평가지표
from sklearn.metrics import mean_squared_error, mean_absolute_error, r2_score
과적합 , 과소적합
- 과적합 : 모델이 train 데이터에 과하게 학습해 일반화가 안되서, test 데이터에서 오차가 커지는 현상 / 분산이 높은 경우 과적합
- 과소적합 : 훈련데이터에 과적합도 못하고 일반화도 안되서, train/test 데이터에서 모두 오차가 크게 나오는 경우 / 편향이 높은 경우 과소적합
pd.to_datetime()
- 일자와 시간 처리법
dt.date # YYYY-MM-DD(문자)
dt.year # 연(4자리숫자)
dt.month # 월(숫자)
dt.month_name() # 월(문자)
dt.day # 일(숫자)
dt.time # HH:MM:SS(문자)
dt.hour # 시(숫자)
dt.minute # 분(숫자)
dt.second # 초(숫자)
- pd.Timestamp() (rfriend.tistory.com/497)
pd.Timestamp(year, month, day, hour, minute, second)
ex)
pd.Timestamp(2019, 12, 22, 13, 30, 59)
'[CodesSates] AI 부트캠프' 카테고리의 다른 글
Logistic Regression (0) | 2021.04.12 |
---|---|
Ridge Regression (0) | 2021.04.08 |
Simple Regression (0) | 2021.04.05 |
Clustering (0) | 2021.03.24 |
Dimension Reduction (0) | 2021.03.22 |