[CodesSates] AI 부트캠프

Multiple Regression

웅탈 2021. 4. 6. 22:42

Multiple Regression

 

R square

 

- 선형회귀 모델의 예측값과 관측값의 유사 정도, 1에 가까울 수록 설명력이 높다

from sklearn.metrics import r2_score

 

plotly

 

- 3D 시각화

 

px.scatter_3d(
   train,
   x='GrLivArea', 
   y='OverallQual', 
   z='SalePrice',  
   title='House Prices'
 )

 

회귀모델 평가지표

 

 

from sklearn.metrics import  mean_squared_error, mean_absolute_error, r2_score

 

과적합 , 과소적합

 

- 과적합 : 모델이 train 데이터에 과하게 학습해 일반화가 안되서, test 데이터에서 오차가 커지는 현상 / 분산이 높은 경우 과적합

 

- 과소적합 : 훈련데이터에 과적합도 못하고 일반화도 안되서, train/test 데이터에서 모두 오차가 크게 나오는 경우 / 편향이 높은 경우 과소적합

 

pd.to_datetime()

 

- 일자와 시간 처리법

 

dt.date         # YYYY-MM-DD(문자)
dt.year         # 연(4자리숫자)
dt.month        # 월(숫자)
dt.month_name() # 월(문자)

dt.day          # 일(숫자)
dt.time         # HH:MM:SS(문자)
dt.hour         # 시(숫자)
dt.minute       # 분(숫자)
dt.second       # 초(숫자)

 

- pd.Timestamp() (rfriend.tistory.com/497)

pd.Timestamp(year, month, day, hour, minute, second)

ex)
pd.Timestamp(2019, 12, 22, 13, 30, 59)

 

'[CodesSates] AI 부트캠프' 카테고리의 다른 글

Logistic Regression  (0) 2021.04.12
Ridge Regression  (0) 2021.04.08
Simple Regression  (0) 2021.04.05
Clustering  (0) 2021.03.24
Dimension Reduction  (0) 2021.03.22