Simple Regression
기준 모델
- 직관적이면서 최소한의 성능을 나타내는 기준이 되는 모델
- 분류문제: 타겟의 최빈 클래스
- 회귀문제: 타겟의 평균값
- 시계열회귀문제: 이전 타임스탬프의 값
- MAE(평균절대오차) : errors.abs().mean()
Simple Linear Regression
- 종속변수는 반응(Response)변수, 레이블(Label), 타겟(Target)
- 독립변수는 예측(Predictor)변수, 설명(Explanatory), 특성(feature)
- 회귀선은 잔차 제곱들의 합인 RSS(residual sum of squares)를 최소화 하는 직선
- SLR with Scikt-learn
from sklearn.linear_model import LinearRegression
## 예측모델 인스턴스를 만듭니다
model = LinearRegression()
## X 특성들의 테이블과, y 타겟 벡터를 만듭니다
feature = ['GrLivArea']
target = ['SalePrice']
X_train = df[feature]
y_train = df[target]
## 모델을 학습(fit)합니다
model.fit(X_train, y_train)
## 새로운 데이터 한 샘플을 선택해 학습한 모델을 통해 예측해 봅니다
X_test = [[4000]]
y_pred = model.predict(X_test)
print(f'{X_test[0][0]} sqft GrLivArea를 가지는 주택의 예상 가격은 ${int(y_pred)} 입니다.')
- 회귀 계수 (Coefficients)
## 계수(coefficient)
model.coef_
# array([[107.13035897]])
# 4000 sqft 주택 가격 예측: $447090 (1 sqft당 추가금: $107)
'[CodesSates] AI 부트캠프' 카테고리의 다른 글
Ridge Regression (0) | 2021.04.08 |
---|---|
Multiple Regression (0) | 2021.04.06 |
Clustering (0) | 2021.03.24 |
Dimension Reduction (0) | 2021.03.22 |
Linear Algebra + (0) | 2021.03.21 |