[CodesSates] AI 부트캠프

Simple Regression

웅탈 2021. 4. 5. 23:02

Simple Regression

 

 

기준 모델

 

- 직관적이면서 최소한의 성능을 나타내는 기준이 되는 모델

 

  • 분류문제: 타겟의 최빈 클래스
  • 회귀문제: 타겟의 평균값
  • 시계열회귀문제: 이전 타임스탬프의 값

- MAE(평균절대오차) : errors.abs().mean()

 

 

Simple Linear Regression

 

  • 종속변수는 반응(Response)변수, 레이블(Label), 타겟(Target)
  • 독립변수는 예측(Predictor)변수, 설명(Explanatory), 특성(feature)

 

- 회귀선은 잔차 제곱들의 합인 RSS(residual sum of squares)를 최소화 하는 직선

 

- SLR with Scikt-learn 

 

from sklearn.linear_model import LinearRegression

## 예측모델 인스턴스를 만듭니다
model = LinearRegression()

## X 특성들의 테이블과, y 타겟 벡터를 만듭니다

feature = ['GrLivArea']
target = ['SalePrice']
X_train = df[feature]
y_train = df[target]

## 모델을 학습(fit)합니다
model.fit(X_train, y_train)

## 새로운 데이터 한 샘플을 선택해 학습한 모델을 통해 예측해 봅니다
X_test = [[4000]]
y_pred = model.predict(X_test)

print(f'{X_test[0][0]} sqft GrLivArea를 가지는 주택의 예상 가격은 ${int(y_pred)} 입니다.')

 

- 회귀 계수 (Coefficients)

 

## 계수(coefficient)
model.coef_

# array([[107.13035897]])

# 4000 sqft 주택 가격 예측: $447090 (1 sqft당 추가금: $107)

'[CodesSates] AI 부트캠프' 카테고리의 다른 글

Ridge Regression  (0) 2021.04.08
Multiple Regression  (0) 2021.04.06
Clustering  (0) 2021.03.24
Dimension Reduction  (0) 2021.03.22
Linear Algebra +  (0) 2021.03.21