다항회귀(Polynomial Regression)
독립 변수가 단순한 단 형식이 아닌 2,3,차 등으로 표현되는 것
데이터가 단순한 직선이 아닌 복잡한 형태인 경우, 산점도 산의 관측값을 통과하나는 추세선을 그렸을 때
개의 굴절이 과찰되면 이를 n차 향식으로 모델링
- 독립변수와 종속변수의 관계를 다차 다항식으로 표현
- 다중 선형회귀의 특별한 형태,
- 특성을 변환(차수의 변환)한 후 다중 선형회귀와 같은 방식으로 비선형 관계를 모델링함
- 차수가 증가하면 곡선 모델(비선형모델)이 될 때 다항회귀라고 함
장점 : 두 입력변수 사이의 관계성을 설명해서 데이터를 잘 설명한다.
사이킷런의 변환기(transformer)
변환기 : 특성을 만들거나 전처리하기위한 다양한 클래스를 제공
다향회귀를 위한 변환기:
from sklearn.preprocessing import PoltnomialFeatures
사이킷런의 변환기 메소드
fit() : 새롭게 만들 특성의 조합(기준)을 찾음
transform() : 실제로 데이터 변환
fit_transform()
다항회귀의 필요성
- 독립변수 X1 하나로 단순 회귀를 그려도 직선으로 해당 데이터를 설명하기는 어려워 보인다. = Y = W1X + W0
- 빨간 선처럼 2차 함수가 필요한데 기존의 X의 데이터를 추가하여 다항 회귀로 바꾸어 해결 가능하다.
- polynpmial Regression을 써야하는 순간을 알아차리는 것이 중요하다.(모델을 선택할 줄 알아야함)
'머신러닝 및 딥러닝 > 머신러닝' 카테고리의 다른 글
머신러닝 모델 최적화 - 편향,분산 트레이드오프 / 교차 검증 (0) | 2023.02.09 |
---|---|
머신러닝 모델 최적화 - 과적합 (0) | 2023.02.08 |
경사하강법 이론2(+ Feature Scaling) (0) | 2023.02.08 |
경사하강법 이론 (0) | 2023.02.08 |
다중선형회귀 이론 (0) | 2023.02.07 |