선형회귀(Linear Regression)이란?

선형회귀란, 분포된 데이터를 특정 선으로 회귀시켜 대표하는 하나의 선으로 표현하는 방법을 말합니다. 이때의 선은 분포된 데이터를 잘 표현할 수 있도록 정하는 것이 중요합니다. 


위의 차트에서 빨간 점은 입력된 데이터(Feature)을 나타내며, 파란색 선은 점들의 분포를 대표해서 나타낸 선형회귀된 선 입니다.



선형회귀 표현식

선형회귀는 종속 변수 y와 한 개 이상의 독립 변수 x를 갖습니다. 이를 식으로 표현하면 다음과 같습니다.


  • y': 예측하고자 하는 라벨(Label)을 의미하며, 위의 차트에서 '섭씨 온도'가 y'이 됩니다.
  • b: 초기 값의 편향(Bias)를 의미하며, 위의 차트에서 x=0일 때의 y 값(y 절편)입니다.
  • w1: Feature1의 가중치를 의미하며, 위의 차트에서 파란선의 기울기 입니다.
  • x1: 입력된 특성인 Feture1을 의미하며, 위의 차트에서 x축 입니다.


특성이 여러개인 선형회귀

만약 입력된 특성이 여러 개일 경우, 선형회귀 식은 아래와 같이 표현합니다.



+ Recent posts