본문 바로가기
공부/인공지능

[머신러닝 과제] 로지스틱 회귀와 k-NN 구현

by 맑은청이 2021. 5. 11.
728x90
반응형

혼동 행렬 (Confusion matrix)

TP : True Positive, 실제 True인데 예측 True로 판단 

TN : True Negative, 실제 False인데 예측이 False로 판단 

FP : False Positive, 실제 False인데 예측이 True로 판단 

FN : False Negative, 실제 True인데 예측이 False로 판단

 

TP 는 '정답이다!!!'

TN 는 '오답이잖아? 그럴 줄 알았어!!!'

FP 는 '정답이네!!!.... 아니네...'

FN 는 '오답이네!..... 정답이었구나...'

 

즉 TP,TN 이 높을 수록 정확도가 높은 거고 FP,FN 은 낮을 수록 좋은 거다. 

 

 

Logisitic Regression, 로지스틱 회귀

회귀를 사용하여 데이터가 어떤 범주에 속할 확률을 0에서 1 사이의 값으로 예측, 확률에 따라 가능성이 높은 범주에 속하는 것으로 분류해주는 지도 학습 

 

k-NN (Nearest Neighbor)

사용할 수 있는 모든 경우를 저장 , Distance measure 등의 유사성에 기반하여 새로운 정보를 분류하는 단순한 알고리즘 

즉 객체는 K개의 최근접 이웃 사이에서 가장 공통적인 항목에 할당되는 객체로 과반수 투표에 의해 분류 

과정 

1. 가장 가까운 이웃을 찾기 위해 이웃 간의 거리 계산 

2. 거리가 가까운 이웃 K개 만큼 찾음

3. 다수결로 신규 데이터의 Label을 예측

 

 

아래의 코드를 통해 확인할 수 있습니다. 

HW2_201824488_박현청.py
0.00MB

728x90
반응형