728x90
반응형
혼동 행렬 (Confusion matrix)
TP : True Positive, 실제 True인데 예측 True로 판단
TN : True Negative, 실제 False인데 예측이 False로 판단
FP : False Positive, 실제 False인데 예측이 True로 판단
FN : False Negative, 실제 True인데 예측이 False로 판단
TP 는 '정답이다!!!'
TN 는 '오답이잖아? 그럴 줄 알았어!!!'
FP 는 '정답이네!!!.... 아니네...'
FN 는 '오답이네!..... 정답이었구나...'
즉 TP,TN 이 높을 수록 정확도가 높은 거고 FP,FN 은 낮을 수록 좋은 거다.
Logisitic Regression, 로지스틱 회귀
회귀를 사용하여 데이터가 어떤 범주에 속할 확률을 0에서 1 사이의 값으로 예측, 확률에 따라 가능성이 높은 범주에 속하는 것으로 분류해주는 지도 학습
k-NN (Nearest Neighbor)
사용할 수 있는 모든 경우를 저장 , Distance measure 등의 유사성에 기반하여 새로운 정보를 분류하는 단순한 알고리즘
즉 객체는 K개의 최근접 이웃 사이에서 가장 공통적인 항목에 할당되는 객체로 과반수 투표에 의해 분류
과정
1. 가장 가까운 이웃을 찾기 위해 이웃 간의 거리 계산
2. 거리가 가까운 이웃 K개 만큼 찾음
3. 다수결로 신규 데이터의 Label을 예측
아래의 코드를 통해 확인할 수 있습니다.
728x90
반응형
'공부 > 인공지능' 카테고리의 다른 글
[인공지능]10.Bayesian Networks 2 (1) | 2020.12.07 |
---|---|
[인공지능] 9.Bayesian Networks (0) | 2020.10.16 |
[인공지능] 8.Uncertainty (0) | 2020.10.15 |
[인공지능] 7.Knowlege Representation (0) | 2020.10.15 |
[인공지능] 6. Karush-Kuhn-Tucker(KKT) Approach (0) | 2020.10.14 |