기본 개념: 이진 분류란?
먼저 이진 분류가 뭔지 알아야 해요. 이건 두 개 중 하나를 고르는 것이에요[1][2]. 예를 들어:
- 고양이 사진인가? 아닌가?
- 스팸 메일인가? 아닌가?
- 병에 걸렸나? 안 걸렸나?
이렇게 예/아니오로 답할 수 있는 문제들이 바로 이진 분류입니다[3][4].
혼동 행렬 (Confusion Matrix)
TP, FP, FN, TN을 이해하려면 혼동 행렬을 알아야 해요. 이건 실제 답과 컴퓨터가 예측한 답을 비교하는 표예요[5][6].
TP, FP, FN, TN 쉽게 이해하기
핵심 원리: 뒤에서부터 읽어보세요!
1. TP (True Positive) – 진짜 양성
- Positive로 예측했는데 True(맞음)
- 실제로 고양이인데 컴퓨터도 고양이라고 맞게 예측한 경우[7][8]
- “맞게 찾았다!”
2. FP (False Positive) – 거짓 양성
- Positive로 예측했는데 False(틀림)
- 실제로는 강아지인데 컴퓨터가 고양이라고 잘못 예측한 경우[7][8]
- “없는 걸 있다고 했네” (거짓 경보)
3. FN (False Negative) – 거짓 음성
- Negative로 예측했는데 False(틀림)
- 실제로는 고양이인데 컴퓨터가 강아지라고 잘못 예측한 경우[7][8]
- “있는 걸 없다고 했네” (놓쳤다)
4. TN (True Negative) – 진짜 음성
- Negative로 예측했는데 True(맞음)
- 실제로 강아지인데 컴퓨터도 강아지라고 맞게 예측한 경우[7][8]
- “맞게 아니라고 했다!”
실생활 예시로 완전 정복!
예시 1: 고양이 vs 강아지 분류
상황: 컴퓨터가 사진을 보고 고양이인지 판단하는 문제
- TP: 고양이 사진을 보고 “고양이다!”라고 맞게 예측 ✅
- FP: 강아지 사진을 보고 “고양이다!”라고 잘못 예측 ❌
- FN: 고양이 사진을 보고 “강아지다!”라고 잘못 예측 ❌
- TN: 강아지 사진을 보고 “강아지다!”라고 맞게 예측 ✅
예시 2: 의료 진단 (더 중요한 예시)
상황: 병원에서 환자가 감염병에 걸렸는지 검사하는 경우[9][10]
- TP: 실제 환자를 “환자다”라고 맞게 진단 ✅
- FP: 건강한 사람을 “환자다”라고 잘못 진단 ❌ (불필요한 치료)
- FN: 실제 환자를 “건강하다”라고 잘못 진단 ❌ (매우 위험!)
- TN: 건강한 사람을 “건강하다”라고 맞게 진단 ✅
쉽게 외우는 방법
방법 1: 뒤에서부터 읽기
- TP: Positive라고 예측했는데 True(맞음)
- FP: Positive라고 예측했는데 False(틀림)
- FN: Negative라고 예측했는데 False(틀림)
- TN: Negative라고 예측했는데 True(맞음)
방법 2: 앞글자로 기억하기
- T로 시작: True = 맞음 (TP, TN)
- F로 시작: False = 틀림 (FP, FN)
방법 3: 화장실 예시 (재밌는 기억법!)
변기에 앉았는데 방귀만 나온 경우는? FP(False Positive)! 왜냐하면 “변이 나올 것”이라고 예상했는데(Positive) 실제로는 방귀만 나왔으니까(False) 틀렸거든요[11]!
왜 이게 중요한가?
각각이 중요한 이유가 달라요:
FP가 문제인 경우: 스팸 필터가 중요한 메일을 스팸으로 분류하면 큰일나죠[11]!
FN이 문제인 경우: 병원에서 실제 환자를 건강하다고 하면 생명이 위험해요[10]!
정리하면…
- TP: 맞게 찾았다! 😊
- FP: 없는 걸 있다고 했다 😅 (거짓 경보)
- FN: 있는 걸 놓쳤다 😰 (위험할 수 있음)
- TN: 맞게 아니라고 했다! 😊
핵심: 뒤에서부터 읽어서 Positive/Negative는 예측이고, True/False는 결과가 맞는지 틀리는지를 나타내는 거예요[7][12]!
이제 이해되시나요? 다음에 mAP를 다시 볼 때 훨씬 쉬워질 거예요!
출처
[1] True/False Positive/Negative 정리 – IT 찢는 뱁새 – 티스토리 https://sophia-su.tistory.com/61
[2] 이진 분류 및 멀티 클래스 분류에서 TP, TN, FP, FN, Recall, Precision … https://cn-c.tistory.com/67
[3] 분류모델 Confusion Matrix – 파이썬으로 데이터 다루기 기초 – 위키독스 https://wikidocs.net/194087
[4] [IT]True Positive, True Negative, False Positive, False Negative 의미 https://eyeballs.tistory.com/17
[5] 12. Precision, Recall, F1 score (Feat. TP, FP, FN, TN) – Time Traveler https://89douner.tistory.com/174
[6] Confusion Matrix(혼동 행렬)과 평가지표 이해하기 https://woogong80.tistory.com/67
[7] Confusion matrix, Recall(재현율),Precision(정밀도), Accuracy(정확도) https://weejw.tistory.com/445
[8] [머신러닝 분류 성능] FP, FN, TP, TN, accuracy, precision, recall, f1 … https://security-eu.tistory.com/2
[9] Confusion Matrix 이해하기 https://velog.io/@zxxzx1515/Confusion-matrix-%EC%9D%B4%ED%95%B4%ED%95%98%EA%B8%B0
[10] 5.4 분류 성능평가 – 데이터 사이언스 스쿨 https://datascienceschool.net/03%20machine%20learning/09.04%20%EB%B6%84%EB%A5%98%20%EC%84%B1%EB%8A%A5%ED%8F%89%EA%B0%80.html
[11] [모델 평가] Confusion matrix (TP, TN, FP, FN) 및 단일/다중 클래스 … https://neosla.tistory.com/18
[12] Confusion Matrix로 분류모델 성능평가 지표(precision, recall, f1 … https://kyull-it.tistory.com/99
[13] Statistics / False Positive, False Negative, True Positive, True Negative https://snowple.tistory.com/258
[14] Confusion Matrix :: 없 – 티스토리 https://noting11.tistory.com/2
[15] Confusion Matrix의 손쉬운 이해 https://shinminyong.tistory.com/28
[16] [34] 분류 모델 지표의 의미와 계산법 : True Positive, False Posivite … https://www.youtube.com/watch?v=VbJHlCDOteU
[17] 분류모델 평가산식 정리(Accuracy, Precision, Recall, F1-score) https://tori-notepad.tistory.com/3
[18] 분류 모델 성능 평가 지표 – Confusion Matrix란? – 슈퍼짱짱 – 티스토리 https://leedakyeong.tistory.com/entry/%EB%B6%84%EB%A5%98-%EB%AA%A8%EB%8D%B8-%EC%84%B1%EB%8A%A5-%ED%8F%89%EA%B0%80-%EC%A7%80%ED%91%9C-Confusion-Matrix%EB%9E%80-%EC%A0%95%ED%99%95%EB%8F%84Accuracy-%EC%A0%95%EB%B0%80%EB%8F%84Precision-%EC%9E%AC%ED%98%84%EB%8F%84Recall-F1-Score
[19] 1. 의료 인공지능에서 사용하는 대표적인 지표들 (1) – TP, FP, TN, FN … https://89douner.tistory.com/253
[20] [인사이드 머신러닝] 분류모델의 성능 평가를 위한 지표들 – velog https://velog.io/@cleansky/%EC%9D%B8%EC%82%AC%EC%9D%B4%EB%93%9C-%EB%A8%B8%EC%8B%A0%EB%9F%AC%EB%8B%9D-%EB%B6%84%EB%A5%98%EA%B8%B0%EC%9D%98-%EC%84%B1%EB%8A%A5-%EC%A7%80%ED%91%9C
[21] [Machine_learning]이진분류 – Data_record – 티스토리 https://kyhh1229.tistory.com/entry/Machinelearning%EC%9D%B4%EC%A7%84%EB%B6%84%EB%A5%98
[22] 기계학습 – 3. 머신러닝 기초 – velog https://velog.io/@imgyeongx-x/%EA%B8%B0%EA%B3%84%ED%95%99%EC%8A%B5-3.-%EB%A8%B8%EC%8B%A0%EB%9F%AC%EB%8B%9D-%EA%B8%B0%EC%B4%88
[23] 11 장 진단검사 (medical diagnostic testing) | 의학통계 http://bigdata.dongguk.ac.kr/lectures/med_stat/_book/%EC%A7%84%EB%8B%A8%EA%B2%80%EC%82%AC-medical-diagnostic-testing.html
[24] 딥러닝 – 이진 분류 – velog https://velog.io/@zczc729/%EB%94%A5%EB%9F%AC%EB%8B%9D-%EC%9D%B4%EC%A7%84%EB%B6%84%EB%A5%98
[25] 1. 의료 인공지능에서 사용하는 대표적인 지표들 (2) – Sensitivity … https://89douner.tistory.com/254
[26] binary & multinomial – Everything – 티스토리 https://hyebiness.tistory.com/9
[27] 주요 ML / DL 성능 지표 (미완성) – 공부 기록하는 블로그 – 티스토리 https://arsetstudium.tistory.com/55
[28] 이진 분류 사용 사례 – Salesforce Help https://help.salesforce.com/s/articleView?id=sf.bi_edd_about_use_case_binary.htm&language=ko&type=5
[29] [Metric] Recall과 Precision – 그냥 블로그 – 티스토리 https://ladun.tistory.com/72
[30] [머신러닝] 7. 지도학습(분류): 평가 – velog https://velog.io/@posisugar31/%EB%A8%B8%EC%8B%A0%EB%9F%AC%EB%8B%9D-%EC%A7%80%EB%8F%84%ED%95%99%EC%8A%B5%ED%8F%89%EA%B0%80
[31] Python Pytorch 강좌 : 제 12강 – 이진 분류(Binary Classification) https://076923.github.io/posts/Python-pytorch-12/
[32] [머신러닝 기초] 다중분류(multi-class) 성능평가 – recall과 precision https://ai-creator.tistory.com/579
[33] 머신러닝 모델 평가 방법 (예: 정확도, F1 스코어) – LearnCodeEasy https://thebasics.tistory.com/105
[34] [인공지능 강의 리뷰] 3 – 이진 분류(Binary Classification) 와 로지스틱 … https://strongai.tistory.com/7
[35] Confusion Matrix(혼돈 행렬), Precision(정밀도), Recall(재현률), F1 … https://feel2certainty.tistory.com/12
[36] 정밀도(precision)와 재현율(recall) 오차행렬 안 헷갈리는 방법, 분류 … https://jennainsight.tistory.com/entry/%EC%A0%95%EB%B0%80%EB%8F%84precision%EC%99%80-%EC%9E%AC%ED%98%84%EC%9C%A8recall%EC%9D%98-%EC%98%A4%EC%B0%A8%ED%96%89%EB%A0%AC-%EB%B6%84%EB%A5%98%EB%AA%A8%EB%8D%B8-%ED%8F%89%EA%B0%80%EC%A7%80%ED%91%9C
[37] 이진 분류(Binary Classification)와 로지스틱 회귀(Logistic Regression) https://yhyun225.tistory.com/12
[38] 인공지능 모델들의 평가 지표에 관한 정리 https://soonhandsomeguy.tistory.com/10