[카테고리:] 미분류

  • TP, FP, FN, TN

    기본 개념: 이진 분류란?

    먼저 이진 분류가 뭔지 알아야 해요. 이건 두 개 중 하나를 고르는 것이에요[1][2]. 예를 들어:

    • 고양이 사진인가? 아닌가?
    • 스팸 메일인가? 아닌가?
    • 병에 걸렸나? 안 걸렸나?

    이렇게 예/아니오로 답할 수 있는 문제들이 바로 이진 분류입니다[3][4].

    혼동 행렬 (Confusion Matrix)

    TP, FP, FN, TN을 이해하려면 혼동 행렬을 알아야 해요. 이건 실제 답컴퓨터가 예측한 답을 비교하는 표예요[5][6].

    TP, FP, FN, TN 쉽게 이해하기

    핵심 원리: 뒤에서부터 읽어보세요!

    1. TP (True Positive) – 진짜 양성

    • Positive로 예측했는데 True(맞음)
    • 실제로 고양이인데 컴퓨터도 고양이라고 맞게 예측한 경우[7][8]
    • “맞게 찾았다!”

    2. FP (False Positive) – 거짓 양성

    • Positive로 예측했는데 False(틀림)
    • 실제로는 강아지인데 컴퓨터가 고양이라고 잘못 예측한 경우[7][8]
    • “없는 걸 있다고 했네” (거짓 경보)

    3. FN (False Negative) – 거짓 음성

    • Negative로 예측했는데 False(틀림)
    • 실제로는 고양이인데 컴퓨터가 강아지라고 잘못 예측한 경우[7][8]
    • “있는 걸 없다고 했네” (놓쳤다)

    4. TN (True Negative) – 진짜 음성

    • Negative로 예측했는데 True(맞음)
    • 실제로 강아지인데 컴퓨터도 강아지라고 맞게 예측한 경우[7][8]
    • “맞게 아니라고 했다!”

    실생활 예시로 완전 정복!

    예시 1: 고양이 vs 강아지 분류

    상황: 컴퓨터가 사진을 보고 고양이인지 판단하는 문제

    • TP: 고양이 사진을 보고 “고양이다!”라고 맞게 예측 ✅
    • FP: 강아지 사진을 보고 “고양이다!”라고 잘못 예측 ❌
    • FN: 고양이 사진을 보고 “강아지다!”라고 잘못 예측 ❌
    • TN: 강아지 사진을 보고 “강아지다!”라고 맞게 예측 ✅

    예시 2: 의료 진단 (더 중요한 예시)

    상황: 병원에서 환자가 감염병에 걸렸는지 검사하는 경우[9][10]

    • TP: 실제 환자를 “환자다”라고 맞게 진단 ✅
    • FP: 건강한 사람을 “환자다”라고 잘못 진단 ❌ (불필요한 치료)
    • FN: 실제 환자를 “건강하다”라고 잘못 진단 ❌ (매우 위험!)
    • TN: 건강한 사람을 “건강하다”라고 맞게 진단 ✅

    쉽게 외우는 방법

    방법 1: 뒤에서부터 읽기

    • TP: Positive라고 예측했는데 True(맞음)
    • FP: Positive라고 예측했는데 False(틀림)
    • FN: Negative라고 예측했는데 False(틀림)
    • TN: Negative라고 예측했는데 True(맞음)

    방법 2: 앞글자로 기억하기

    • T로 시작: True = 맞음 (TP, TN)
    • F로 시작: False = 틀림 (FP, FN)

    방법 3: 화장실 예시 (재밌는 기억법!)

    변기에 앉았는데 방귀만 나온 경우는? FP(False Positive)! 왜냐하면 “변이 나올 것”이라고 예상했는데(Positive) 실제로는 방귀만 나왔으니까(False) 틀렸거든요[11]!

    왜 이게 중요한가?

    각각이 중요한 이유가 달라요:

    FP가 문제인 경우: 스팸 필터가 중요한 메일을 스팸으로 분류하면 큰일나죠[11]!

    FN이 문제인 경우: 병원에서 실제 환자를 건강하다고 하면 생명이 위험해요[10]!

    정리하면…

    • TP: 맞게 찾았다! 😊
    • FP: 없는 걸 있다고 했다 😅 (거짓 경보)
    • FN: 있는 걸 놓쳤다 😰 (위험할 수 있음)
    • TN: 맞게 아니라고 했다! 😊

    핵심: 뒤에서부터 읽어서 Positive/Negative는 예측이고, True/False는 결과가 맞는지 틀리는지를 나타내는 거예요[7][12]!

    이제 이해되시나요? 다음에 mAP를 다시 볼 때 훨씬 쉬워질 거예요!

    출처
    [1] True/False Positive/Negative 정리 – IT 찢는 뱁새 – 티스토리 https://sophia-su.tistory.com/61
    [2] 이진 분류 및 멀티 클래스 분류에서 TP, TN, FP, FN, Recall, Precision … https://cn-c.tistory.com/67
    [3] 분류모델 Confusion Matrix – 파이썬으로 데이터 다루기 기초 – 위키독스 https://wikidocs.net/194087
    [4] [IT]True Positive, True Negative, False Positive, False Negative 의미 https://eyeballs.tistory.com/17
    [5] 12. Precision, Recall, F1 score (Feat. TP, FP, FN, TN) – Time Traveler https://89douner.tistory.com/174
    [6] Confusion Matrix(혼동 행렬)과 평가지표 이해하기 https://woogong80.tistory.com/67
    [7] Confusion matrix, Recall(재현율),Precision(정밀도), Accuracy(정확도) https://weejw.tistory.com/445
    [8] [머신러닝 분류 성능] FP, FN, TP, TN, accuracy, precision, recall, f1 … https://security-eu.tistory.com/2
    [9] Confusion Matrix 이해하기 https://velog.io/@zxxzx1515/Confusion-matrix-%EC%9D%B4%ED%95%B4%ED%95%98%EA%B8%B0
    [10] 5.4 분류 성능평가 – 데이터 사이언스 스쿨 https://datascienceschool.net/03%20machine%20learning/09.04%20%EB%B6%84%EB%A5%98%20%EC%84%B1%EB%8A%A5%ED%8F%89%EA%B0%80.html
    [11] [모델 평가] Confusion matrix (TP, TN, FP, FN) 및 단일/다중 클래스 … https://neosla.tistory.com/18
    [12] Confusion Matrix로 분류모델 성능평가 지표(precision, recall, f1 … https://kyull-it.tistory.com/99
    [13] Statistics / False Positive, False Negative, True Positive, True Negative https://snowple.tistory.com/258
    [14] Confusion Matrix :: 없 – 티스토리 https://noting11.tistory.com/2
    [15] Confusion Matrix의 손쉬운 이해 https://shinminyong.tistory.com/28
    [16] [34] 분류 모델 지표의 의미와 계산법 : True Positive, False Posivite … https://www.youtube.com/watch?v=VbJHlCDOteU
    [17] 분류모델 평가산식 정리(Accuracy, Precision, Recall, F1-score) https://tori-notepad.tistory.com/3
    [18] 분류 모델 성능 평가 지표 – Confusion Matrix란? – 슈퍼짱짱 – 티스토리 https://leedakyeong.tistory.com/entry/%EB%B6%84%EB%A5%98-%EB%AA%A8%EB%8D%B8-%EC%84%B1%EB%8A%A5-%ED%8F%89%EA%B0%80-%EC%A7%80%ED%91%9C-Confusion-Matrix%EB%9E%80-%EC%A0%95%ED%99%95%EB%8F%84Accuracy-%EC%A0%95%EB%B0%80%EB%8F%84Precision-%EC%9E%AC%ED%98%84%EB%8F%84Recall-F1-Score
    [19] 1. 의료 인공지능에서 사용하는 대표적인 지표들 (1) – TP, FP, TN, FN … https://89douner.tistory.com/253
    [20] [인사이드 머신러닝] 분류모델의 성능 평가를 위한 지표들 – velog https://velog.io/@cleansky/%EC%9D%B8%EC%82%AC%EC%9D%B4%EB%93%9C-%EB%A8%B8%EC%8B%A0%EB%9F%AC%EB%8B%9D-%EB%B6%84%EB%A5%98%EA%B8%B0%EC%9D%98-%EC%84%B1%EB%8A%A5-%EC%A7%80%ED%91%9C
    [21] [Machine_learning]이진분류 – Data_record – 티스토리 https://kyhh1229.tistory.com/entry/Machinelearning%EC%9D%B4%EC%A7%84%EB%B6%84%EB%A5%98
    [22] 기계학습 – 3. 머신러닝 기초 – velog https://velog.io/@imgyeongx-x/%EA%B8%B0%EA%B3%84%ED%95%99%EC%8A%B5-3.-%EB%A8%B8%EC%8B%A0%EB%9F%AC%EB%8B%9D-%EA%B8%B0%EC%B4%88
    [23] 11 장 진단검사 (medical diagnostic testing) | 의학통계 http://bigdata.dongguk.ac.kr/lectures/med_stat/_book/%EC%A7%84%EB%8B%A8%EA%B2%80%EC%82%AC-medical-diagnostic-testing.html
    [24] 딥러닝 – 이진 분류 – velog https://velog.io/@zczc729/%EB%94%A5%EB%9F%AC%EB%8B%9D-%EC%9D%B4%EC%A7%84%EB%B6%84%EB%A5%98
    [25] 1. 의료 인공지능에서 사용하는 대표적인 지표들 (2) – Sensitivity … https://89douner.tistory.com/254
    [26] binary & multinomial – Everything – 티스토리 https://hyebiness.tistory.com/9
    [27] 주요 ML / DL 성능 지표 (미완성) – 공부 기록하는 블로그 – 티스토리 https://arsetstudium.tistory.com/55
    [28] 이진 분류 사용 사례 – Salesforce Help https://help.salesforce.com/s/articleView?id=sf.bi_edd_about_use_case_binary.htm&language=ko&type=5
    [29] [Metric] Recall과 Precision – 그냥 블로그 – 티스토리 https://ladun.tistory.com/72
    [30] [머신러닝] 7. 지도학습(분류): 평가 – velog https://velog.io/@posisugar31/%EB%A8%B8%EC%8B%A0%EB%9F%AC%EB%8B%9D-%EC%A7%80%EB%8F%84%ED%95%99%EC%8A%B5%ED%8F%89%EA%B0%80
    [31] Python Pytorch 강좌 : 제 12강 – 이진 분류(Binary Classification) https://076923.github.io/posts/Python-pytorch-12/
    [32] [머신러닝 기초] 다중분류(multi-class) 성능평가 – recall과 precision https://ai-creator.tistory.com/579
    [33] 머신러닝 모델 평가 방법 (예: 정확도, F1 스코어) – LearnCodeEasy https://thebasics.tistory.com/105
    [34] [인공지능 강의 리뷰] 3 – 이진 분류(Binary Classification) 와 로지스틱 … https://strongai.tistory.com/7
    [35] Confusion Matrix(혼돈 행렬), Precision(정밀도), Recall(재현률), F1 … https://feel2certainty.tistory.com/12
    [36] 정밀도(precision)와 재현율(recall) 오차행렬 안 헷갈리는 방법, 분류 … https://jennainsight.tistory.com/entry/%EC%A0%95%EB%B0%80%EB%8F%84precision%EC%99%80-%EC%9E%AC%ED%98%84%EC%9C%A8recall%EC%9D%98-%EC%98%A4%EC%B0%A8%ED%96%89%EB%A0%AC-%EB%B6%84%EB%A5%98%EB%AA%A8%EB%8D%B8-%ED%8F%89%EA%B0%80%EC%A7%80%ED%91%9C
    [37] 이진 분류(Binary Classification)와 로지스틱 회귀(Logistic Regression) https://yhyun225.tistory.com/12
    [38] 인공지능 모델들의 평가 지표에 관한 정리 https://soonhandsomeguy.tistory.com/10