본문 바로가기

반응형

전체 글

(291)
머신러닝에서 혼동행렬(Confusion Matrix) (2) 혼동 행렬 예제 혼동 행렬과 그 값을 더 잘 이해하기 위해 다음 예제를 고려해 보겠습니다. 편두통으로 고통 받는 환자의 수를 예측할 수 있는 모형을 만들고 싶다고 가정해보겠습니다. 이 경우 - TP은 편두통을 앓고 알고리즘에 의해 정확하게 확인된 환자입니다 - TN은 편두통을 앓지 않았고 알고리즘에 의해 올바르게 식별된 환자입니다 - FN은 편두통으로 고통받는 환자들이지만 알고리즘은 그렇지 않다고 말했습니다 - FP은 편두통이 없는 환자이지만 알고리즘에 따르면 편두통이 있다고 합니다 - 정확하게 분류된 100명의 TP 또는 편두통을 앓고 있는 환자들이 있었습니다. - TN이거나 편두통으로 고통받지 않는 환자가 150명이나 있었습니다. - 그러나 알고리즘은 30명의 환자가 편두통을 앓았을 때 편두통이 없다..
머신러닝에서 혼동행렬(Confusion Matrix) (1) 혼동 행렬은 기계 학습 분류 알고리즘을 위한 성능 측정 기술입니다. 데이터 사이언티스트들은 실제 값이 알려진 경우 테스트 데이터 세트에 대한 분류 모델의 성능을 평가하기 위해 이를 사용합니다. 예를 들어, 분류 정확도는 특히 데이터 세트에 두 개 이상의 클래스가 있을 때 오해의 소지가 있습니다. 결과적으로, 혼동 행렬을 계산하면 데이터 사이언티스트들이 분류 모델의 효과를 이해하는 데 도움이 됩니다. 혼동 행렬의 네 가지 결과 혼동 행렬은 실제 값과 예측 값을 비교하여 분류기의 정확도를 시각화합니다. 또한, 예측의 다른 결과에 대한 표 레이아웃을 제시합니다. True Positive - 모델이 예측한 값이 실제 값과 일치합니다 - 실제 값은 양의 값이었고, 기계 학습 모델은 양의 값을 예측했습니다 True..
인공지능 알고리즘의 편향성과 공정성 (4) 기계 학습을 더 공정하게 만드는 방법 - 다양하고 고품질의 교육 데이터를 모델에 사용할 수 있도록 보장합니다. - 공용 데이터 세트의 취약성을 식별합니다. 이 취약성은 잘못된 정렬 및 레이블이 지정된 데이터 세트와 일관성 없는 벤치마킹과 같은 품질이 낮은 데이터 세트로 인해 발생할 수 있습니다. - 모델 교육 과정에서 덜 민감한 정보를 사용하여 개인 정보 문제를 방지합니다. - IBM의 AI 공정성 360, Google의 What-If Tool, Model Cards, Toolkit, Microsoft의 fairlearn.py 및 Deon과 같은 기계 학습의 편향을 방지하고 제거하는 데 도움이 되는 도구를 활용합니다. - IBM의 AI 공정성 360은 사용자가 공정성 메트릭을 통해 기술 솔루션에 집중하고..

반응형