본문 바로가기

반응형

인공지능(AI)

(139)
머신러닝에서 혼동행렬(Confusion Matrix) (4) 기계학습에서의 정밀도와 재현율의 차이 정밀도 데이터 과학자가 양성 샘플을 분류하는 모델의 능력을 측정하는 데 도움이 됩니다 과학자들은 모형의 정밀도를 계산하기 위해 양의 표본과 음의 표본을 고려합니다 과학자들은 모델이 잘못 식별한 샘플을 포함한 모든 양성 샘플을 고려합니다 재현율 데이터 과학자가 모델에 의해 올바르게 분류된 양성 샘플 수를 측정하는 데 도움이 됩니다 과학자들은 모델의 재현율을 계산하기 위해 모든 양성 샘플만 고려합니다 과학자들은 양성(FP)으로 분류된 음성 샘플을 무시하고 모델에 의해 올바르게 분류된 양성 샘플만을 고려합니다 결론 혼동 행렬을 통해 데이터 과학자는 기계 학습 알고리듬이 올바른 예측을 하는 데 얼마나 효과적인지 이해할 수 있습니다. 또한 잘못된 예측을 이해하고 오류율을 계산..
머신러닝에서 혼동행렬(Confusion Matrix) (3) 혼동 행렬을 사용한 계산 혼동 행렬이 참 긍정(TP), 참 부정(TN), 거짓 부정(FN) 및 거짓 긍정(FP)의 수를 결정하면 과학자는 모델의 분류 정확도, 오류율, 정밀도 및 리콜을 결정할 수 있습니다. 분류 정확도(Classification Accuracy) 분류 정확도는 모델이 정확한 출력을 예측하는 빈도를 정의하기 때문에 결정하는 가장 중요한 매개 변수 중 하나입니다. 정확도가 높을수록 모델이 우수하다는 것을 의미합니다. 정확도 = TP+TN / TP+FP+FN+TN 편두통 환자를 예측하는 예를 들어보면, 이 경우 기계학습 알고리즘의 정확도는 100+150/100+20+30+150 = 0.83이 됩니다. 이는 기계 학습 알고리즘이 예측에서 83% 정확하다는 것을 의미합니다. 오분류율(Miscla..
머신러닝에서 혼동행렬(Confusion Matrix) (2) 혼동 행렬 예제 혼동 행렬과 그 값을 더 잘 이해하기 위해 다음 예제를 고려해 보겠습니다. 편두통으로 고통 받는 환자의 수를 예측할 수 있는 모형을 만들고 싶다고 가정해보겠습니다. 이 경우 - TP은 편두통을 앓고 알고리즘에 의해 정확하게 확인된 환자입니다 - TN은 편두통을 앓지 않았고 알고리즘에 의해 올바르게 식별된 환자입니다 - FN은 편두통으로 고통받는 환자들이지만 알고리즘은 그렇지 않다고 말했습니다 - FP은 편두통이 없는 환자이지만 알고리즘에 따르면 편두통이 있다고 합니다 - 정확하게 분류된 100명의 TP 또는 편두통을 앓고 있는 환자들이 있었습니다. - TN이거나 편두통으로 고통받지 않는 환자가 150명이나 있었습니다. - 그러나 알고리즘은 30명의 환자가 편두통을 앓았을 때 편두통이 없다..
머신러닝에서 혼동행렬(Confusion Matrix) (1) 혼동 행렬은 기계 학습 분류 알고리즘을 위한 성능 측정 기술입니다. 데이터 사이언티스트들은 실제 값이 알려진 경우 테스트 데이터 세트에 대한 분류 모델의 성능을 평가하기 위해 이를 사용합니다. 예를 들어, 분류 정확도는 특히 데이터 세트에 두 개 이상의 클래스가 있을 때 오해의 소지가 있습니다. 결과적으로, 혼동 행렬을 계산하면 데이터 사이언티스트들이 분류 모델의 효과를 이해하는 데 도움이 됩니다. 혼동 행렬의 네 가지 결과 혼동 행렬은 실제 값과 예측 값을 비교하여 분류기의 정확도를 시각화합니다. 또한, 예측의 다른 결과에 대한 표 레이아웃을 제시합니다. True Positive - 모델이 예측한 값이 실제 값과 일치합니다 - 실제 값은 양의 값이었고, 기계 학습 모델은 양의 값을 예측했습니다 True..
인공지능 알고리즘의 편향성과 공정성 (4) 기계 학습을 더 공정하게 만드는 방법 - 다양하고 고품질의 교육 데이터를 모델에 사용할 수 있도록 보장합니다. - 공용 데이터 세트의 취약성을 식별합니다. 이 취약성은 잘못된 정렬 및 레이블이 지정된 데이터 세트와 일관성 없는 벤치마킹과 같은 품질이 낮은 데이터 세트로 인해 발생할 수 있습니다. - 모델 교육 과정에서 덜 민감한 정보를 사용하여 개인 정보 문제를 방지합니다. - IBM의 AI 공정성 360, Google의 What-If Tool, Model Cards, Toolkit, Microsoft의 fairlearn.py 및 Deon과 같은 기계 학습의 편향을 방지하고 제거하는 데 도움이 되는 도구를 활용합니다. - IBM의 AI 공정성 360은 사용자가 공정성 메트릭을 통해 기술 솔루션에 집중하고..
인공지능 알고리즘의 편향성과 공정성 (3) 인공지능 편향은 어디서 생기는가? 인간 리뷰의 편견 모델의 예측을 수용할지 또는 무시할지를 결정할 때 인간 검토자는 자신의 편견에 기초하여 올바른 모델 예측을 무시하고 자신의 편견을 도입할 수 있습니다. 이는 사람이 평가하는 동안 자신의 편견이 알고리즘에 영향을 미치도록 허용할 때 발생할 수 있으며, 이는 모델의 성능에 상당한 영향을 미칠 수 있습니다. 인공지능 편향을 완화하는 방법은? 편향 완화 전략을 적용하면 AI 알고리즘의 성능을 높일 수 있습니다. 즉, AI 시스템의 편향은 모델링 워크플로우의 세 단계를 통해 해결될 수 있습니다. 전처리: 데이터 과학자들은 편향을 감지하기 위해 원시 데이터에 대한 테스트를 실행하여 모델을 훈련시키기 전에 데이터 세트를 수정할 수 있습니다. 그런 다음 훈련 샘플에 ..
인공지능 알고리즘의 편향성과 공정성 (2) 인공지능 편향은 어디에서 생기는가? 이전 글에서 언급한 바와 같이, AI 모델과 그들의 예측은 훈련에 사용되는 데이터에 의해 크게 결정됩니다. 따라서, AI 시스템에서 가장 큰 편향의 원천은 그것이 훈련된 데이터입니다. 역사적 편향(Historical Bias) 역사적 편향은 우리의 데이터에 스며든 현재 세계에 존재하는 편향입니다. 모델을 훈련하는 데 사용된 데이터가 더 이상 현재 현실을 반영하지 않을 때 발생합니다. 역사적 편향은 역사적으로 불리하거나 배제된 집단과 개인에게 나타나는 경향이 있습니다. 예를 들어, 인공지능 시스템이 금융 부문에서 적격한 대출 신청자를 선정하는 임무를 맡았다고 가정 할 때, 모델이 훈련 받은 데이터에 기초하여, 그것은 남성 대 여성에 대한 특혜를 보여줄 수 있습니다. 이 ..
인공지능 알고리즘의 편향성과 공정성 (1) 인공지능은 편향과 공정성으로 인해 문제에 직면합니다. 기계 학습이 일부 그룹과 개인이 불이익을 받는 사회를 만드는 데 기여하는 다양한 산업과 응용 프로그램이 있습니다. 가장 흔한 문제 중 일부는 어두운 피부의 얼굴을 감지하는 문제로 이어지는 얼굴 인식과 민족에 걸친 의료 진단을 포함합니다. 인공지능 알고리즘의 편향과 공정성에 대해 더 많이 배우고 공정하고 공평한 결과로 이어지는 결정을 내리는 데 도움을 주는 인공지능 시스템을 개발하는 방법에 대해 알아보겠습니다. AI 편향이란? 인공지능 편향, 알고리즘 편향 또는 기계 학습 편향은 인간의 편향을 통합하고 반영하는 알고리즘의 경향입니다. 인공지능 모델과 그 예측은 훈련에 사용되는 데이터에 의해 크게 결정됩니다. 따라서 많은 편향은 편향된 데이터의 결과입니다..
컴퓨팅의 미래를 형성하는 새로운 기술 (6) 특징 - 인공 지능과 기계 학습은 의료, 교육, 교통 및 금융과 같은 산업 분야에서 광범위한 응용 분야를 가지고 있으며, 이러한 기술은 효율성, 정확성 및 안전성을 강화하기 위해 사용되고 있습니다. - Edge Computing은 계산 및 데이터 스토리지를 필요한 위치에 더 가깝게 하여 지연 시간을 줄이고 효율성을 향상시킵니다. 최근의 혁신에는 보다 복잡한 워크로드와 데이터 처리를 실시간으로 처리할 수 있는 보다 고급 하드웨어 및 소프트웨어의 개발이 포함됩니다. - 양자 컴퓨팅은 양자 역학의 원리를 사용하여 전통적인 컴퓨터에서는 불가능한 방식으로 정보를 처리합니다. 5G 및 네트워크 슬라이싱은 이전 세대에 비해 더 높은 데이터 속도, 더 낮은 대기 시간 및 더 높은 용량을 제공합니다. - 블록체인은 중앙..
컴퓨팅의 미래를 형성하는 새로운 기술 (5) 미래형 컴퓨터 DNA 컴퓨터(DNA Computers) DNA 컴퓨팅은 컴퓨팅의 미래를 위해 길을 내기 위해 DNA 분자를 사용하는 가능성을 탐구합니다. DNA는 매우 적은 에너지를 사용하여 방대한 양의 정보를 저장하고 처리할 수 있기 때문에 특히 이것을 위한 매우 강력한 매체입니다. 디지털 데이터의 이진 코드를 DNA의 뉴클레오티드 서열로 변환함으로써 디지털 데이터를 DNA와 같은 생물학적 형태로 저장할 수 있습니다. DNA는 4개의 뉴클레오티드(아데닌, 구아닌, 시토신 및 티민)로 구성되며, 이는 디지털 데이터를 나타내기 위해 순차적으로 배열될 수 있습니다. 이 과정은 DNA 합성 또는 DNA 인코딩으로 알려져 있습니다. 이러한 종류의 기술과 컴퓨팅은 아직 개발 초기 단계에 있으며, 사용 사례는 여전..

반응형