Przejdź do zawartości

Kappa Cohena

Z Wikipedii, wolnej encyklopedii

Współczynnik Kappa Cohena (ang. Cohen's kappa) – wykorzystywany w statystyce współczynnik rzetelności dwukrotnych pomiarów tej samej zmiennej, która jest zmienną nominalną i zależną. Pomiaru zmiennej może dokonać jeden sędzia kompetentny (dwukrotnie, w odstępie czasowym) lub dwóch różnych sędziów kompetentnych w tym samym czasie. Kappa Cohena przyjmuje wartości od -1 do 1. Im bliżej wartości 1, tym oceny dwóch sędziów (lub jednego sędziego w odstępie czasowym) są bardziej zgodne. Z kolei im bliżej wartości 0, tym oceny są bardziej rozbieżne. Wartości od -1 do 0 są w praktyce niewykorzystywane, gdyż ujemna wartość Kappy Cohena oznaczałaby zgodność ocen mniejszą niż w przypadku gdyby były to zmienne całkowicie losowe.

Twórcą współczynnika jest amerykański psycholog i statystyk Jacob Cohen.

Definicja

[edytuj | edytuj kod]

Współczynnik kappa Cohena mierzy zgodność między dwoma oceniającymi, z których każdy klasyfikuje N elementów do C wzajemnie wykluczających się kategorii lub zgodność między dwoma pomiarami tej samej zmiennej nominalnej. Współczynnik, oznaczany grecką literą kappa (), wyznacza się na podstawie następującego wzoru:

gdzie po jest względną zaobserwowaną zgodnością pomiarów/oceniających, zaś pe jest hipotetycznym prawdopodobieństwem przypadkowej zgodności, przy czym na podstawie zaobserwowanych danych oblicza się prawdopodobieństwo losowego wyboru każdej kategorii przez każdego obserwatora. Jeżeli osoby oceniające lub pomiary są w pełni zgodne, to . Gdy zgodność pomiędzy oceniającymi nie przekracza poziomu, którego można by oczekiwać przypadkowo (wyznaczonego przez pe), wówczas . Istnieje możliwość, że statystyka będzie ujemna[1], co może być wynikiem przypadku w sytuacji braku związku między oceniającymi/pomiarami lub może odzwierciedlać rzeczywistą tendencję oceniających do wystawiania odmiennych ocen.

Gdy liczba kategorii to k, N to liczba obserwacji, które należy skategoryzować, zaś to liczba przypadków, w których pomiar i przydzielił kategorię k, można by wyznaczyć na podstawie następującego wzoru:

Wynika to z następującej konstrukcji:

gdzie jest szacowanym prawdopodobieństwem, że zarówno oceniający 1, jak i oceniający 2 sklasyfikują ten sam element jako k, podczas gdy jest szacowanym prawdopodobieństwem, że oceniający 1 sklasyfikuje element jako k (i podobnie będzie w przypadku oceniającego 2). Relacja opiera się na założeniu, że oceny dwóch oceniających są niezależne. Wartość szacuje się, używając liczby elementów sklasyfikowanych jako k przez oceniającego 1 () podzielonej przez całkowitą liczbę elementów do sklasyfikowania (): (i analogicznie dla oceniającego 2).

Macierz pomyłek klasyfikacji binarnej

[edytuj | edytuj kod]

W tradycyjnej macierzy pomyłek 2×2 stosowanej w uczeniu maszynowym i statystyce do oceny klasyfikatorów binarnych współczynnik kappa Cohena można obliczyć w następujący sposób: [2]

gdzie TP to prawdziwe wyniki pozytywne, FP to wyniki fałszywie pozytywne, TN to wyniki prawdziwie negatywne, a FN to wyniki fałszywie negatywne. W tym przypadku Kappa Cohena jest odpowiednikiem miernika Heidke skill score znanego w meteorologii[3]. Pierwszy raz tę miarę wprowadził Myrick Haskell Doolittle w 1888 roku[4].

Przypisy

[edytuj | edytuj kod]
  1. Julius Sim. The Kappa Statistic in Reliability Studies: Use, Interpretation, and Sample Size Requirements. „Physical Therapy”. 85 (3), s. 257–268, 2005. DOI: 10.1093/ptj/85.3.257. ISSN 1538-6724. PMID: 15733050. 
  2. Chicco D., Warrens M.J.. The Matthews correlation coefficient (MCC) is more informative than Cohen's Kappa and Brier score in binary classification assessment. „IEEE Access”. 9, June 2021. DOI: 10.1109/ACCESS.2021.3084050. Bibcode2021IEEEA...978368C. 
  3. P. Heidke. Berechnung Des Erfolges Und Der Güte Der Windstärkevorhersagen Im Sturmwarnungsdienst. „Geografiska Annaler”. 8 (4), s. 301–349, 1926-12-01. DOI: 10.1080/20014422.1926.11881138. ISSN 2001-4422. 
  4. Philosophical Society of Washington (Washington, D.C.): Bulletin of the Philosophical Society of Washington.. T. 10. Washington, D.C.: Published by the co-operation of the Smithsonian Institution, 1887, s. 83.

Bibliografia

[edytuj | edytuj kod]