Wskaźnik Giniego, który opisałem w części #7 poświęconej krzywej ROC, jest jednym z najważniejszych narzędzi wykorzystywanych w procesie oceny jakości klasyfikacji. Choć krzywa ROC jest ważna i bardzo przydatna, to z mojego doświadczenia wynika, że większość analityków woli wykreślać krzywą Captured Response. Sądzę, że wszyscy intuicyjnie czujemy, że "Gini z ROC" i "Gini z Captured Response" to to samo 🙂 Ale dlaczego tak jest? 🙂 Dziś odpowiem na to pytanie, jednocześnie wzbogacając serię "Tips & Tricks na krzywych"!
Krzywa Captured Response jako przekształcenie liniowe krzywej ROC
W części #8 wykazałem, że krzywą ROC i krzywą Captured Response łączy poniższa formuła.
Powyższy wzór można zapisać na bazie przekształcenia liniowego
opisanego macierzą przekształcenia liniowego
Po szczegóły odsyłam do części #8 "Captured Response = ROC x apriori".
Wyznacznik macierzy przekształcenia liniowego i współczynnik zmiany pola powierzchni
Jeśli analizujemy przekształcenie liniowe
gdzie jest macierzą przekształcenia liniowego, a
wektorem, to wyznacznik
jest współczynnikiem o jaki zmienia się pole powierzchni / objętość / miara figury / obiektu transformowanego poprzez przekształcenie liniowe . Polecam poniższy film.
Wyznacznik macierzy przekształcenia liniowego krzywej ROC w krzywą Captured Response
Z powyższego wynika, że pole powierzchni pomiędzy przestrzenią, w której "osadzona" jest krzywa ROC, a przestrzenią "zawierającą" krzywą Captured Response, powinno się skalować poprzez współczynniki . Sprawdźmy 🙂
Wykorzystując wzór na pole trójkąta wyznaczamy
Zgadza się 🙂 I ostatecznie
czyli
Jako ciekawostka - podobnie można policzyć AUROC z Captured Response:
Pozdrowienia,
Mariusz Gromada

