Prawdopodobieństwo czy szansa?
W problemie klasyfikacji binarnej etykietę możemy opisać jako zmienną losową z rozkładu dwumianowego o prawdopodobieństwie sukcesu $p$.
Dla $i$-tej obserwacji zapiszemy to jako
Interesuje nas opisanie prawdopodobieństwa $p_i$ jako funkcji wektora obserwacji $X$
Ponieważ $X_i$ jest znane, gdybyśmy znali $f()$ moglibyśmy lepiej przewidywać wartości $y_i$.
Bezpośrednie modelowanie prawdopodobieństwa $p_i$ potrafi być trudne, z uwagi na to, że prawdopodobieństwo przyjmuje wartości na ograniczonym przedziale $(0,1)$. Dlatego w modelowaniu często zamiast prawdopodobieństwa modeluje się logarytm szansy.
Szansa
Szansa wystąpienia zdarzenia to iloraz prawdopodobieństwa, że to zdarzenie wystąpi do prawdopodobieństwa, że nie wystąpi.
Szansa przyjmuje wartości w przedziale $(0, \infty)$. Wartość 1 oznacza, że tak samo prawdopodobne jest wystąpienie i nie wystąpienie określonego zdarzenia.
Log-szansa
Log-szansa to logarytm z szansy.
Log-szansa przyjmuje wartości w przedziale $(-\infty, \infty)$. Wartość 0 oznacza, że tak samo prawdopodobne jest wystąpienie i nie wystąpienie określonego zdarzenia.
Szansa prawdopodobieństwo - prawdopodobieństwo szansa
Prawdopodobieństwo można jednoznacznie przekształcić na log-szanse.
Log-szanse można jednoznacznie przekształcić na prawdopodobieństwo.