Hvordan tolke sannsynlighet modeller

August 1

Hvordan tolke sannsynlighet modeller

Statistisk analyse i samfunnsfag og andre kvantitative felt krever tolkning av sannsynlighet modeller i mange tilfeller. Vanligste metodikken brukt av samfunnsvitere er vanlige minste kvadraters (OLS). OLS er imidlertid metodologisk unfeasible når den avhengige variabelen er en dummy. Når dette er tilfellet, foretrekkes logit modeller. Mens forskjellig fra tolke OLS, er det ikke vanskelig å forstå logit modeller, som uttrykker data i S-formet kurver som spådde sannsynligheter.

Instruksjoner

Hvordan sette opp en Logit modell

• Skriv ned formlene du vil bruke til å definere modellen som følger:

Y * = b0 + b1X1 + b2X2 +...

PR(Y = 1) = (1) / (1 + exp? () -Y*))

• PR(Y = 1) angir sannsynligheten som Y = 1, y angir noen hendelse. Tenk deg at Y er sannsynligheten for at en borger vil stemme. Hvis Pr(Y = 1) = 5, så vet du at det er en.5 sannsynlighet som borger vil stemme. Derfor Pr(Y = 1) er alltid en verdi mellom 0 og 1.

• Koeffisientene (b0, b1, b2, etc) måles som tegn enten positive eller negative og tilsvarer uavhengige variablene (variablene som virker på den avhengige variabelen). Hvis en av disse koeffisienter har et negativt tegn, en større tilsvarende X betyr at det vil være en lavere Y *, og dermed en redusert Pr(Y = 1).

Hvordan tolke Logit modell

• I logit modeller er den avhengige variabelen en dummy. Dvs det uttrykker en enten / eller hendelsestypen uttrykt som en sannsynlighet. En logit modell med sannsynligheten for stemme som den avhengige variabelen vil tillegge enten "0" eller en "1" hvert alternativ som følger:

"0" = ikke stemte

"1" = stemte

Den avhengige variabelen ligger på y-aksen, som kjører på en skala med 0 på det laveste punktet og 1 på det høyeste punktet.

Simulere dette eksemplet ved å tegne et xy-diagram med y-aksen beskrevet ovenfor.

• Opprette en x-akse som beskriver utdanningsnivå. Plassere fem hasj merker på skala og merke dem begynner med 1 til hash nærmest skjærer og slutter med 5 på punktet lengst snitt, hvor 1 = noen skolen, 2 = skolen, 3 = noen lavere, 4 = undervisning og 5 = utenfor undervisning.

• Tegne og S-formet kurve slik at det høyeste punktet på kurven (toppen av S) ligger over 5 på x-aksen og over et punkt rett under 1 på y-aksen og det laveste punktet er over 1 på x-aksen og over punkt bare over 0 på y-aksen.

• For å tolke denne kurven, gå opp en imaginær loddrett linje fra et gitt punkt på x-aksen til stedet hvor den tenkte linjen møter S kurven. Deretter forestille en annen går vannrett som skjærer til y-aksen. Dette skjærer avslører sannsynligheten for at en statsborger med "x" utdanning har en "y" sannsynlighet for stemme (dvs. en statsborger med undervisning erfaring har en.43 sannsynlighet av stemmeberettigede)

Tips og advarsler

  • I dette eksemplet ble det antatt at et høyere nivå av utdanning vil øke sannsynligheten for stemmegivning. Derfor, hvis utdanningsnivå korresponderte med b1X1 i modellens ligningen, b1 må positivt og X 1 ville har en betydelig innvirkning (en større verdi). I modellen, en høyere verdi for b1X1 vil øke sannsynligheten for å stemme eller Y * [Pr(Y = 1)].