Vier-Feldertafeln

Prof. Dr. Dörte Haftendorn MuPAD 4 Jan 07  http://haftendorn.uni-lueneburg.de

###############################################################

Vier-Felder-Test nach Fisher

Es geht darum, ob zwei verschiedene Gruppen, hier Typ A und Typ B genannt,

bezüglich eines ja/nein-Merkmals E unterschiedlich sind.

Dein Einfachheit halber wird hier von Personen gesprochen.

Es werden n  Personen untersucht, von denen a vom Typ A und b vom Typ B sind.

Nach der Befragnung haben e Personen das Merkmal E und ne haben es nicht.

 

image zum Beispiel image

 

Interessant ist nun, dass die Aufteilung der e Personen auf Typ A und B durchaus verschieden sein kann,

auch wenn die Gruppen bzgl. E eigentlich gleich sind.

 

Null-Hypothese         H0: Die Gruppen unterscheiden sich nicht bzgl. Merkmal E.

Foschungshypthese H1: Typ A weist weniger E auf, also Typ B mehr (oder umgekehrt).

 

Man beobachtet eine Aufteilung von e

Ist nun image, so ist gar nichts mehr zu untersuchen, das gehört sicher zu H0.

 

Weicht die Beobachtung deutlicher davon ab, so ist zu fragen, mit welcher Wahrscheinlichkeit unter  H0

diese Tafel und weitere, die H1 noch mehr stützen, auftreten.

image

Es imagegibt  Möglichkeiten ea Personen mit Merkmal E unter den a Personen vom Typ A "anzukeuzen".

Es imagegibt  Möglichkeiten eb Personen mit Merkmal E unter den b Personen vom Typ B "anzukeuzen".

Es image gibt  Möglichkeiten e   Personen mit Merkmal E unter den n  Personen überhaupt "anzukeuzen".

Also ist der erste Summand der gesuchten Wahrscheinlichkeit image

Ptafel:=(ea,a,eb,b)->binomial(a,ea)*binomial(b,eb)/binomial(a+b,ea+eb)

math

Durch diesen Formelaufbau sieht man Vieles, vor Allem, dass die Formel

symmetrisch in a und b ist. Also ist es egal, ob man die Hypothese auf A oder auf B bezogen

formuliert. Damit ist der Vier-Felder-Test immer einseitig formulierbar.

 

image

Ptafel(3,5,1,7), float(%)

math

Erstaunlicherweise ist die obige Tafel noch durchaus verträglich mit der Nullhypothese.

Hinreichend für eine Annahme von H1   ist

Ptafel(4,5,0,7); float(%)

math

math

Man hätte für eine Signifikanz also gebraucht:image

alpha:=Ptafel(3,5,1,7)+Ptafel(4,5,0,7); float(%)

math

math

Das ganz oben angebene  Ergebnis ist also nicht!!!!! signifikant. Man kann nicht behaupten,

dass das Merkmal E unter Typ A mehr verbreitet ist als unter B.

###################################################

Noch etwas Theorie als Hilfe für Zweifelsfälle:

Bei manchen Beispielen ist man sich nicht  sicher, ob nicht E und Nicht-E die Typen bilden und

A und B die alternativen Merkmale sind.

Darüber braucht man nicht zu grübeln, denn wenn man die Formel für die Wahrscheinlichkeit mit

Fakultäten ausschreibt, folgt

PtafelTerm:=hold((a!*b!*e!*ne!)/((ea!*na!*eb!*nb!)*n!))

math

Man sieht: Unten ist eine Klammer aus den vier Innen-Elementen, der Zähler besteht aus den vier

Außen-Elementen, n! steht noch im Nenner. Also ist auch das symmetrisch, man muss nur darauf  achten,

dass man  die Binomialterme entweder nur aus Zeilenelementen oder nur aus Spaltenelementen baut.

Damit ist es auch wirkunkslos, wenn man Zeilen und Spalten vertauscht.

 

Aus didaktischer Sicht ist die oben verfolgte Begründung sinnvoller, da die Aufteilung in die Typen meist "vorgegeben" ist. Bücher sind da nicht immer geschickt.