Aufgabenblatt 5b, Aufgabe 5
2 verfasser
Seite 1 von 1
Aufgabenblatt 5b, Aufgabe 5
Hallo,
ich habe eine Frage zur Aufgabe 5 Aufgabenblatt 5b.
Nachdem wir alles nötige berechnet haben könnte man doch einen Hierarchischen F-Test rechnen in dem man in Set B: d1, d2, d3 und in Set A: 0 nimmt.
Dazu brauche ich aber die Korrelation zwischen Partei und Modern Racism Scale. Die Residuen für jede Person kann ich ja mit Hilfe der Vorhersagegleichung ausrechnen, aber dann weiß ich nicht mehr weiter. Eine Produkt-Moment Korrelation kann ich ja nicht rechnen da der Prädiktor mehr als zwei Ausprägungen hat und nominal skaliert ist.
Also ich weiß nur, dass ich irgendwie über die Residuen an die Korrelation zwischen Set B und dem Prädiktor komme, aber was genau muss ich denn machen? Also welche Formel ist da nötig?
Vielen Dank, für eure Hilfe.
ich habe eine Frage zur Aufgabe 5 Aufgabenblatt 5b.
Nachdem wir alles nötige berechnet haben könnte man doch einen Hierarchischen F-Test rechnen in dem man in Set B: d1, d2, d3 und in Set A: 0 nimmt.
Dazu brauche ich aber die Korrelation zwischen Partei und Modern Racism Scale. Die Residuen für jede Person kann ich ja mit Hilfe der Vorhersagegleichung ausrechnen, aber dann weiß ich nicht mehr weiter. Eine Produkt-Moment Korrelation kann ich ja nicht rechnen da der Prädiktor mehr als zwei Ausprägungen hat und nominal skaliert ist.
Also ich weiß nur, dass ich irgendwie über die Residuen an die Korrelation zwischen Set B und dem Prädiktor komme, aber was genau muss ich denn machen? Also welche Formel ist da nötig?
Vielen Dank, für eure Hilfe.
Larifari- Anzahl der Beiträge : 5
Anmeldedatum : 19.05.13
Re: Aufgabenblatt 5b, Aufgabe 5
Achtung: Wir kodieren den Faktor ja extra mit dichotomen Dummies damit wir überhaupt Korrelationen rechnen können - mit dem nominalskalierten Faktor geht das nicht, genau wir du gesagt hast.
Aber wir können aber jeweils eine Korrelation der Dummies mit der AV rechnen (mit normalen Formlen für den Mittelwert, Varianz, Korrelation, nur ist der Dummy halt 0/1 kodiert). Dann erhalten wir die Matrix R der interkorrelationen der Dummies und den Vektor r mit Korrelationen von jedem Dummy zur AV.
So, jetzt rechnen wir eine multiple Regression, d.h. wir lösen die matrixgleichung R*beta=r durch die inverse Matrix:
beta = R^(-1) * r . damit können wir nun vorhergesagte werte berechnen und dann residuen. der ganze weg lässt sich natürlich abkürzen, da wir die prognosegleichung ja schon geschickter über mittelwerte hergeleitet haben. wir können also für jede person einen besten schätzer geben: nämlich genau den mittelwert der gruppe.
So, und jetzt kommen wir glaube ich erst zu deinem eigentlichen Problem (sorry, ich hätte erst mal genauer lesen sollen ):
R^2 ist ja der Anteil der Aufgeklärten Varianz an Gesamtvarianz. Naja, wir berechnen also die Quadratsumme der normalen AV (das ist QS_tot, also einfach Varianz rechnen und nicht durch (n-1) teilen) und die Quadratsumme der vorhergesagten Werte (das wäre QS_reg). wenn wir die nun durcheinander teilen haben wir schon mal R^2 (y . d1,d2,d3). naja, und unter dem bruch steht halt genau 1-R^2 . dann die freiheitsgrade mit der Formel und wir haben einen F wert.
Du kannst dein ergebnis überprüfen (und die ANOVA wiederholen), indem du mal den F wert über die anova-terminologie berechnest (also einfach MQS_A / MQS_E). wenn du dich nicht verrechnest kommt exakt der gleiche wert raus.
so, ich hoffe die erklärung hat geholfen
daniel
Aber wir können aber jeweils eine Korrelation der Dummies mit der AV rechnen (mit normalen Formlen für den Mittelwert, Varianz, Korrelation, nur ist der Dummy halt 0/1 kodiert). Dann erhalten wir die Matrix R der interkorrelationen der Dummies und den Vektor r mit Korrelationen von jedem Dummy zur AV.
So, jetzt rechnen wir eine multiple Regression, d.h. wir lösen die matrixgleichung R*beta=r durch die inverse Matrix:
beta = R^(-1) * r . damit können wir nun vorhergesagte werte berechnen und dann residuen. der ganze weg lässt sich natürlich abkürzen, da wir die prognosegleichung ja schon geschickter über mittelwerte hergeleitet haben. wir können also für jede person einen besten schätzer geben: nämlich genau den mittelwert der gruppe.
So, und jetzt kommen wir glaube ich erst zu deinem eigentlichen Problem (sorry, ich hätte erst mal genauer lesen sollen ):
R^2 ist ja der Anteil der Aufgeklärten Varianz an Gesamtvarianz. Naja, wir berechnen also die Quadratsumme der normalen AV (das ist QS_tot, also einfach Varianz rechnen und nicht durch (n-1) teilen) und die Quadratsumme der vorhergesagten Werte (das wäre QS_reg). wenn wir die nun durcheinander teilen haben wir schon mal R^2 (y . d1,d2,d3). naja, und unter dem bruch steht halt genau 1-R^2 . dann die freiheitsgrade mit der Formel und wir haben einen F wert.
Du kannst dein ergebnis überprüfen (und die ANOVA wiederholen), indem du mal den F wert über die anova-terminologie berechnest (also einfach MQS_A / MQS_E). wenn du dich nicht verrechnest kommt exakt der gleiche wert raus.
so, ich hoffe die erklärung hat geholfen
daniel
daniel- Admin
- Anzahl der Beiträge : 163
Anmeldedatum : 12.03.11
Re: Aufgabenblatt 5b, Aufgabe 5
Ah ja danke, also den zweiten Absatz versteh ich, den ersten leider weniger. Eine Korrelation von Prädiktor mit dem Kriterium kann ich scheinbar mit der Punktbiserealen Korrelation für jeden Dummy berechnen, oder? Aber wie rechne ich denn eine Interkorrelation von zwei Dummys, ich kann mir weder die Formel noch den Sinn dahinter erahnen, man kann doch entweder in der einen oder der Anderen Partei sein, wo soll da denn was interkorrelieren? Phu, ganz schön viel Verwirrung. Danke, danke nochmals für die Hilfe.
Larifari- Anzahl der Beiträge : 5
Anmeldedatum : 19.05.13
Re: Aufgabenblatt 5b, Aufgabe 5
genau, die korrelation aus dummy und AV ist eine punktbiseriale korrelation (es gibt zwar formeln zur vereinfachung, aber im Grunde ist es ja eine "normale" lineare pearson-korrelation wie wir sie kennen aus qm I ). man kann das auf zwei arten interpretieren: entweder als einfachen gruppenunterschied (t-test logik: zwei unabhängige gruppen, jede hat andere werte auf der AV) . oder wir interpretieren es als punkt-biseriale korrelation wie hier: hängt die gruppenzugehörigkeit damit zusammen, ob die AV größer oder kleiner wird? (=> "gibt es einen mittelwertsunterschied" würden wir beim t-test sagen).
die korrelation zweier dummies könnte man genauso berechnen wie eine normale korrelation (macht man aber im endeffekt natürlich nicht, auch hier gibt es sicher vereinfachende formeln).
beispieldaten für 4 leute und 2 dummies:
d1 ; d2
1 ; 1
0 ; 0
1 ; 1
1 ; 0
1.) mittelwerte: für d1: x_quer=0.75 ; d2: 0.5
2.) varianzen d1: 0.75*0.25=3/16 ; d2: 1/2*1/2=1/4
3.) kovarianz: (1-.75)*(1-.5) + (0-0.75)*(0-0.5) + (1-.75)*(1-.5) + (1-.75)*(0-.5)= .....
4.) korrelation wie gewohnt:
r= s_xy / (s_x * s_y)
natürlich würde man das so nicht machen, viel zu umständlich. aber es ginge, wie man sieht. ist es so verständlich mit dem beispiel?
daniel
EDIT: übrigens verstehe ich deine verwirrung wieso das eine korrelation sein soll: wir haben ja nur vier mögliche kominationen (1-1; 0-1; 1-0; 0-0) -> wieso sollte das eine lineare korrelation sein? naja, man macht es halt einfach so, sehr intuitiv ist es nicht mehr, aber es geht es gibt uns halt immer noch den zusammenhang zweier dichotomer variablen an (dafür gibt es auch andere maße. vergleiche zB den chi² test für die unabhängigkeit und dort den kontigenzkoeffizienten C: dort hatten wir solche vier-felder-tafeln mit häufigkeiten genau dieser kombinationen wie hier 1-1 ,0-1 etc:
d1=0 d2=1
d1=0 34 15
d2=1 21 30
d.h. bei dichot. variablen gibt es verschiedene möglichkeiten, zusammenhänge als zahl auszudrücken, aber es geht immer darum, den zusammenhang (stochastische abhängigkeit) der variablen irgendwie in eine zahl zu fassen..... und ein einfacher weg ist halt die normale korrelation, die wir dann wie immer in unsere multiple regression einsetzen
die korrelation zweier dummies könnte man genauso berechnen wie eine normale korrelation (macht man aber im endeffekt natürlich nicht, auch hier gibt es sicher vereinfachende formeln).
beispieldaten für 4 leute und 2 dummies:
d1 ; d2
1 ; 1
0 ; 0
1 ; 1
1 ; 0
1.) mittelwerte: für d1: x_quer=0.75 ; d2: 0.5
2.) varianzen d1: 0.75*0.25=3/16 ; d2: 1/2*1/2=1/4
3.) kovarianz: (1-.75)*(1-.5) + (0-0.75)*(0-0.5) + (1-.75)*(1-.5) + (1-.75)*(0-.5)= .....
4.) korrelation wie gewohnt:
r= s_xy / (s_x * s_y)
natürlich würde man das so nicht machen, viel zu umständlich. aber es ginge, wie man sieht. ist es so verständlich mit dem beispiel?
daniel
EDIT: übrigens verstehe ich deine verwirrung wieso das eine korrelation sein soll: wir haben ja nur vier mögliche kominationen (1-1; 0-1; 1-0; 0-0) -> wieso sollte das eine lineare korrelation sein? naja, man macht es halt einfach so, sehr intuitiv ist es nicht mehr, aber es geht es gibt uns halt immer noch den zusammenhang zweier dichotomer variablen an (dafür gibt es auch andere maße. vergleiche zB den chi² test für die unabhängigkeit und dort den kontigenzkoeffizienten C: dort hatten wir solche vier-felder-tafeln mit häufigkeiten genau dieser kombinationen wie hier 1-1 ,0-1 etc:
d1=0 d2=1
d1=0 34 15
d2=1 21 30
d.h. bei dichot. variablen gibt es verschiedene möglichkeiten, zusammenhänge als zahl auszudrücken, aber es geht immer darum, den zusammenhang (stochastische abhängigkeit) der variablen irgendwie in eine zahl zu fassen..... und ein einfacher weg ist halt die normale korrelation, die wir dann wie immer in unsere multiple regression einsetzen
daniel- Admin
- Anzahl der Beiträge : 163
Anmeldedatum : 12.03.11
Re: Aufgabenblatt 5b, Aufgabe 5
Oke, wow da wär ich nie drauf gekommen, aber jetzt versteh ich's, das ist super, danke
Larifari- Anzahl der Beiträge : 5
Anmeldedatum : 19.05.13
Ähnliche Themen
» Ausführliche Lösung zu Aufgabenblatt 4 Aufgabe 1 und 2
» Aufgabenblatt 2a
» Beispielaufgaben Block 7
» übungsballt 4 ; Aufgabe 1a
» Aufgabenblatt 2 b
» Aufgabenblatt 2a
» Beispielaufgaben Block 7
» übungsballt 4 ; Aufgabe 1a
» Aufgabenblatt 2 b
Seite 1 von 1
Befugnisse in diesem Forum
Sie können in diesem Forum nicht antworten