Verschiedenes

Nach unten

Verschiedenes

Beitrag  Anny am Mo Mai 30, 2011 12:44 am

Also ich habe da mal ein „paar“ Fragen;)

1. Kreuzvalidierung Auf Folie 26 steht „In diesem Kontext ist man auf die aus der Stichprobe geschätzten Regressionskoeffizienten angewiesen. Ihre Anwendung auf eine andere Stichprobe aus der Population führt zu einem gegenüber der „adjusted R-square“-Formel noch weiter geschrumpften R.“

Diesen Satz verstehe ich so: z.B. Ra > ro^ > ryby^b(a) In der Vorlesung wurde aber gesagt, dass ryby^b(a) auch größer sein kann als Ra, wenn die Regressionsgerade aus Stichprobe a noch besser in die Stichprobe b passt. Ich hatte eigentlich auch eher verstanden, dass gilt: Ra> ro^ > ryay^a(b), da Ra die optimale Vorhersage leistet und der Korrelationskoeffizient mit den Regressionsgewichten einer anderen Stichprobe vorhergesagt nie größer werden kann als Ra. Wie ist dann der Satz auf der Folie zu deuten?

2. Kann man auch eine Regression mit ordinalskalierten Werten rechnen?

3. Auf den Erklärungen zum Regressionsoutput aus den Tuts steht beim Standardschätzfehler, dass man mit ihm ein CI berechnen kann, indem man den wahren Wert (y) der Person erwarten kann. Das verstehe ich nicht.

4. Eine Frage zum Umgang mit fehlenden Werten, speziell zu MAR: Ich hab mir aufgeschrieben, man den fehlenden Wert auch durch die Kovariaten errechnen kann, also z.B. das der fehlende Wert zum Einkommen aus dem Bildungsstand, Beruf, Hausgröße etc errechnet werden kann. Das muss aber nicht immer zwingend so sein oder?

5. Vergleich ANOVA und Regression: Wir haben ja festgestellt dass bei beiden Verfahren die aufgeklärte Varianz über dem Bruchstrich steht. Bei der ANOVA steht über dem Bruchstrich ja MQSA, was ein guter Schätzer für Sigma Alpha‘+SigmaE ist (Man kann Sigma Alpha ja nicht alleine schätzen). Aber trotzdem repräsentiert dann MQSA ja eigentlich nicht nur die aufgeklärte Varianz oder sehe ich das falsch?

Vielen Dank schonmal!

Anny

Anzahl der Beiträge : 14
Anmeldedatum : 20.03.11

Benutzerprofil anzeigen

Nach oben Nach unten

Re: Verschiedenes

Beitrag  daniel am Mo Mai 30, 2011 3:39 pm

ein "paar Fragen" ist gut ^^
also ein paar Antworten:
1. also der normalfall ist, dass eine prognoseformel a am besten auf die stichprobe a passt, aus der sie gewonnen wurde. es kann aber passieren, dass eine andere Stichprobe b homogener ist und dann passt prognose(a) dort plötzlich besser als in der "eigenen" stichprobe a. dennoch kann diese prognoseformel a für die stichprobe b niemals besser sein, als die formel b, die eigentlich in der homogenen stichprobe b berechnet wurde (schönes durcheinander Wink )

2. öhm, man sollte es eher nicht machen, aber es geht natürlich rechnerisch. auf jeden fall sollten die abstände als ungefähr gleich angenommen werden. achja, und jegliche inferenzstatistik ist dann natürlich nicht mehr interpretierbar (da dort über die annahme einer NV vorhanden ist)

3. man kann für eine person einen wert vorhersagen. diese vorhersage ist fehlerbelastet. wenn iwr die annahme NV haben, können wir angeben, in welchem intervall der wahre wert zu erwarten ist mit 95% (ist zB interessant, wenn man die leistung eines mitarbeiters vorhersagen will)

4. das was du meinst wäre eine einfache imputation mit regression. dadurch wird die sstreuung der werte kleiner, als sie es in echt wäre. also wird auch der standardfehler kleiner und damit tests eher signifikant (zu unrecht). das sollte man also eher nicht machen.
aber eigentlich zeichnet MAR genau das aus: der wert, der fehlt, hängt mit einer anderen variable zusammen. also sollte eigentlich der wert mehr oder weniger gut rekonstruierbar sein. (bin mir aber auch grad nicht 100% sicher)

5. ja, da hast recht, man kann sigma_A, also die Wahre effektvarianz niemals schätzen, ohne auch die fehlervarianz drin zu haben. deshalb ja auch ein F test und kein chi^2 test (siehe herleitung des F-Tests für ANOVA)
ich bin mir nicht sicher, aber bei der regression sollte es zum selben problem kommen, da wirklich die gleichen F-werte rauskommen. somit muss es ja irgendwie drinstekcne, aber ich kann dir nicht genau sagen wie.
vllt kann man es sich wieder so vorstellen: unsere prognose nutzt jeden kleinsten fehler aus und ist "zu gut". somit ist auch das R^2 auf dem bruchstrich "zu gut" bzw zu groß (das würde der vergrößerung durch die fehlervarianz in der ANOVA entsprechen).

so, hoffe das hilft weiter Smile
avatar
daniel
Admin

Anzahl der Beiträge : 163
Anmeldedatum : 12.03.11

Benutzerprofil anzeigen

Nach oben Nach unten

Re: Verschiedenes

Beitrag  Anny am Di Mai 31, 2011 2:34 pm

Danke sehr;)
zu 3. sieht die Berechnung des CI dann konkret so aus: Y^ (also geschätzter Wert einer Person) +/- z 1-Alpha/2 x Standardschätzfehler?

Anny

Anzahl der Beiträge : 14
Anmeldedatum : 20.03.11

Benutzerprofil anzeigen

Nach oben Nach unten

Re: Verschiedenes

Beitrag  daniel am Do Jun 02, 2011 2:31 pm

ja, genau so sollte es berechnet werden, gleiche logik wie immer.
avatar
daniel
Admin

Anzahl der Beiträge : 163
Anmeldedatum : 12.03.11

Benutzerprofil anzeigen

Nach oben Nach unten

Missings

Beitrag  papaya am Do Jun 02, 2011 11:51 pm

Hallo!

Eine Frage zu den Missings.

Ich habe mir zum MCAR Test von Little aufgeschrieben, dass er testet ob MCAR o d e r MAR vorliegt. (Obwohl der Name natürlich nahe legt, dass es sich um einen Test auf MCAR handelt.) Hat sich das vielleicht noch jmd aufgeschrieben? Und heißt das dann, wenn der Test signifikant wird, dann liegt NMAR vor? Oder wird er eben auch schon bei MAR signifikant?

LG

papaya

Anzahl der Beiträge : 9
Anmeldedatum : 08.05.11

Benutzerprofil anzeigen

Nach oben Nach unten

Re: Verschiedenes

Beitrag  daniel am Fr Jun 03, 2011 9:39 am

auf NMAR kann man niemals testen, weil die dazu nötigen daten ja weg sind. Das muss man sich irgendwie logisch herleiten, wobei es auch bei NMAR korrelationen zu andren variablen geben kann, die evtl aufschluss liefern

der MCAR test von little testet auf Abweichung von MCAR
=> wenn er signifikant ist, weichen die daten sign. von MCAR ab, sind also mar
=> das ist ein chi^2 test, ein bisschen vergleichbar mit den unabhängigkeitstest am anfang, da haben wir auch mit chi^2 die abweichung von der unabhängigkeit getestet
avatar
daniel
Admin

Anzahl der Beiträge : 163
Anmeldedatum : 12.03.11

Benutzerprofil anzeigen

Nach oben Nach unten

Re: Verschiedenes

Beitrag  Gesponserte Inhalte


Gesponserte Inhalte


Nach oben Nach unten

Nach oben


 
Befugnisse in diesem Forum
Sie können in diesem Forum nicht antworten