Empirische Wirtschaftsforschung - Klausurlösung - SS2018.pdf

Exams
Uploaded by Yannick Holtze 41457 at 2019-05-17
Description:

Das hier ist mein Vorschlag für die Lösung der Klausur. Ich kann leider keine Fehlerfreiheit garantieren. Wenn ihr einen fraglichen/ falschen Punkt findet, meldet euch doch bitte einmal.

 +4
386
82
Download
Müsste hier nicht das "keine" wegfallen? Wir lehnen die H0 doch ab, also ist es signifikant verschieden von 0 und hat somit einen Einfluss, oder?
View 13 more comments
Wir lehnen die Nullhypothese auf dem 5% Signifikanzniveau ab. Somit ist die Variable CRIM ² statistisch signifikant verschieden von Null. Es besteht also ein Nicht-Linearer Zusammenhang zwischen Hauspreis und Verbrechensrate. Zu dem 10% oder 1% müssen wir nichts erwähnen, da unser Regressionsoutput nach dem 95% KI gemessen wurde.
Woher weißt du dass es auf dem 95% gemessen wurde ?
f-test da crim 2 betas hat ?
View 1 more comment
Warum aber beta1 und Beta2 und nicht beta1 und beta3 zb?
Weil ß1 und ß2 die Koeffizienten von beiden zu prüfenden Variablen sind.
Könnte mir das jemand erklären? Woher sollen wir wissen, dass unser Wert aus der Stichprobe in dem Intervall liegt ? Weil ein 95% KI generell den wahren Wert mit einer 95%-igen Wahrscheinlichkeit enthält ?
View 2 more comments
"Genau Das gilt aber halt nur, wenn die Stichprobe iid gezogen wurde."
Zumindest mein Kommentar wurde nicht gelöscht?🤔
No area was marked for this question
📍Aufgabe 1b SS18 Wären die Antwortsätze so richtig? Und wie macht ihr das mit dem tkrit? Schreibt ihr dann auch alle auf oder nur den für 5%Signifikanzniveau? Bin mir voll unsicher 🤔
Ich persönlich habe bei meinen Interpretationen leider c.p. vergessen. Daran solltest du denken. Ich würde die Signifikanz auf allen Niveaus prüfen, wenn da etwas steht wie: "und geben sie das Signifikanzniveau an" Bei "einfachen" Fragen mache ich das auf Basis des angegebenen Signifikanzniveaus.
Was ist hier jetzt richtig ?
Hier *1 vergessen, weil DV?
hier muss aber kein cp oder ? man das ist so kompliziert aber bestimmt total einfach
Bei solchen Interpretationen solltest du IMMER c.p. und durchschnittlich schreiben. Das habe ich allerdings leider vergessen.
Ok danke😊
und hier?
View 7 more comments
Es ist doch so, dass wir mit der Nullhypothese testen ob ein Zusammenhang vorliegt oder nicht. Die Nullhyp wird aber immer umgekehrt formuliert, sprich wenn wir wissen wollen ob die temperatur Einfluss auf den Eisverkauf hat, dann formulieren wir die Nullhypothese anders herum nämlich quasi " die Temperatur hat KEINEN Einfluss auf den Eisverkauf (Beta=0). Wenn wir nun die Nullhypothese ablehnen, dann sagen wir damit quasi dass es nicht keinen Einfluss gibt. Sprich wenn ein hoher t wert dazu führt dass wir die nullhyp ablehnen, dann bedeutet das im Umkehrschluss dass unsere Annahme dass zb die Temperatur Einfluss auf den Eisverkauf hat sehr wahrscheinlich stimmt. gleiches gilt für den P wert. Bin mir deswegen sicher dass b) hier nicht richtig gelöst ist. Kann aber auch nicht sagen ob das mit dem P, oder dem T- wert angekreuzt werden muss :o
Wenn der P-Wert bei 0,00001 liegt, würde es ja bedeuten, dass die Nullhypothesen mit einer Wahrscheinlichkeit von 99,999% abgelehnt werden kann. Bei einem T-Wert von 30, ist der Wert so hoch dass der P-Wert bei 0 liegt ( weil wie wir wissen ist der der t-wert in der Formel vom p-wert integriert und wenn man das ganze mal ausrechnet dann kommt man auf einen P-wert von 0 ) Und da ein P-wert von 0, bedeutet dass die Nullhypothese mit einer 100% Wahrscheinlichkeit abgelehnt werden kann, wäre dies höher als 99.999% und somit müsste die dritte Antwortmöglichkeit richtig sein.
Das sind aber auch die erwarteten durchschnittlichen Arbeitsstunden oder?
View 2 more comments
Ja, das solltest du tun 👍
Ging doch auch : die erwarteten Arbeitsstunden des Mannes betragen durchschnittlich (Zahl) cp
warum prozent? hier wird doch nicht von log gesprochen?
View 12 more comments
Korrekt. Also einfach nur an die Fälle halten und nicht zu viel rein interpretieren. Danke dir!!
Ja würde ich auch sagen. Man macht sich da immer zu viel Kopf.
Ist es immer so, dass die Regression welche mit beiden Variabeln durchgeführt wird, zu einem signifikanten Ergebnis führt? Heißt, wenn in der Aufgabe stünde "wie würden sie ein nicht signifikantes Ergebnis interpretieren", wäre es umgekehrt, also ohne beide Variabeln?
Also: Wir lehnen die Nullhypothese auf dem 5% SI ab?
View 16 more comments
Anonyme Nudelsuppe, nein die Nullhypothese immer als erstes aufschreiben. Das steht ja auch in der Fragestellung meistens als erstes, dass du die aufstellen sollst.
Aber muss man hier jetzt im Durchschnitt und c.p. schreiben oder nicht ?
Es geht um genau zu sein um deutsche beschäftigte nicht um Arbeitnehmer
fehlt hier nicht auch c.p ?
Leider ja 👍 Das solltest du immer mit aufschreiben.
Worauf wirkt sich heteroske... sich aus?
View 2 more comments
Dass der Schätzer verzerrt ist z.B.. Der SE steht ja zum Beispiel in der Formel für den t-Wert aber nicht in der für ß.
Und der SE ist ineffizient
No area was marked for this question
Wie kommt man in Aufgabe 2e) auf die 0,0108?
Funktion ableiten nach alter
warum ist das die Nullhypothese und nicht beta 1 und beta 2 ungleich 0?
Weil wir eine verbundene Hypothese haben und dort den f Test anwenden, steht so im Skript oder in der Übung :)
Die Nullhypothese testet immer nur Nicht-Signifikanz.
kann man hier auch schreiben: die nullhypothese kann auf allen Signifikanzniveaus abgelehnt werden ?
View 25 more comments
Klingt unschön, aber hoffe du verstehst es daraus
Sind nur meine persönlichen Lösungen 🙌🏻
wieso muss man das ausrechnen? das adj. r-squared ist doch gegeben im Regressionsmodell
View 4 more comments
Es gibt ja mehrere Wege, um das zu berechnen. Du kannst hier ja den wählen, der dir am besten gefällt.
Ach okay, das war eine zusätzliche Alternative :) Vielen Dank mal wieder ☺️
Muss man beta 0 immer mit berücksichtigen ?
Auf jeden Fall! Bei solchen Aufgaben immer.
wofür brauchen wir ß5?
View 7 more comments
Ich habe einfach die Variablen abgezählt. Das spielt aber auch keine große Rolle.
Ok dann halte ich mich damit nicht länger auf. Halte mich zu oft an unwichtigem auf 😩 wenn ich wieder eine irrelevante Frage stelle, sag gern Bescheid 😕
was hast du für SSR eingesetzt wenn es nicht gegeben ist?
Gar nichts. Ich habe da nicht die Werte für SSR und RSS berechnet, sondern den Wert des Verhältnisses.
mein fehler habe erst danach gesehen das es rechts weitergeht
muss man auch hier c.p schreiben ?
Solltest du tun👍
Warum nicht ESS:TSS
View 11 more comments
Glaube das ist der RSS wert 17883 @Danci
SSR=RSS
Warum ist das nicht wahr?
View 8 more comments
Das ist er eh nicht, weil er eine prozentuale Angabe ist.
Also Aussage wahr ?
Wo finde ich das mit den 4% ?
welche zahlen hat man da genommen?
View 1 more comment
bei der Klausur ws 17/18 hat jemand noch die linke seite des konfinezniveu dazu addiert. Muss man das hier nciht machen?
das wurde da nur gemacht, weil da coeff und t wert jeweils gefehlt haben
ist das immer so ?
View 1 more comment
Okay danke :-)
Und was wenn das statt mindestens höchstens stehen würde?
was wäre denn richtig?
View 6 more comments
ist r2=0.9 richtig?
im Crashkurs von Kaiserberg wurde auch R^2 als richtig angekreuzt :)
könnte mir eventuell einer erklären was genau Coef. , Std. Erreichen. , t, in der Tabelle bedeuten ?
View 19 more comments
ja das wäre super :) @yannick
Yannick, ich hoffe du hast mit deinem Wipäd Studium später auch wirklich vor Lehrer zu werden. Du wärst eine Bereicherung für alle Schüler. 🙏🏼👍🏼
wieso nimmt man hier beta1 und beta2?
weil das die beiden Variablen der Verbrechensrate sind, auf die man testen muss
weil es in der Aufgabenstellung um die Verbrechensrate geht
Kann man auch schreiben ,,Frauen arbeiten ..... weniger als Männer, c.p.‘‘?
View 1 more comment
Frauen arbeiten im Durchschnitt xx Stunden weniger pro Woche als Männer CP
Ooooder
habe eine frage: wenn der t-wert niedrig gewesen wäre, wäre es dann wahr?
Ist hier Regionalvariablen richtig? Nennt man das so?
In der Übung haben wir die so genannt, deshalb denke ich schon, dass der Begriff auch hier passt.
Ich denke die wurden in der Übung so genannt, da es um Regionen ging ost süd West usw ?
ich verstehe nicht ganz warum keineHS nicht in der Regression vorkommt weil es eine Dummyvariable ist. Weil FH und Uni ja auch dummyvariablen sind und dennoch in der Regression auftauchen.. könnte mir das jemand erklären?
View 7 more comments
eine frage, also nur weil keinHS, uni und fh verallgemeinert und es im Prinzip das selbe ist nehmen wir sie nicht auf in der Regression. und ist es gut wenn die variablen linear zueinander stehen und bedeutet es nur weil sie lineart sind es auch keine Varianz gibt?
Keep it simple. Wenn eine weitere Dummy variable kommt, wird die Annahme, dass es keine perfekte multikollinearität gibt, verletzt. Deswegen kommt die variable keinHS nicht in die Regression
hast du es dir nicht viel zu umständlich gemacht? du hättest einfach ess durch tss teilen müssen oder nicht?
View 3 more comments
Yannicks Methode ist halt für die anderen Klausuren besser, wenn du kein tss o.ä. gegeben hast
sehe ich auch so
Was wäre denn ein signifikantes Ergebnis und der perfekte fit?
wieso quadriert, die Formel ist ohne hoch 2 angegeben?
Dann schau dir nochmal die Definitionen von den Variablen an.
In der Übung wurde der Vergleich mit dem p-Wert gemacht. Ist das egal, ob wir das mit dem t- oder p-Wert machen?
View 1 more comment
Wie würde das denn mit dem p- Wert aussehen?
Du vergleichst den p-Wert mit der Grenze von 0,05. Hier gilt: p < pkrit Wenn der errechnete p-Wert größer als die Grenze ist, lehnst du die Nullhypothese ja nicht ab.
Hab ich als richtig markiert.
Nein, da R^2 den Anteil der Varianz misst, der durch unser Modell erklärt wird.
R^2 ist richtig. Je höher der Anteil der erklärten Varianz von Y durch X desto mehr kann X das Verhalten bzw. die Veränderung von Y erklären!
Müsste es hier nicht falsch sein? -...,welches den wahren parameter in 5% (und nicht 95%) aller Fälle enthält
View 2 more comments
gute frage!
Das Intervall basiert ja auf ß1. ß1 wiederum basiert auf den Durchschnitten aus der Stichprobe. Damit ist das Intervall zufällig.
Dumme Frage aber : Woher weiß ich denn, dass ,,alter2“ nicht-linear ist ? Ich hätte intuitiv einfach ,,alter“ genommen. 🙈 Und kann mir zufällig auch jemand erklären wofür ,,alter2“ überhaupt steht ? Also wozu brauche ich das alter quadriert in der Regression ?
Weil alter2 Die einzige nicht lineare Variable ist. Eben weil es quadriert ist
Das ist das einzige Polynom in der Schätzung
Warum ist das falsch?
Push
weil er nicht um Einheiten steigt sondern %
Könntest du evtl auch noch die Klausurlösung von WS 17/18 hochladen ??
View 1 more comment
kannst du lieber die Lösung für WS1819 hochladen die jetzigen sind so unschlüssig. Wäre dir echt verbunden wenn du es machen könntest!
Ich würde das ja sofort machen aber ich habe keine vollständige Lösungen dazu erstellen können.
Müsste der Wert hier nicht 2,88 betragen- sprich das ein AN mit Uni Abschluss 2,88 Stunden im Durchschnitt pro Woche mehr arbeiten, als AN mit FH Abschluss?
View 1 more comment
Wieso muss man mit AN mit FH Abschluss vergleichen ? wieso nicht Personen mit Uni abschluss arbeiten durchschnittl. 5,08h mehr als Personen die gar keinen Abschluss besitzen. c.p.
Das ist einfach nur ein zusätzlicher Vergleich, den man machen kann. Ich weiß nicht, ob der auch zwingend notwendig ist.
Muss man hier noch c.p. hinschreiben? Und ist der Vergleich zu Arbeitnehmern mit FH Abschluss wichtig oder hätte es auch gereicht, wenn man nur schreibt, dass AN mit Uniabschluss 5,02 Stunden mehr arbeiten
View 3 more comments
wüsste ich auch gerne
Du schreibst bei allen Interpretationen c.p. hin. Das steht gut ceteris paribus und bedeutet "unter sonst gleichen Bedingungen". Gemeint ist damit hier, dass wir alle anderen Variablen gleich null setzen.
Wieso ist das wahr? Konfidenzintervalle sind doch keine zufälligen Intervalle oder?
View 8 more comments
@Anonym Nein, im Crashkurs wurde gesagt, dass es zufällig ist, weil die Konfidenzintervalle auf Stichproben basieren, die ja zufällig sind und auch zufällig sein müssen.
Lol wieso hab ich das als falsch, dann hab ich mich vertan danke😂
ist hiermit gemeint x und y sind iid?
View 3 more comments
yannick könntest du vielleicht mal im sachzusammenhäng erklären was E(u/x=x) = 0 bedeutet?
Dass die Abweichungen von der Regressionsgeraden nach oben und unten zusammen null ergeben. Das ist dadurch gegeben, dass du die Gerade ja so durch die Stichproben zeichnest, dass die durchschnittliche Abweichung minimal ist.
kann das jemand erklären bitte?
View 1 more comment
Kommt es hierbei nicht auf die Art der Stichprobe an? Was wäre wenn es eine Gleichverteilung wäre und die Wahrscheinlichkeit von jedem einzelnen Ereignis die selbe wäre (Würfel 1/6 zb). Dann können wir der Aussage nämlich nicht zustimmen. In der Aufgabe steht nichts von Zufallsstichprobe drin.
Du kannst tatsächlich Annahme in der Klausur treffen. Wenn man sich da unsicher ist, schreibt man das so dazu und gut ist.
Was steht im Index von t?
CRIM²
Ergänzung: Unter allen gleichbleibenden Bedingungen (c.p.)
Könnte man hier auch schreiben: Personen die mindestens ein Kind unter 6 Jahren haben, arbeiten im Durchschnitt 2,47h weniger pro Woche als Personen mit älteren oder gar keinen Kindern? Oder soll man da keine Referenzgruppe nennen & wenn, welche wäre die richtige?
Stimme auch eher deiner Antwort zu. In den Übungen haben wir auch immer eine Referenzgruppe gehabt in den Antwortsätzen )
Könnte man hier auch schreiben, dass es keinen linearen Zusammenhang von dem Alter und den gearbeiteten Stunden gibt, weil die Variable Alter ein Polynom ist und somit automatisch für Nichtlinearität steht?
View 1 more comment
Die Antwort von Währungswechsel ist m. M. nach richtig- wenn anstatt Alter Kriminalitätsrate geschrieben wird.
Ja habt recht, hab die Aufgabe verwechselt 🤦🏼‍♀️ da müsste Kriminalitätsrate stehen
No area was marked for this question
wie komme ich auf die 0,0108 bei 2e?
Du leistest alter² ab.
warum diese richtig? welche Seite Folie relevant?dank sehr
Siehe Kapitel 5 Folie 19
Wieso leitet man hier nicht die Gleichung nach crime ab? In den Übungen hat man das auch gemacht.
View 1 more comment
wieso denn Arbeitsalter? Gehts hier nicht um Kriminalität?
Ich hatte die Antwort jetzt auf die einzige Aufgabe bezogen, in der man ableiten musste. Für einen Signifikanztest habe ich noch nie abgeleitet meine ich 🤔
Muss ich denn, um sagen zu können dass dies der Fall ist (also das der Preis tatsächlich sinkt wenn der Anteil der alten Häuser steigt) auch prüfen ob eine Signifikanz vorliegt so wie hier drunter bei RM?
Nein, weil diese Aussagen ja alle c.p. gelten. Deshalb schreibt man das dazu.
Müsste das nicht falsch sein? Es heißt doch kleiner-GLEICH bzw. größer-GLEICH - Das "Gleich" fehlt hier doch..
View 4 more comments
Ich verstehe das leider nicht kann das einer vielleicht mit anderen Worten erklären
Wenn du ein Intervall ausrechnest, dann ist das eingeschlossenes Intervall, d.h. [0.4,0.5]. Beide Grenzen fallen also mit in das Intervall. Deshalb muss es kleiner-gleich heißen.
woher weiß ich das es signifikant bzw. nicht signifikant ist, wenn ich es mit dem pwert prüfe ?
View 3 more comments
Also vergleiche ich den p-Wert hier jeweils mit 0,1 & 0,05 & 0,01 und er ist statistisch signifikant von Null verschieden, wenn er kleiner als einer dieser Werte ist?
Richtig
Müsste das nicht eigentlich richtig sein, da es ja die prozentuale Veränderung angibt und die kann ja nur von 0 bis 1, sprich von 0 bis 100% sein?
Man könnte doch auch eine Veränderung von 1,1% , 1,2% usw. haben
woher weisst du das von stunden pro Woche gesprochen wird ?
in der Aufgabenstellung steht bei der Erklärung für die Variable "Stunden" =gearbeitete Stunden pro Woche :)
ist das die Berechnung für (0,025 0,975) aus der Tabelle ?
Ja 0,025 ist ja die untere Grenze des Konfidenzintervalls und 0,975 die obere. Also beides für das 5%-Signifikanzniveau.
Warum 86,3$?
View 1 more comment
kann man sagen das der medienwert sinkt wegen dem ``-`` vor den 0,0863 ??
Genau 👍
woher kommen die 1,96
View 2 more comments
Wenn nichts anderes steht, wird immer auf dem 5% SN getestet, ansonsten kannst du das auch oben beim KI ablesen [0.025 -0.975] (2,5 nach links, 2,5 nach recht =5)
Ich habe bisher aber auch noch keine Situation gesehen, in der man wirklich nicht auf das Signifikanzniveau schließen konnte👍
wozu hast du das jetzt gemacht? uns interessieren doch nur die 0,5812 oder nicht?
View 10 more comments
Das sind die Anzahl an Regressoren
bzw. deine Betas
Ist das adj r-squared?
Ist es 👍
und wohin gehört dann das R^2 in der Tabelle
Kann einer erklären wieso das richtig ist?
Sieh dir dazu am besten mal das Skript bzw die Mitschriften aus der Vorlesung an. Da haben wir das hergeleitet.
Was steht hier?
Der fit beider Regressionen wird verglichen. Damit ist das R^2 gemeint.
Danke:)
Wie würde denn hier der F-Test dafür aussehen?
View 6 more comments
Vielen Dank! 😊
Im Skript gibt es ein Beispiel👍
Wir können Ho ablehnen und heißt das nicht, dass wir Hinweise finden?
View 3 more comments
Sry ich komme ebenfalls mit den Begrifflichkeiten durcheinander. Wir können H0 ablehnen; heißt das im Umkehrschluss, dass wir einen Nicht -linearen Zusammenhang vorliegen haben oder?
Den nichtlinearen Zusammenhang hast du so oder so. Dass wir H0 ablehnen bedeutet, dass dieser Zusammenhang signifikant (verschieden von null) ist.
Ich das ist Falsch: Lehne die Nullhypothese bei einem Signifkanzniveau von 5% ab, wenn der p-Wert kleiner als 0,05 ist oder, alternativ, wenn |t act| > 1, 96.
View 2 more comments
Ja
Der Wert kann dann nicht mehr als "nur" zufällig angesehen werden.
wieso crim^2 und nicht das normale crim?
View 8 more comments
sorry für die blöde frage, aber was heisst hier genau "signifikanter einfluss"?
Ein Einfluss, der aller Wahrscheinlichkeit nach (je nachdem bei welchem Signifikanzniveau) nicht Null ist. Wir nennen das dann signifikant verschieden von Null.
hätte das jetzt W gemacht...
Der wahre Parameter, d.h. der Parameter der Grundgesamtheit, ist keine Zufallsvariable, weil der nicht von der Stichprobe abhängt.
wieso hat man hier mit 10%SN vergliechen ?
View 1 more comment
wie ich das jz verstanden habe, wenn man das auf das 10% Niveau nicht ablehnen kann dann kann man auf das 1% und 5% auch nicht ablehnen
Das ist richtig. Und daraus folgt meine Antwort.
wie kommt man auf diesen wert?
View 2 more comments
aber wieso hat man genau alter2 abgeleitet und nicht alter ?
Man kann nicht festlegen, dass man nur nach den Polynomen einer Variablen ableitet. Das habe ich hier auch nicht gemacht. Ich habe ganz allgemein partiell nach alter abgeleitet und und im ersten Kommentar bloß erklärt, wie ich auf den neuen Koeffizienten gekommen bin.
der hat doch 2 Kinder also wieso mal 1?
Das ist eine Dummyvariable, die 1 annimmt, wenn er mindestens 1 Kinde unter 6 Jahren hat.
danke
Kannst du das erklären?
Du führst zwei Regressionen durch: Eine mit den beiden in der Nullhypothese angeführten Variablen und eine ohne. Dann setzt du die errechneten Werte (z.B. SSR) in die Formel ein und vergleichst anhand des gegebenen kritischen Wertes. Die Bewertung erfolgt analog zum t-Wert. Man kann außerdem die R^2 beider Regressionen vergleichen, wobei der höhere Wert der bessere ist.
Danke 👍
fehlt hier nicht die 1-
Dieser Teil steht ja vorne mit in der Klammer.
,,... gegeben, dass alle anderen Voraussetzungen konstant bleiben.‘‘ oder?
Genau Das habe ich nur nicht extra aufgeschrieben. Diese Annahme treffen wir ja implizit bei fast jeder Interpretation.
müsste man hier nicht beide "Alters-Variablen" berücksichtigen und dementsprechend den F-Test anwenden? :)
Das wäre der Fall, wenn nach einem gemeinsamen signifikanten Effekt aller Altervariablen gefragt wäre. Hier sollten wir nur den Effekt der nichtlinearen Variablen prüfen.
warum vergleichst du es mit 1.96 und nicht 2,58?
Wegen des 5%-Signifikanzniveaus.
Warum nutzt man hier nicht alter sondern alter zum quadrat um den t-wert zu berechnen?
Weil es darum geht einen nichtlinearen signifikanten Effekt zu identifizieren. Und alter^2 ist halt der einzige nichtlineare Faktor.
Okay danke dir Yannick :)