Data Mining

at Universität Augsburg

Join course
423
Discussion
Documents
Flashcards
Der Lehrstuhl veröffentlicht nicht zufällig eine allgemeine Notenverteilung oder so, oder? Hätte mich sehr interessiert wie dieses Fach im Durchschnitt ausfällt, da ich immer höre, dass es ziemlich schwer sei.
View 1 more comment
Oh man schade :/
Kann ich leider nur bestätigen. Und in der "Wiederholungsklausur" im Winter kommen immer extrem viele Exkurse und abseitige Sachen dran. Habe das letzten Winter geschrieben und es war hammer-hart!
Ergebnisse sind da
View 2 more comments
1,7
2,3
Hey! Ist das Fach machbar? Und kann man das halbwegs gut (=um zu bestehen) sich selbst beibringen? Vielen Dank im Voraus ✌🏼
View 1 more comment
Im WiSe wird die Übung leider nicht angeboten, aber ich versuche mal einfach 😅
Sehr gut machbar ja! Allerdings stimme ich oben zu. Die Übungen sind essentiell. Man muss auch viel mitschreiben. Ich würde wendern schauen ob da eine Mitschrift von jemanden bekommst oder es im nächsten SS machen
Wie fandet ihr die Klausur?
View 6 more comments
schade, hatte leider keine zeit mehr die angabe genau zu lesen :/
Ich fand’s ehrlich gesagt nicht ganz so fair. Die Zeit hat alle mal nicht gereicht und der Anspruch ist deutlich gestiegen im Vergleich zu den letzten zwei Klausuren. Mir war zwar bewusst, dass teilweise neue Sachen dran kommen, aber dass es dann doch so viel war nicht.
Ist etwas spät aber vll schaut ja noch jemand kurz rein: Was ist denn hier als Antwort gesucht, ist ja immer direkt die erste Fragen in den Klausuren: Prüfen Sie das Regressionsmodell hinsichtlich der Modellprämissen. Gehen Sie dabei auf genau drei unterschiedliche Modellanforderungen ein und nehmen Sie unter Einbezug der R-Plots entsprechend Stellung
Das sind die Modelanforderungen der Regression. Schau mal im VL-Skript F. 49 da stehen die sowie für die Multiple lineare regression auf F. 54. Im Übungsskript haben wir uns dazu dann noch die R-Plots dazu angeschaut und woran man diese Voraussetzungen erkennt und ob diese Verletzt wurden oder nicht.
vielen Dank!
Lohnt es sich noch anzufangen mit lernen?
Kann mir vielleicht jemand die Lösung von der Klausur WiSe 18/19 abfotografieren ( nur Aufgabe 1 c) ?
H0: b_accl=0 H1: b_accl=!0 p=0.03288>=0.01 --> Keine signifikante abweichung zu H0 für signifikanzniveau a=0.01=1% wenn dein p < alpha (signifikanzniveau (hier 1% also 0.01)) ist, kannst du H0 zum signifikanzniveau von alpha ablehnen wenn p>=alpha, gibt es keine sign. abeichung von H0 hoffe es hilft dir noch
Kurze Frage zu der Hyphosenbildung: Wie komme ich da nochmal drauf? Das es abgelehnt wird weiss ich schonmal
View 5 more comments
Anonyme Pistole Bist du dir sicher das das nur b heißt oder b Dach? Bin mir unsicher 🙈
heißt nur b und nicht b dach
Denkt ihr es ist eine 2 drin,wenn ich nur mit beiden Altklausuren reingehe?
Puhhh. Das wird vielleicht knapp wenn neue Dinge dran kommen sollten. Aber wünschenswert wäre es schon 😅 für mich zumindest auch
Ich denke schon ;)
die letzten beiden klausuren waren schon sehr ähnlich von der aufgabenstellung her glaubt ihr man kann davon ausgehen, dass es wieder so sein wird ?
Ich hoffe schon. Aber was soll sich schon groß verändern?
Das glaub ich auch. Die letzten SS Klausuren waren ja auch ähnlich bei einigen Aufgaben, nur halt mit SPSS-Output. 🤔 Ich hoffe einfach ,dass die Klausur einfach fair ist 🙈🙏
Ist bei uns noch das CHART und CHAID Verfahren relevant?
Nein
alles klar danke
Kann mir vl jemand sagen, was Fall 2 hier bedeutet? Und ich suche doch das max, aber sind 1,5 und 4,6 nicht die kleinsten? Verstehe das grade nicht wirklich. Danke :)
View 1 more comment
vielen dank! :)
Ok ich stehe ehrlich gesagt immer noch auf dem Schlauch.. Kannst du das bitte nochmal anders formulieren Ananas? Wo genau muss ich hinschauen?
Wer nimmt morgen auch alles einen fetten Ordner mit zur Klausur?
Das kann doch nicht richtig sein? In der Angabe steht doch das die metrischen sowie die nominalen gleich gewichtet sind.
Man kann es aber auch so verstehen, dass die nominalen insgesamt genauso wichtig sind wie die metrischen. Ist ein bisschen doof formuliert.
Hmm ja du hast Recht ich hoffe das sie es morgen präziser formulieren ...
Was würdet ihr auf so eine Fragestellung antworten? (SOSE 18/19 2a)) "Erläutern Sie das Splitkriterium dieses Algorithmus explizit anhand des ersten Splits."
Was ist denn 1 Bias-Neuron?
View 1 more comment
Woher weiß ich denn, dass ich diesen auch mitzählen muss? in der SS 18 Klausur (Aufgabe 3, c)) haben wir den auch nicht mit einberechnet.
Ich denke, in R wird das nicht berücksichtigt
Was ist der Unterschied zwischen Improvement und CP Value?
View 1 more comment
Ach und noch eine Frage: wie denkst du wird dann die Klausurfrage lauten wenn das Improvement abgefragt wird? Bis jetzt stand ja immer CP value in Klammern ...
Ich glaube, dass die dann recht genau danach fragen - z.B. Verbesserung basierend auf dem vorherigen Konten
Wie kommt man auf die Kontingenztabelle?
Zu den Fusionierungsalgorithmen: Kann jemand allgemein erklären wann man sozusagen einen Cut setzt bei den verschiedenen Algorithmen? In der Übung sind wir mit dem Lineal vorgegangen und haben immer Striche durchgezogen aber irgendwie werde ich daraus nicht schlau.
Den Cut haben wir dann gesetzt, wenn lange "nichts passiert ist", d.h. die Distanz zwischen den Clustern vergleichsweise groß war und der Abstand zwischen vorheriger und nächster Fusionierung damit auch recht groß. Also wird dort angesetzt wo länger nicht fusioniert wurde. Wenn ich das richtig verstanden habe
Was bedeutet $xval auf Seite 99 im Übungsskript?
Was meint ihr, kommt etwas zu Netzwerkdaten dran?
Weiß jemand ab wann ein Gewicht als "schweres Gewicht" zählt und wann als ein "leichtes"? Bei der Netzzeichnung ist das ja wichtig..wir haben geschrieben das man das durch die Liniendicke zeigen soll..
Wir bekommen aber nur R-Outputs in der Klausur vorgelegt oder? Keine SPSS-Outputs wie in SS15 & SS16 oder?
Ne nur R. Alles mit SPSS ist irrelevant
Danke 😊
Hey könnte mir jemand netterweise die eingesetzte Formel von Übungsblatt 5 Aufgabe b) vom Gower Koeffizienten nennen? Finde die Lösung im R-Code nicht. Vielen Dank :)
View 1 more comment
Stimmt, genau es müssen 6 zahlen rein. Für Doppelbelichtung von Channel und Region müsste der Nenner so aussehen oder? : /(2+2+1+1+1+1) 2 für Channel 2 für Region 1 für Fresh 1 für Milk 1 für Grocery 1 für Frozen
bei gleichgewichtung müsste der nenner 6 sein und bei doppelter für kategorielle 8
Wie zeichne ich das ein?
View 1 more comment
Single Linkage: Punkt 3 und 4 verbinden, dass sind die beiden Punkte die am nähsten zusammen sind Complete Linkage: Punkt 2 und 10 verbinden, dass sind die beiden Punkte die am weitesten entfernt sind Für die euklidische Distanz einfach eine diagonale zwischen den Punkten ziehen. Für die Manhatten Distanz die Punkte eben "manhatten mäßig " mit einer Ecke verbinden. (So dass sich mit der Linie von der euklidischen ein Dreieck ergibt)
Dankeschön!!! 😊
Im klausur muss man irgend wo auch code schreiben ?
View 4 more comments
codieren ist schonmal was ganz anderes wenn dann meinst du implementieren
aber nein muss man nicht
Kann mir jemand die Seiten 183 und 184 aus dem Skript erklären. Sie meinte wir müssten diese zwei noch interpretieren können. Aber wie kommt man auf den Satz: „ Mit 364,5,104 und 33 Wohnungen in den einzelnen Klassen.“ Ich wäre wirklich dankbar für eine Antwort🙏🏼
View 4 more comments
Danke 🙏🏻
Kein Problem :))
Ist die Klausur erst seit diesem Semester open book?
Ich glaub im SoSe 18 war sie auch schon open book..
Hey, wisst ihr, ob das gesamte Skript klausurrelevant ist oder Teile ausgeschlossen wurden? :)
ich glaub bis 184
Alles relevant. Der Rest war zum Eigenstudium!
Welche genauen Anforderungen der lin. Regressionanalyse werden hier verletzt? Ausreißer, da stand. Res > 3.3, oder?