23 Karten

Nach Pawlik (2006) können folgende 10 Datenquellen und Erhebungstechniken skizziert werden:

1. Biographische und Aktuardaten2. Verhaltensspuren3. Verhaltensbeobachtung4. Verhaltensbeurteilung5. Ausdrucksverhalten6. Interview7. Projektive Tests/Verfahren8. Objektive Tests9. Fragebogen10. Psychophysiologische Diagnostik

Biographische und Aktuardaten

umfassen sozio-demographische Daten, wie Alter, Geschlecht, Familienstand und Beruf einer Person, die reaktionsobjektiv er-fasst werden können. Auch andere objektive Daten zur Lebensgeschichte, der Schul- und Berufsbildung oder auch die Krankengeschichte zählen zu dieser Da-tenquelle. Biographische und Aktuardaten können mit speziellen biographischen Fragebögen, in einem sogenannten anamnestischen Interview oder durch Rückgriff auf bestehende Aktenquellen erhoben werden. Pawlik (2006) ordnet biographische und Aktuardaten der Modalität „Verhalten“ zu. Verhalten ist hier in einem weiten Wortsinn zu verstehen, was z.B. für den Familienstand und die Schul- und Berufs-bildung noch nachvollziehbar ist, da mit diesen Informationen bestimmte Verhal-tensweisen einhergehen. Das Alter und das Geschlecht lassen sich zwar schwer als „Verhalten“ auffassen, jedoch können diese Informationen bestimmte alters- und geschlechtstypische Verhaltensweisen indizieren – allerdings nur sehr allgemein und grob.

Verhaltensspuren:

sind direkt beobachtbare Nachwirkungen (Produkte) menschlichen Verhaltens. Solche Nachwirkungen sind zum einen am äußeren Er-scheinungsbild einer Person direkt beobachtbar: An einer Person, die mit Turnschu-hen bekleidet, verschwitzt und außer Atem aus dem Wald kommt, sind Spuren des Verhaltens „Laufen“ sichtbar. Zum anderen fallen intentionale Verhaltensprodukte, wie z.B. Zeichnungen oder andere im weitesten Sinne künstlerische Werke in diese Datenquelle. Verhaltensspuren entstehen oft aber auch mehr oder weniger zufällig,so z.B., wenn man sich den Zustand eines Kinderzimmers nach einer Geburts-tagsparty oder den Arbeitsplatz eines Studierenden ansieht. Psychologisch interes-sant ist, dass Verhaltensspuren mit Persönlichkeitsmerkmalen assoziiert sein kön-nen. So ist es plausibel anzunehmen, dass das Verhalten einer hoch gewissenhaften Person Spuren in ihrem Arbeitsbereich hinterlassen wird, z.B. einen aufgeräumten und ordentlichen Schreibtisch. Ein solcher Schreibtisch kann für andere Personen wiederum als Hinweis für die Gewissenhaftigkeit des Besitzers dienen. Vor dem Hintergrund solcher Überlegungen zeigten Gosling und Kollegen (2002) einer Gruppe von Fremdbeurteilern die Büroräume von unbekannten und nicht anwesen-den Zielpersonen. Nach dem Besuch der Büros schätzten die Fremdbeurteiler be-stimmte Persönlichkeitsmerkmale der Besitzer (Zielpersonen) ein. Die Besitzer der Büroräume schätzten dieselben Persönlichkeitsmerkmale zudem selbst ein. Es re-sultierten substanzielle Übereinstimmungen, d.h. Korrelationen zwischen der selbst- und fremdeingeschätzten Offenheit, Gewissenhaftigkeit und Extraversion. Die Selbst- und die Fremdeinschätzungen dieser Eigenschaften waren zudem mit bestimmten Merkmalen bzw. Verhaltensspuren in den Büroräumen korreliert, die ein anderes Team von Beobachtern registriert hatte, z.B. mit der Farbigkeit (Offen-heit, Extraversion) und der Ordentlichkeit (Gewissenhaftigkeit).

Verhaltensbeobachtung:

ist ein unmittelbar einleuchtender Begriff, weil wir auch im Alltag aktiv beobachten können, was andere tun. Wissenschaftliche Ver-haltensbeobachtung ist im Gegensatz zur Alltagsbeobachtung aber methodisch kon-trolliert und systematisiert, muss sich an bestimmten Gütekriterien messen lassen und ist zumeist mit einer weiterführenden quantitativ-statistischen Analyse der pro-tokollierten Verhaltensdaten verbunden. Das zu beobachtende Verhalten umfasst alle visuell und akustisch wahrnehmbaren Aktivitäten und Veränderungen des Zu-stands einer Person, z.B. Körperbewegungen, Laut- und Sprachäußerungen, aber auch physiologische Reaktionen, z.B. Erröten oder Schwitzen. Verhalten kann von einer Person selbst oder von einer anderen, „fremden“ Person beobachtet werden. Im ersten Fall spricht man von Selbstbeobachtung, im zweiten Fall von Fremdbe-obachtung. Wissenschaftliche Verhaltensbeobachtungen sind in der Regel soge-nannte reduktive Deskriptionen (vgl. Mees, 1977), die sich auf bestimmte, theore-tisch relevante Beobachtungseinheiten (Kategorien, Verhaltensklassen) beschränken. Mehrere solcher Beobachtungseinheiten oder Kategorien bilden ein sogenanntes Zeichensystem, wenn nur bestimmte, aber nicht alle Verhaltensweisen interessieren und beobachtet werden. Ein Kategoriensystem zielt dagegen darauf ab, jede Verhaltensweise innerhalb einer gegebenen Verhaltensstichprobe durch Beobachtung zu erfassen. Die Handhabung und Anwendung eines Kategoriensys-tems muss innerhalb eines Beobachtertrainings eingeübt werden. Beobachtung im Sinne reduktiver Deskription bedeutet dann, durch das Zeichen- oder Kategorien-system definierte Verhaltensweisen zu identifizieren und den unterschiedlichen Ka-tegorien des Beobachtungssystems zuzuordnen. Dabei muss genau und eindeutig definiert sein, welche Verhaltensweisen zu welcher Beobachtungskategorie gehö-ren. In einem vom Autor entwickelten Beobachtungssystem zur Registrierung von Verhaltensindikatoren für Redeangst ist z.B. die Kategorie „Verlegenheitsgesten“ folgendermaßen definiert: „Die Probandin fasst sich an die Nase, ins Haar, ans Ohr, die Brille oder kratzt sich.“

Verhaltensbeurteilung:

betrifft mehr oder weniger subjektive und summari-sche Einschätzungen und Bewertungen der Häufigkeit, Intensität und Ausprä-gungsform des eigenen Verhaltens oder des Verhaltens anderer Personen. Wenn eine Person ihr eigenes Verhalten einschätzt, dann tut sie dies auf der Basis menta-ler Repräsentationen des zumeist bereits vergangenen Verhaltens. Aber auch die Beurteilung des Verhaltens anderer Personen basiert auf mentalen Repräsentatio-nen, da das Verhalten nicht im Hinblick auf einzelne Mikroaspekte registriert und in diesem Sinne gemessen, sondern summarisch eingeschätzt wird, nachdem das Verhalten einer fremden Person u. U. über längere Zeiträume hinweg wahrgenom-men wurde. Verhaltensbeurteilungen geben im Gegensatz zu Verhaltensbeobach-tungen nicht oder zumindest nicht so genau vor, auf welche Mikroaspekte des Ver-haltens die Aufmerksamkeit fokussiert werden soll. Verhaltensbeurteilungen lassen sich von Verhaltensbeobachtungen abgrenzen, je mehr subjektive Wertungen und Interpretationen in die Verhaltensbeurteilung eingehen (vgl. Ellgring, 1996). Letz-teres ist z.B. immer dann der Fall, wenn die Abstufungen einer Ratingskala nicht quantitativ definiert sind (wie häufig ist „häufig“ oder „manchmal“, wie lange ist „kurzdauernd“) und wenn wenig verhaltensnahe Beurteilungseinheiten zugrunde liegen: Anstelle der Kategorien „Blickkontakt“ und „Versprecher“ könnte das Ver-halten bei einer öffentlichen Rede z.B. auch im Hinblick auf „Unsicherheit“ oder „Souveränität“ eingeschätzt werden, z.B. auf einer numerisch und verbal veranker-ten Skala: 0 = gar nicht – 1 = etwas – 2 = ziemlich – 3 = sehr unsicher (bzw. mit derselben Skala, aber in einem eigenen Item: 0 = gar nicht – 1 = etwas – 2 = ziemlich – 3 = sehr souverän). Verhaltensbeurteilungen basieren häufig auf solchen abstrak-ten und auch komplexeren Merkmalen. Die notwendigen subjektiven Interpretatio-nen bei der Einschätzung komplexer Merkmale nutzen – positiv gewendet – die menschliche Fähigkeit, Verhaltensindikatoren zu „verschmelzen“ und integrierend zu interpretieren (vgl. Langer & Schulz v. Thun, 1974).

Ausdrucksverhalten:

wird von Pawlik (2006) als eigene Datenquelle gelistet, obwohl es auch der Verhaltensbeobachtung oder –beurteilung hätte zugeordnet werden können. Ausdrucksverhalten umfasst solche Variationen der Mimik (Ge-sichtsausdruck), der Stimme und Sprechweise sowie der Ganzkörpermotorik, in de-nen sich Gefühle, Stimmungen und Affekte äußern. Auch die Handschrift als Ver-haltensspur zählt zum Ausdrucksverhalten. Rückschlüsse auf die Persönlichkeit können aus (bestimmten Merkmalen) der Handschrift jedoch nicht abgeleitet wer-den; wohl aber verändert sich die Handschrift in der Regel unter Stress und spiegelt damit eine bestimmte aktuelle Befindlichkeit wider. Ein international verbreitetes Beobachtungssystem zur Registrierung der mimischen Muskelbewegungen ist das Facial Action Coding System (FACS), das 1976 von Ekman und Friesen erstmals vorgelegt und seitdem kontinuierlich weiterentwickelt wurde. Im FACS sind meh-rere sogenannte Action Units (AUs) definiert. Es handelt sich dabei um kleinste, gerade noch sichtbare mimische Veränderungen bzw. Bewegungseinheiten, z.B.Heben der Augenbraue innen (AU1), Zusammenpressen der Lippen (AU23) oder Runzeln der Kinnhaut (AU17). Wichtig ist, dass diese Action Units zunächst ohne Bewertung objektiv erfasst werden. Erst in einem zweiten Schritt werden die Action Units dann mit Hilfe eines Auswertungsprogramms bestimmten Emotionen zuge-ordnet. Grundlage für diese Zuordnung ist Ekmans Annahme, nach der die Aus-drucksformen bestimmter Primäremotionen wie Angst, Wut und Ekel biologisch determiniert sind und damit universell gelten. Diese Annahme ist nicht unumstrit-ten. Ekman und Friesen selbst konnten aber in einer Reihe von Studien zeigen, dass zumindest bestimmte Primäremotionen, z.B. Angst, Wut und Ekel kulturübergrei-fend erkannt und richtig interpretiert werden. Die Handhabung des FACS ist sehr aufwändig und erfordert ein langes Training.

Interview:

Neben der standardisierten Beobachtung gilt das Interview als zweiter traditioneller Königsweg zumindest innerhalb der psychologischen Diag-nostik. Das Interview ist nämlich in der psychologischen Berufspraxis das am häu-figsten eingesetzte diagnostische Instrument (vgl. Kici & Westhoff, 2000). Ein In-terview ist eine zielgerichtete mündliche Kommunikation zwischen einem oder mehreren Befragern und einem oder mehreren Befragten, wobei eine Informations-sammlung über das Verhalten und Erleben der zu befragenden Person(en) im Vor-dergrund steht (Keßler, 1999). Interviews können im Hinblick auf den Wortlaut, die Anzahl und Abfolge der Fragen mehr oder weniger standardisiert sein. Dasselbe gilt für die Antwortmöglichkeiten des Probanden, das Verhalten des Interviewers und die Auswertung. Je nach dem Grad der Standardisierung werden verschiedene Interviewformen unterschieden. Bei einer freien Exploration sind nur einige wenige Fragen bzw. „Aufträge“ festgelegt (z.B. „Erzählen Sie mir Ihr Leben!“), mögliche Nachfragen hängen vom Verlauf der Exploration ab. In einem halbstrukturierten Interview sind dagegen einzelne Bereiche und Fragen festgelegt, die auf jeden Fall abgehandelt werden müssen, zusätzliche Nachfragen sind natürlich erlaubt. Stan-dardisierte Interviews werden z.B. in der Diagnostik psychischer Störungen einge-setzt. Hier sind die Fragen und deren Abfolge genau festgelegt und der Interviewer hat u.U. auch die Aufgabe die Antworten zu kodieren, um z.B. den Schweregrad eines Symptoms zu quantifizieren. Dass das Interview eine derart beliebte Methode in der Praxis und auch schon bei Studierenden ist, liegt vermutlich auch an der ver-meintlichen Einfachheit dieser diagnostischen Methode. Fragen stellen kann schließlich jeder. Ein Interview zu konstruieren, durchzuführen und auszuwerten, so dass valide Daten resultieren, ist aber viel komplexer und schwieriger als einen Fragebogen vorzulegen und auszuwerten. In einer Interviewsituation laufen Pro-zesse auf mehreren Ebenen ab. Der Interviewte und der Interviewer nehmen sich gegenseitig wahr, stellen Hypothesen auf und nehmen implizit Beurteilungen vor. Dabei spielen die wahrgenommene(n) Macht, Kompetenz und Absichten des Inter-viewers und auch des Interviewten eine Rolle. Sozialpsychologisch gesehen können Prozesse der Ersteindrucksbildung und Stereotype wirken, etwa wenn eine noch relativ junge Interviewerin eine ältere Person interviewt. Motivationspsychologisch können Bedürfnisse nach Kontrolle und Komplexitätsreduktion, Selbstdarstel-lungstendenzen, aber auch Interesse relevant sein. Emotionale Gestimmtheiten wieInterview wiI9M2LfFWoOmOUxI+ Angst, Sympathie, Argwohn u.a., aber auch habituelle Tendenzen, also Persönlich-keitsmerkmale wie z.B. soziale Ängstlichkeit, Selbstwertschätzung oder soziale Kompetenzen können Einfluss auf die Interviewsituation nehmen. Konkret wird der Interviewte mehr oder weniger über folgende Fragen nachdenken: Was geht hier vor? Was will man von mir? Wie soll ich mich am besten verhalten? Warum will der Interviewer bestimmte Dinge wissen?

Projektive Tests

oder vorsichtiger formuliert projektive Verfahren geben mehrdeutiges Reizmaterial vor (z.B. abstrakte Klecksbilder, mehrdeutige Bilder von Personen, frei gestaltbares Spielmaterial u.a.), die von Probanden bearbeitet, d.h. interpretiert, ergänzt oder gestaltet werden sollen. Projektive Verfahren sind im Kontext der Psychoanalyse bzw. Tiefenpsychologie entstanden und sollen helfen, sogenannte Abwehrmechanismen (vgl. psychoanalytisches Paradigma) zu umge-hen und Zugang zu wichtigen psychologischen Informationen (z.B. Konflikte, Im-pulse) ermöglichen, die den Probanden nicht bewusst sind. Der Wert projektiver Verfahren ist ziemlich umstritten und wird in den meisten Lehrbüchern als eher niedrig eingeschätzt. In der Tat sind die klassischen Gütekriterien, also Objektivität, Reliabilität und Validität, bei vielen projektiven Verfahren nicht gegeben. Weil pro-jektive Verfahren in der Praxis aber nach wie vor zum Einsatz kommen, muss sich jeder Psychologie-Studierende mit dieser Datenerhebungsmethode auseinanderset-zen, um im konkreten Fall Argumente anführen zu können, warum ein bestimmtes projektives Verfahren nicht verwendet wird oder aber doch. Denn es wäre falsch, projektive Verfahren als vollkommen unbrauchbar zu bewerten, da sie in der Praxis gerade in der Arbeit mit Kindern eine nützliche Hilfe zur Exploration oder Kontakt- und Beziehungsanbahnung sein können. So enthält z.B. der Sceno-Test Spielmate-rial (Puppen, Bausteine etc.), das gerade für Kinder einen hohen Aufforderungscha-rakter bietet und einen indirekten Weg darstellt, über das Spiel Hypothesen über mögliche Probleme zu generieren, die dann freilich mit anderen diagnostischen Me-thoden genauer untersucht, erhärtet und möglicherweise auch wieder verworfen werden müssen. Zudem spielen projektive Verfahren, insbesondere der Themati-sche Apperzeptionstest, in der Forschung zur impliziten Machtmotivation eine wichtige Rolle (Winter, 1973; Schultheiss & Pang, 2007). Implizite Motive sind im Gegensatz zu expliziten Motiven nicht bewusst repräsentiert (McClelland et al., 1989) und können deshalb auch nicht mit Hilfe von Verfahren erfasst werden, die einen solchen bewussten Zugang voraussetzen (z.B. Fragebögen).

Objektive Tests

Pawlik (2006) bezeichnet objektive Tests als an Testgütekri-terien überprüfte Stichproben z.B. von Leistungsaufgaben, über die eine Verhal-tensstichprobe der untersuchten Person im interessierenden Merkmal erhoben und ausgewertet wird. In diesem Sinne wäre ein Intelligenztest ein objektiver Test und manchmal werden auch diagnostische Verfahren, die Persönlichkeitsmerkmale mit Hilfe von Fragebogen erheben, als Persönlichkeitstests bezeichnet (vgl. z.B. Bräh-ler et al., 2002). Es gibt aber noch eine andere Variante von objektiven Tests, die auf Raymond B. Cattell zurückgeht und solche Verfahren meint, deren Messinten-tion für den Probanden nicht per Augenschein erschließbar ist, die also “undurch-schaubar” sind. Der Test soll damit "unverfälschbar” z.B. im Sinne sozialer Er-wünschtheit sein. Wenn in einem Fragebogen ein Item vorgelegt wird wie z.B. „Ich empfinde häufig Furcht und Angst.“, dann ist ziemlich offensichtlich, welches Merkmal damit erfasst werden soll und der Proband kann seine Antwort in dieje-nige Richtung verzerren, die er für günstig hält. Ein Beispiel für einen objektiven Test sensu Cattell ist der Subtest “Flächengrößen Vergleichen” aus der Testbatterie Arbeitshaltungen von Kubinger und Ebenhöh (1996). Es handelt sich dabei um ei-nen Test, der computergestützt administriert wird und mit dem ein kognitiver Stil, nämlich “Impulsivität vs. Reflexivität” undurchschaubar erfasst werden soll. Im-pulsivität vs. Reflexivität ist die Tendenz, in Problemsituationen entweder schnell und fehlerreich bzw. langsam und fehlerarm zu arbeiten. 20 Items mit jeweils zwei Flächen müssen in 30 Sekunden verglichen werden. Reflexive bearbeiten in dieser kurzen Zeit zwar nur wenige Items, aber machen dabei wenige Fehler. Impulsive bearbeiten dagegen viele oder sogar alle Items und machen dabei vergleichsweise viele Fehler. In den letzten Jahren hat es in der Forschung eine Renaissance der Entwicklung und des Einsatzes von solchen objektiven Tests gegeben (vgl. Ortner et al., 2007).

Fragebogen:

In einem Fragebogen ist also keine offene Beantwortung vorgesehen wie in einem Interview. Zudem werden die Antworten auf einzelne Fragen in der Regel nicht für sich ausgewertet und interpretiert, sondern es werden stets die Antworten auf eine größere Zahl von Fragen oder Feststellungen nach bestimmten statistischen Prinzi-pien in einem einzigen Messwert zusammengefasst. Fragebögen sind die am häu-figsten eingesetzte und bevorzugte Methode zur Erfassung von Persönlichkeits-merkmalen sowie Motivations- und Interessensvariablen. Der Fragebogen kennzeichnet in der Klassifikation von Pawlik eindeutig eine Erhebungsmethode und keine Datenquelle. Die einem Fragebogen zugrunde liegende Datenquelle ist in den meisten Fällen die Selbsteinschätzung der eigenen Persönlichkeitsmerkmale. Fragebögen können aber auch herangezogen werden, um die Persönlichkeitsmerk-male von anderen Personen einschätzen zu lassen. In diesem Fall sind Fremdein-schätzungen die Datenquelle.

Psychophysiologische Diagnostik.

Veränderungen des Erlebens und Verhal-tens kovariieren mit organismischen Variablen, z.B. mit dem Blutdruck, der Herz-frequenz, der Ausschüttung bestimmter Hormone und der Aktivität in bestimmten Hirnarealen. Wer zum ersten Mal vor einer größeren Gruppe von fremden und sta-tushöheren Personen eine Rede halten soll, der wird die dabei in der Regel auftre-tende Aufregung auch körperlich spüren, wobei nicht alle organismischen Verän-derungen bewusst werden. Psychophysiologische Daten betreffen solche im weiten Sinne körperlich-organismischen Veränderungen und werden mit Hilfe elektrophy-siologischer Registriermethoden (elektrodermale Aktivität; Herz-Kreislauf-Aktivi-tät; Muskelaktivität; Hirnaktivität) oder über biochemische Messgrößen (Hormon-spiegel im Blut, immunbiologische Analyse des Speichels, Messung der regionalen zerebralen Durchblutung oder des regionalen zerebralen Stoffwechsels) gemessen. In den letzten Jahren haben solche psychophysiologischen Maße und Erfassungs-methoden innerhalb des kognitions- und neuropsychologischen Paradigmas zent-rale Bedeutung gewonnen.

Pawlik (2006) klassifiziert die 10 Datenquellen nach den folgenden drei Kriterien

(a) der Datenmodalität, (b) der erfassbaren Varianz und (c) der Reaktionsobjektivi-tät.

Nach dem Kriterium der Datenmodalität wird unterschieden

ob es sich bei den Daten lediglich um mentale Repräsentationen des Erlebens und Verhaltens einer Person, um direkt beobachtbares Verhalten oder um psychophysiologisch erfass-bare Variablen handelt.

Unter erfassbarer Varianz wird klassifiziert

ob die Daten-quelle im Labor und/oder im Feld erhoben werden kann.

Die Reaktionsobjektivität

betrifft dagegen das Ausmaß, in dem eine Datenquelle durch Ziele, Werte und Ein-stellungen eines Probanden beeinflusst oder sogar verfälscht werden kann.

Eine frühere Klassifikation von Datenquellen, die Sie in vielen Lehrbüchern finden werden, stammt von Raymond B. Cattell (1958), der zwischen L-, Q- und T-Daten unterscheidet

Der Begriff „Test“, der bei den Klassifikationen von Datenquellen und Verfahren immer wieder auftaucht, wird in der Psychologie mehrdeutig verwendet

Einigkeit besteht lediglich darin, dass es sich bei einem Test um ein Verfahren zur Gewin-nung diagnostisch relevanter Daten handelt. In einem engen Sinn ist ein Test ein Verfahren, mit dem Daten unabhängig von den subjektiven Urteilen und Einschät-zungen der Probanden erhoben werden können. Lediglich Fähigkeits- und Leis-tungstests sowie objektive Tests im Sinne von Cattell (vgl. Cattell & Warburton, 1967), deren Messintention für einen Probanden nicht per Augenschein erschließ-bar ist, die also “undurchschaubar” sind, genügen diesem Kriterium. Dagegen lässt sich aus einer Definition von Lienert und Raatz (1998, S. 1) eine breitere Verwen-dung des Begriffs „psychologischer Test“ ableiten. Demnach handelt es sich bei einem psychologischen Test um

 

ein wissenschaftliches Routineverfahren zur Untersuchung eines oder mehrerer empi-risch abgrenzbarer Persönlichkeitsmerkmale mit dem Ziel einer möglichst quantitati-ven Aussage über den relativen Grad der individuellen Merkmalsausprägung

3 Klassen psychologi-scher Tests nach Bri-ckenkamp

Probleme der Veränderungsmessung

Das Hauptproblem ist wie bereits erwähnt die mangelnde Reliabilität der Differenz-werte. Bereits die einmalige Erfassung von psychischen Merkmalen ist generell mehr oder weniger messfehlerbehaftet und deshalb ungenau. Bei Differenzwerten verschärft sich die Messungenauigkeit, da in die Differenzen von zwei Messungen die Messfehlervarianzen beider Messzeitpunkte additiv eingehen. Dieser doppelte Messfehleranteil wirkt sich insbesondere dann reliabilitätsmindernd aus, wenn Pre- und Posttestmessung hoch miteinander korrelieren.

Die Reliabilität von Differenz-werten lässt sich nach der Formel:

In einem mit der Überschrift „In Defense of Difference Scores“ (S. 730ff.) verse-henen Abschnitt können Rogosa et al. (1982) allerdings zeigen, dass wahre Verän-derungen in einer Stichprobe auch dann sehr präzise gemessen werden können, wenn die Reliabilität der Differenzwerte nahezu 0 entspricht.

Die Reliabilität der Differenzen kann als ein Maß verstanden werden, das angibt, wie gut Personen auf der Basis ihrer Differenzwerte in eine Rangreihe gebracht werden können. Dies ge-lingt dann umso besser, wenn sich die wahren Differenzwerte deutlich unterschei-den, also bei hoher Streuung der Differenzwerte. Ist die Streuung der Differenz-werte niedrig, wird die Reliabilität der Differenzen ebenfalls niedrig ausfallen

Andere mit der Messung von Veränderun-gen verbundene Probleme wie z.B. die oftmals negativen Korrelationen zwischen Anfangswerten und Differenzwerten oder die Regression zur Mitte werden von Ro-gosa et al. ebenfalls diskutiert und in ihrem Problemgehalt relativiert

Insgesamt kommen Rogosa et al. zu Schlussfolgerungen, die den bisherigen kritischen und z.T. pessimistischen Sichtweisen zur Veränderungsmessung widersprechen: Diffe-renzwerte zwischen verschiedenen Messzeitpunkten liefern sinnvolle, unverzerrte Schätzungen für wahre Veränderungen, insbesondere wenn Daten nicht nur für zwei, sondern für drei oder mehr Messzeitpunkte vorliegen (vgl. auch Willet, 1989). Andere Veränderungsmaße, wie z.B. Regressionsresiduen, sind unter praktischen Gesichtspunkten zur Veränderungsmessung weniger geeignet. Somit können „klas-sische“ Verfahren, die auf individuellen Differenzmaßen basieren, wie z.B. t-Tests für abhängige Stichproben und Varianzanalysen mit Messwiederholungen, zur sta-tistischen Überprüfung von Veränderungshypothesen sinnvoll eingesetzt werden

Bernd Marcus (2003) hat gezeigt, dass sozial erwünschte Selbstbeschreibungen in Persönlichkeitsfragebögen, die im Rahmen der Eignungsdiagnostik eingesetzt werden, nicht wirklich so problema-tisch sind, wie gemeinhin angenommen wird.

Vielmehr zeugt es von rezeptiver Selbstdarstellungskompetenz, wenn ein Bewerber die Anforderungen der Situation und die Erwartungen der relevanten Entscheidungsträger zutreffend erkennt und sich dementsprechend darstellt. In Berufen, die viel Kundenkontakt und Emotions-bewältigung erfordern (z.B. Verkäufer, Flugbegleiter), ist Selbstdarstellungskom-petenz eine zentrale Anforderung. Wenn jemand in einem Fragebogen in der Lage ist, die relevanten Anforderungen zu erkennen, dann indiziert das möglicherweise, dass er oder sie das auch außerhalb des Fragebogens kann. Diese Hypothese könnte den empirischen Befund erklären, nach dem Selbstdarstellung – obwohl das ge-meinhin angenommen wird – die Validität verfälschbarer Persönlichkeitsfragebo-gen in der Personalauswahl nicht beeinträchtigt

Jetzt lernen