Standardwerte

 

 

 

 

 

 

EDButton2

EDButton2

EDButton2

EDButton2

entwicklungsdiagnostik.de

EDButton2

 

 


Sie befinden sich hier:
 


   entwicklungsdiagnostik.de > Testdiagnostik >
 

 

 

 

 

 

Test A-Z | Testgüte | Standardwerte | Empfehlung
 

 

 

 

 

 

 

 

 

 

 

Durchfuehrung ET 6-6

Entwicklungsdiagnostik

 

 

Argumentieren mit Standardwerten

Viele Testverfahren legen Normwerte zur Beurteilung individueller Befunde vor. Ein in der Testung erzielter Ergebniswert wird mit den Normwerten verglichen und interpretiert. Als mögliche Formen von Ergebniswerten müssen zunächst Rohwerte von standardisierten Werten (Standardwerten) unterschieden werden.

Rohwerte beziehen sich in aller Regel auf Punktwerte, die sich aus einer Zuordnungsvorschrift des Tests ergeben. Dies kann zum Beispiel die Anzahl richtiger Antworten, die Anzahl gelöster Aufgaben in einem Intelligenztest oder bei mehrkategoriellen Antworten (z.B. bei Persönlichkeitstests mit einer Skala jeweils von 0 [trifft gar nicht zu] bis 5 [trifft stark zu]) ein durch Summation gewonnener Punktwert sein. Rohwerte können herangezogen werden

  • in Bezug auf die Erreichung eines Grenzwerts (auch Cut-off-Wert),
  • als Basis unterschiedlicher Kategorien (z.B. unterdurchschnittlich, durchschnittlich, überdurchschnittlich) oder
  • als Grundlage weiterer Umrechnungen (Transformationen), zum Beispiel in standardisierte Werte.
     

Standardwerte haben den Vorteil, dass sie einfacher als Rohwerte interpretiert werden können.

  • Beispiel: Eine Person hat einen kurzen Intelligenztest bearbeitet und sechs von zehn Aufgaben richtig gelöst. Dies suggeriert auf den ersten Blick ein gutes Intelligenzniveau, was jedoch zu vordergründig und falsch sein kann. Denn der Einblick in die Normwerte offenbart uns, dass bei der Normierung des Verfahrens alle Personen zumindest fünf, und sogar die große Mehrzahl der Personen mindestens sechs der Aufgaben korrekt lösen konnten. Eine Überführung des Rohwerts “6” in einen standardisierten Wert wie zum Beispiel den Prozentrangwert von “10” (grob zu interpretieren mit “90%” der Personen der Normierungsstichprobe haben mehr Aufgaben gelöst) oder einen Wert, der noch deutlicher als ein Prozentrangwert auf die Verteilung der Normwerte Bezug nimmt, wie zum Beispiel der Intelligenzquotient (es wird ein IQ-Wert von 80 ermittelt), deuten dann hier auf ein eher unterdurchschnittliches Ergebnis.

In diesem Beispiel kann man mit den Hintergrundinformationen eindeutig erkennen, dass der Rohwert allein noch keine Basis zur Beurteilung des IQ darstellt. In der psychologischen Testdiagnostik begegnen uns immer wieder bestimmte Ergebniswerte, von denen die wichtigsten in den folgenden Abschnitten beschrieben werden.

 

Grenzwerte (Cut-off-Werte)

Häufig werden kurze, einfache Verfahren im Sinne eines Screenings eingesetzt, um eine grobe Klassifizierung vorzunehmen. Im Allgemeinen wird lediglich eine Unterscheidung in zwei Klassen (z.B. auffällig vs. unauffällig) angestrebt. Ein Beispiel dazu:

  • Beispiel: Ein Fragebogen erhebt Ängstlichkeit anhand von 20 Aussagen (z.B. “Ich traue mich oft nicht, mit anderen Kindern zu sprechen.”), die entweder mit “ja” (trifft zu) oder mit “nein” (trifft nicht zu) beantwortet werden sollen. Die Auswertung erfolgt dann folgendermaßen: Für jede Ja-Antwort wird ein Punkt vergeben, für jede Nein-Antwort gibt es null Punkte. Der Rohwert besteht nun aus der Summe der erzielten Punkte, der mögliche Wertebereich für den Rohwert erstreckt sich somit von null (keine Frage mit “ja” beantwortet) bis 20 Punkte (alle Fragen mit “ja” beantwortet).
    Eventuell liegen nun inhaltlich begründbare Interpretationen vor: Aus der Kenntnis heraus, dass eine bestimmte Häufung von Angstsymptomen auf das Vorliegen einer Angststörung deutet, wird davon ausgegangen, dass ab zehn Punkten eine Angststörung vorliegt. Vielleicht liegen aber auch empirische Befunde vor. Der Fragebogen wurde zum Beispiel an 1000 Kindern normiert, und es ergab sich eine Verteilung. Abbildung 7 in Petermann und Macha (2005b) verdeutlicht, dass bis zu einem Rohwert von zehn 10 Ja-Antworten die Anzahl der Kinder kontinuierlich zunimmt, um danach bis zu einem Rohwert von 14 Punkten wieder abzunehmen. Ab dem Punktwert von 14 nimmt die Zahl jedoch wieder etwas zu, um dann ab einem Punktwert von 15 kontinuierlich zu sinken. In unserem Beispiel argumentieren die Testautoren nun wie folgt: Der zweite Gipfel der Verteilung kennzeichnet ein eigenständiges Störungsbild, das durch eine Ballung angstbezogener Symptome gekennzeichnet ist. Dieses Symptombild hat die Eigenschaft, dass es weitere Symptome nach sich zieht, im Sinne einer „Selbstverfestigung“. Somit ist der zweite Gipfel der Verteilung begründet durch die Prägnanz des Störungsbildes, womit ein Grenzwert für eine Angststörung vor dem zweiten Gipfel, somit ab einem Punktwert von 14 festgesetzt wird. In diesem Beispiel erfolgt eine Orientierung an der Verteilung, wobei inhaltliche Überlegungen bei der Festlegung des Grenzwertes mit einbezogen wurden.

 

Bei der Bildung von Grenzwerten kann man sich jedoch auch ausschließlich an der Verteilung orientieren. Unterstellen wir, dass sich bei dem Angstfragebogen eine Verteilung ergeben hätte, wie sie Abbildung 8 in Petermann und Macha (2005b) zeigt. Es ist zunächst aus der Form der Verteilung kein markanter Wert oder Wertebereich abzuleiten, der Ängstlichkeit im klinisch bedeutsamen Sinn kennzeichnen würde, es liegt eine eingipflige Verteilung vor. Dennoch lässt sich statistisch argumentieren. Unter der Annahme, dass der Fragebogen tatsächlich in der Lage ist, ein breites Spektrum von Ängstlichkeit (von gar nicht ängstlich bis sehr stark ängstlich) abzubilden, wird folgende Entscheidungsregel formuliert: Ein im klinischen Sinne ängstliches Kind wird sich immer am äußeren Rand des Wertebereichs (viele Ja-Antworten) befinden. Somit wird diejenige Anzahl an Ja-Antworten, jenseits derer die 5% ängstlichsten Kinder lagen, als Grenze festgelegt. In diesem Beispiel liegt die 5%-Grenze bei 18 Ja-Antworten, die 10%-Grenze entsprechend bei 17 Ja-Antworten. Auch hier wird man natürlich empirische Erkenntnisse nie völlig außer Acht lassen: Die Tatsache, dass eine klinisch bedeutsame Angstsymptomatik bei etwa 10% aller Kinder in Deutschland vorliegt, gibt natürlich den Handlungsspielraum bei einer Grenzziehung vor.
Im Idealfall sollen massiv ängstliche Kinder möglichst gut identifiziert werden, ebenso sollten Kinder ohne Angst korrekt erkannt werden. Dabei können unterschiedliche Ziele verfolgt werden. Sollen ängstliche Kinder mit großer Sicherheit auch tatsächlich als auffällig erfasst werden, wird man den Grenzwert eher weit setzen (ca. 10%), auch wenn bei einem solchen Vorgehen nicht-ängstliche Kinder irrtümlich zunächst als ängstlich eingestuft werden könnten. Dieses Vorgehen wird eher in der klinischen Praxis angewandt, bei so genannten Such- oder Fangtests. Anders würde man vorgehen, wenn man sicherstellen möchte, dass die als ängstlich identifizierten Kinder auch wirklich eine Angststörung aufweisen. In diesem Fall würde man eine engere Grenze ziehen (ca. 5%), mit dem Risiko, dass einige tatsächlich ängstliche Kinder als nicht-ängstlich befundet werden. Ein solches Vorgehen könnte zum Beispiel sinnvoll sein, wenn besonders stark betroffene Patienten besonders schnell einer Behandlung zugeführt werden sollen.
Das Ausmaß, in dem ein Test auffällige Personen auch tatsächlich auffindet, kennzeichnet seine Sensitivität. Gelingt dies in allen Fällen, so ist die Sensitivität eines Verfahrens 1, gelingt dies in keinem Fall, so ist die Sensitivität des Verfahrens 0. Das Ausmaß, in dem klinisch unauffällige Personen auch tatsächlich als klinisch unauffällig erfasst werden, wird durch die Spezifität ausgedrückt: Gelingt dies immer, so ist die Spezifität 1, gelingt dies nie, so ist die Spezifität 0.
Innerhalb gewisser Grenzen lässt sich eine dieser beiden Größen vom Testentwickler immer recht groß halten, wenn er den gegenteiligen Fehler riskiert: Um die Sensitivität zu steigern, werden also die Grenzen für Auffälligkeit vergleichsweise eng gesetzt. In unserem Beispiel mit dem Angstfragebogen könnte der Grenzwert bei zum Beispiel 19 Ja-Antworten festgelegt werden, wodurch mit großer Wahrscheinlichkeit alle identifizierten Kinder auch tatsächlich massiv ängstlich sind. Dieses Vorgehen geht jedoch zulasten der Spezifität, da somit gleichfalls sehr viele Kinder als nicht besonders ängstlich eingeschätzt werden, die es dennoch sind. Im Gegensatz dazu läuft eine zu weiche Grenzsetzung (z.B. bei 12 Ja-Antworten) darauf hinaus, dass wohl fast alle unauffällig befundeten Kinder auch tatsächlich unauffällig sind (Spezifität wird hoch), aber eben auch viele der als auffällig Beurteilten (Sensitivität ist gering).
Für eine gute Differenzierungsfähigkeit eines Screeningverfahrens benötigt man sowohl eine hohe Sensitivität als auch eine hohe Spezifität, für beide Parameter sind möglichst hohe Werte anzustreben. Auf der Grundlage von allgemeinen Konventionen sollten in der psychologischen Diagnostik sowohl die Sensitivität als auch die Spezifität einen Wert von 0.8 nicht unterschreiten. Liegen solche Kennwerte für die Sensitivität und die Spezifität nicht vor, ist davon auszugehen, dass der Test nicht hinreichend genau das misst, was er messen möchte.

 

Einige der gebräuchlichsten standardisierte Werte

In der Testpsychologie werden Standardskalen verwendet. Mit diesen Standardskalen ist es möglich, die relative Position eines untersuchten Kindes unmittelbar in Bezug auf eine Vergleichstichprobe kenntlich zu machen. Standardskalen setzen zunächst einen empirisch gewonnenen Bezugsrahmen voraus: Es wurden Daten an einer großen Stichprobe von Kindern erhoben, und mit den vorliegenden Informationen Ergebnisse interpretiert. Alle im Folgenden beschriebenen Skalen setzen den Ergebniswert zunächst zum Mittelwert einer Verteilung (ist der Ergebniswert größer oder kleiner dem Mittelwert?) und danach zu der ermittelten Streuung (um wieviel ist das Ergebnis größer oder kleiner als der Mittelwert?) in Beziehung. Die folgende Grafik zeigt einige der gebräuchlichsten Standardskalen.

Standardskalen2

Die in der Abbildung aufgeführten Standardwerte (IQ-Skala, C-Skala, Z-Skala, T-Skala) folgen einer ähnlichen Gesetzmäßigkeit: es wird zunächst der Mittelwert der Verteilung lokalisiert; dieser Stelle der Verteilung wird ein Skalenwert zugeordnet, der Mittelwert wird mit einem Zahlenwert “benannt”. Die IQ-Skala ordnet dem Mittelwert der Skala den IQ-Wert “100” zu, die C-Skala entsprechend den C-Wert “5”, die Z-Skala den Z-Wert “0” und die T-Skala den T-Wert “50”. In einem nächsten Schritt wird nun die Orientierung an der Streuung der Verteilung vorgenommen: Es wird der Bereich zwischen dem Mittelwert und der Standardabweichung der Verteilung aufgegriffen und je nach Skala in unterschiedliche Skaleneinheiten unterteilt. Die IQ-Skala zum Beispiel unterteilt den Bereich zwischen Mittelwert und einer Standardabweichung entfernt vom Mittelwert in jeweils 15 Skaleneinheiten. Somit drückt ein IQ-Wert von 85 eine Intelligenzleistung aus, die um eine Standardabweichung vom Mittelwert nach unten abweicht, ein IQ-Wert von 70 kennzeichnet eine Abweichung vom Mittelwert um zwei Standardabweichungen nach unten. Die C-Skala legt den Abstand der Standardabweichung vom Mittelwert mit zwei Punkten, die Z-Skala mit einem Punkt und die T-Skala mit zehn Punkten fest.
Jede der beschriebenen Skalen ermöglicht es, die Richtung und das Ausmaß einer Abweichung vom Mittelwert anhand des Skalenwerts zu quantifizieren. Eine gute Orientierungshilfe liefern dabei die Prozentangaben unter der Normalverteilungskurve. Sie geben an, wie groß der Anteil der Personen der Grundgesamtheit (z.B. einer Normierungsstichprobe) ist, die sich im jeweiligen Leistungsbereich befinden. Im Bereich zwischen -1 und +1 Standardabweichung um den Mittelwert befinden sich insgesamt 68,2% aller Personen, also gut zwei Drittel. Im Bereich zwischen -1 und -2 sowie zwischen +1 und +2 Standardabweichungen vom Mittelwert entfernt befinden sich jeweils 13,6% aller Personen. Zwischen -2 und -3 sowie +2 und +3 Standardabweichungen finden wir jeweils noch 2,1% aller Personen, und jenseits der Grenzen von -3 sowie +3 Standardabweichungen nur noch jeweils 0,1%.
Weiter besteht Übereinkunft darüber, wie eine Leistung in bestimmten Bereichen zu interpretieren ist. Der Bereich zwischen -1 und +1 Standardabweichung vom Mittelwert wird üblicherweise als der Durchschnittsbereich oder auch Normalbereich (~68,2%) bezeichnet, ein IQ-Wert von 92 oder ein T-Wert von 45 sind somit als durchschnittlich zu bewerten. Liegt ein Ergebniswert um mehr als eine, aber nicht mehr als zwei Standardabweichungen vom Mittelwert entfernt, spricht man je nach Richtung von einem unterdurchschnittlichen oder einem überdurchschnittlichen Ergebnis (je 13,6%). Der unterdurchschnittliche Bereich wird auch häufig als Risikobereich aufgefasst. Ein C-Wert von zwei ist somit als unterdurchschnittlich, ein IQ-Wert von 122 als überdurchschnittlich zu bewerten. Abweichungen von mehr als zwei Standardabweichungen vom Mittelwert werden als weit unterdurchschnittlich oder als weit überdurchschnittlich (je 2,2%) bezeichnet. In Bezug auf Intelligenzleistungen kennzeichnet zum Beispiel der weit unterdurchschnittliche Bereich dasjenige Leistungsspektrum (IQ < 70), das als Intelligenzminderung oder als geistige Behinderung bezeichnet wird. Der weit überdurchschnittliche Bereich (IQ > 130) kennzeichnet den Bereich, der allgemein mit Hochbegabung assoziiert ist.

[Der Text auf dieser Seite ist ein Auszug aus Petermann & Macha, 2005b]

 

Entwicklungstest: Primäremotionen

Entwicklungstest: visuomotorische Koordination

Entwicklungstest: Explorationsverhalten

Entwicklungstest: Handlungsstrategien

Entwicklungstest: Ganzkörperkoordination

entwicklungsdiagnostik.de: Navigation

 

 

 

 

Google
 


 

 

 

 

 

 


Seitenanfang
 

 

 

EDButton2

EDButton2

update entwicklungsdiagnostik.de/standardwerte

EDButton2

© 2007 Thorsten Macha

EDButton2