Strategien

 

 

 

 

 

 

EDButton2

EDButton2

EDButton2

EDButton2

entwicklungsdiagnostik.de

EDButton2

 

 


Sie befinden sich hier:
 


   entwicklungsdiagnostik.de > Entwicklungsdiagnostik >
 

 

 

 

 

 

Grundlagen | Zielsetzungen | Strategien | Gütekriterien
 

 

 

 

 

 

 

 

 

 

 

Entwicklungstest

Entwicklungsdiagnostik: Strategien

 

 

Zusammenfassung. Der Einsatz eines entwicklungsdiagnostischen Verfahrens setzt eine entwicklungsbezogene Orientierung des Anwenders voraus. In der Regel sollen vielfältige normale und abweichende Entwicklungsverläufe erfasst und die Entwicklung psychischer Störungsbilder beschrieben werden. Die Auswahl eines geeigneten entwicklungsdiagnostischen Verfahrens ist jedoch häufig schwierig vorzunehmen. Es wird ein Überblick über die theoretischen Annahmen, Testformen und die Qualität der Ergebniswerte verbreiteter deutschsprachiger allgemeiner Entwicklungstests gegeben. Somit erhält der Anwender eine Unterstützung bei der Einschätzung des Anwendungsbereichs dieser Verfahren.

Abstract. Developmental assessment must be based on a developmental point of view. Pediadricians have to measure various normal, deviant and dysfunctional patterns and pathways. Often selection of a suitable developmental test is difficult to justify. This article reviews theoretical assumptions, types and outcome of widely used german, general developmental tests, thereby helping practitioners evaluate scope and usability in a particular field or problem.

 

Einleitung

Unter der Bezeichnung Entwicklungstest finden sich einerseits diagnostische Verfahren, welche die Entwicklung eines Kindes in möglichst großer Bandbreite abbilden möchten (Allgemeine Entwicklungstests), andererseits spezifische Verfahren, die umschriebene Entwicklungsbereiche erfassen (z.B. Sprachtests, Motoriktests), zusätzlich sind Entwicklungsscreenings zu nennen. Der Beitrag stellt aktuelle und/oder verbreitete deutschsprachige allgemeine Entwicklungstests gegenüber, die sich oft trotz einiger Ähnlichkeiten zum Teil jedoch in erheblicher Weise unterscheiden. Dies trifft sowohl für die jeweiligen theoretischen Annahmen, noch mehr aber für die handwerklichen Konstruktionsmerkmale und die angestrebten Aussagen zu. So ist nicht jedes Instrument für jede Fragestellung gleich gut geeignet, und kein Verfahren kann für sich in Anspruch nehmen, universell anwendbar zu sein.

 

Aufgaben der allgemeinen Entwicklungsdiagnostik

Dem Einsatz eines allgemeinen Entwicklungstests können vielfältige Fragestellungen zugrunde liegen, die die ganze Bandbreite normaler und abweichender Entwicklungsverläufe umfassen. In der Regel kann man auf der Grundlage von Vorinformationen (medizinischen Untersuchungen, eigenen Beobachtungen, Gesprächen mit Eltern) bereits Annahmen formulieren, die man mit Hilfe der Entwicklungsdiagnostik überprüfen kann. In der Praxis häufig anzutreffende, oft ineinander übergehende Fragenkomplexe lauten etwa:

  • Ist überhaupt von Entwicklungsabweichungen auszugehen? Wie umfassend oder spezifisch sind diese Abweichungen? Welches Ausmaß haben sie?
  • Welche Defizite sollen und können gezielt angegangen werden und welche Ressourcen sind dabei dem Kind verfügbar?
  • Wie wirken sich bekannte, diagnostisch bereits abgeklärte Auffälligkeiten (Krankheiten, Störungen) zu verschiedenen Zeitpunkten auf den unterschiedlichen Dimensionen kindlicher Entwicklung aus?

Eine Abgrenzung von Normalität, Abweichung und Pathologie ist in Bezug auf Testleistungen häufig nur schwierig vorzunehmen. Normalität wird in Tests in der Regel von statistischen Entscheidungsregeln abgeleitet, die der Testkonstrukteur für den Anwender formuliert hat, sie kann aber durchaus auch (normen-unabhängig) aus der Kenntnis empirischer Zusammenhänge von bestimmten Verhaltensphänomenen und daraus resultierenden Beeinträchtigungen begründet werden. Wenn ein Kind mit 18 Monaten noch nicht frei geht, kann dies vielleicht als auffällig bewertet werden, weil zum Beispiel 95% der Kinder einer Referenzstichprobe dies bereits konnten (Normorientierung); man kann die Bewertung auffällig aber auch aus der Sachkenntnis ableiten, dass Kinder, welche mit 18 Monaten noch nicht frei gehen, mit erhöhter Wahrscheinlichkeit globale motorische Beeinträchtigungen entwickeln werden (Kriteriumsorientierung).
Zur Eingrenzung des Normal-Bereichs werden häufig Schwellenwerte (Cut-off-Werte) für Testwerte angegeben, die eine Leistungsgrenze markieren; ein Vorgehen, das der vielfach formulierten hohen Variabilität normaler Entwicklung zuwider läuft. Auch Kenngrößen wie Entwicklungsalter oder Entwicklungsquotienten sollen die Einschätzung eines Entwicklungsstands unterstützen, bergen aber die Gefahr von ungünstigen Interpretationen: wenn zum Beispiel ein fünfjähriges Kind Testleitungen zeigt, die durchschnittlich bereits von Dreijährigen erbracht werden (und somit einem Entwicklungsalter von drei Jahren entsprechen), liegt diesen Leistungen mit hoher Wahrscheinlichkeit eine deutlich verschiedene neuronale und funktionelle Basis zugrunde: das Fünfjährige zeigt zwar die gleichen Leistungen wie ein Dreijähriges, erbringt sie aber auf andere Weise!
Die Ansätze der allgemeinen Entwicklungsdiagnostik spiegeln verschiedene Denktraditionen, unterschiedliche Anwendungsgebiete sowie die Erfordernisse des jeweiligen Gesundheitssystems wider. Dabei sollten Entwicklungstests neben der Altersangemessenheit von Verhalten besonders auch das Veränderungspotential in Bezug auf Entwicklungsverläufe abbilden können.
Allgemeinen Entwicklungstests ist gemeinsam, dass sie jeweils ein breites Spektrum kindlicher Leistungen und Verhaltensweisen abbilden und die jeweiligen Testleistungen zum Lebensalter in Beziehung setzen. Dabei sind alle Testautoren bestrebt, den gesamten jeweils ins Auge gefassten Altersbereich lückenlos zu testen: für jedes Lebensalter sollen Testaufgaben (Items) zur Verfügung stehen, so dass jedes Kind unabhängig von seiner Position im Altersbereich in etwa gleich fair getestet und beurteilt werden kann. Die Erfüllung dieses vom Anwender formulierten Anspruchs wirkt jedoch in vielen Fällen der Qualität der Skalen entgegen. So gruppieren sich häufig entwicklungsneurologisch und –psychologisch gut begründbare und hinsichtlich ihrer Validität empirisch gut überprüfte Testaufgaben neben Lückenfüllern, die zwar von ihrer Schwierigkeit her an ihre Stelle im jeweiligen Test passen, deren Eignung zur aussagekräftigen Entwicklungsbeschreibung jedoch fraglich ist. Es wird also deutlich, dass aus den handwerklichen Erfordernissen der Testkonstruktion einerseits und den Ansprüchen der Anwender andererseits zwangsläufig Kompromisse resultieren.
Anhand der im Folgenden gegenübergestellten Verfahren können repräsentativ Unterschiede in den Vorannahmen und konstruktionsbedingte Besonderheiten aufgezeigt werden.

 

Zum Aufbau von Entwicklungstests

Ein Entwicklungstest lässt sich wie folgt charakterisieren:

  • anhand seiner theoretischen Vorannahmen,
  • der Auswahl der zu erfassenden Merkmale und die Auswahl der Aufgaben,
  • der technischen Umsetzung der Messung (Festlegung der Aufgabentypen, Präsentationsmodus) sowie
  • des technischen Prozederes der Auswertung (Ermittlung von Skalen- oder Gesamtwerten) sowie der angebotenen Interpretationsregeln.

Die diesbezüglich im Vorfeld jeweils vom Testkonstrukteur getroffenen Entscheidungen haben weitreichende Auswirkungen auf die Interpretationsmöglichkeiten der Testresultate. Wie weitreichend solche Festlegungen wirken, ist für den durchschnittlichen Testanwender häufig jedoch nur unvollständig zu überschauen.

 

Zum Konzept von Entwicklungstests

Von jedem psychologischen Test wird eine theoretische Fundierung seines Gegenstands verlangt. Leider liegt bis heute keine allgemein anerkannte, im Hinblick auf die Konstruktion eines Entwicklungstests ausreichend präzise Entwicklungsdefinition vor. Allgemeine Entwicklungsdefinitionen heben in der Regel auf lebenslaufbezogene, geordnete Veränderungsreihen oder -muster ab, ohne auszuführen, welche Veränderungen im einzelnen zu welchen Zeitpunkten des Lebens in welcher Art miteinander auftreten müssen, damit gewisse Zustände wie Normalität, Abweichungen oder spezifische Störungen anzunehmen sind. Folglich liefern uns die verschiedenen Entwicklungstests dann auch keinen einheitlichen Bezugsrahmen zur Begründung entwicklungsorientierter Diagnostik und Intervention.
Historisch bedeutsam sind an dieser Stelle die reifungstheoretischen Ansätze. Ihnen liegt die Vorstellung zu Grunde, dass Entwicklungsverläufe im Aufbau ihrer morphologischen, neurobiologischen, neurologischen und funktionellen Strukturen genetisch determiniert und somit weitgehend von Umwelteinflüssen unabhängig sind. Demzufolge müssten alle Kinder ähnliche, auf das Lebensalter bezogene, starre und invariante Abfolgen zeigen. Entwicklung schreite demnach von unreifen zu reifen Stufen fort, wobei das Auslassen einer Stufe unweigerlich zu gravierenden (pathologischen) Abweichungen in der hierarchischen Abfolge führt. Ein explizit auf diesen Annahmen beruhendes Verfahren stellten Gesell und Amatruda 1941 vor. Diese Autoren wollten allgemein gültige Gesetzmäßigkeiten kindlicher Entwicklung formulieren sowie entsprechende Altersnormen angeben.
Empirische Befunde deuten jedoch darauf, dass für die normale kindliche Entwicklung eine größere Variabilität anzunehmen ist, als es sich auf der Grundlage von Reifungskonzepten abbilden lässt. Somit ist zwar grundsätzlich von einer genetischen Prädisposition auszugehen, aber tatsächliche Entwicklungsverläufe reagieren adaptiv auf die individuellen Umweltbedingungen. Die Gene eröffnen und begrenzen hiernach die Anzahl möglicher Entwicklungsabfolgen, die konkret eingeschlagenen Pfade sind jedoch Ergebnis biopsychosozialer Wechselwirkungen.
Die Annahme großer Variabilität erschwert eine routinemäßige Entwicklungsbeurteilung jedoch erheblich. So darf zum Beispiel die Kenntnis, dass Kinder im Durchschnitt (zu 50%, ermittelt an einer großen Stichprobe) sich mit ca. 6 Monaten vom Rücken auf den Bauch drehen und durchschnittlich mit ca. 8 Monaten bei leichter Unterstützung sitzen können, nicht dazu verleiten, aus diesen Mittelwerten eine Entwicklungsreihe zu konstruieren. Eine solche ist nämlich sachlogisch nicht begründbar und empirisch widerlegt, da viele Kinder diese Fertigkeiten in der umgekehrten Reihenfolge erwerben. Bei den Kindern der Normierungsstichprobe des ET 6-6 war bei über 10% (n=10) der Kinder zwischen 4,5 und 9 Monaten (N=96) diese dem Gruppentrend „gegenläufige“ Entwicklungsfolge nachweisbar, obwohl zu jedem Alterszeitpunkt mehr Kinder sich drehen als unterstützt sitzen konnten.
In der Regel liegt Entwicklungstests kein einheitliches übergeordnetes theoretisches Bezugssystem zugrunde. Aus der jeweiligen Art und Weise der Messung und der angebotenen Interpretationen (!) kann jedoch indirekt auf die jeweilige Orientierung an einem entweder traditionellen, von Invarianz oder an einem modernen, von Variabilität gekennzeichneten Entwicklungsmodell geschlossen werden.

 

Die Bedeutung der Testform

Tests überprüfen die Entwicklung des Kindes anhand von Leistungen, von denen auf die Ausbildung von Kompetenzen geschlossen wird, deren Erwerb für das Lebensalter typisch und im Großen und Ganzen wünschenswert ist. In allen Entwicklungstests wird dabei eine Gliederung in Funktionsbereiche, Skalen oder Dimensionen vorgenommen. Dabei sind die jeweiligen Benennungen mit Vorsicht zu verwenden: weder lassen sich die Funktionsbereiche etwa auf neuropsychologisch beschreibbare Funktionen zurückführen, noch ist die Qualität der Skalen häufig ausreichend überprüft, vielmehr werden zur strukturierten Beschreibung von Leistungen meist inhaltlich plausible Bündelungen von Testaufgaben vorgenommen. Um den begrifflichen Unschärfen zu begegnen, werden wir diesbezüglich im Folgenden von Erfassungsbereichen sprechen. Etabliert haben sich in der allgemeinen Entwicklungsdiagnostik besonders Erfassungsbereiche, welche angelehnt sind an

  • Körpermotorik (Grobmotorik),
  • Handmotorik (Auge-Hand-Koordination, Visuomotorik),
  • Wahrnehmung,
  • kognitive Entwicklung,
  • Sprachentwicklung,
  • Sozialentwicklung,
  • emotionale Entwicklung und den
  • adaptiven Bereich (persönlicher Bereich, Alltagsfertigkeiten).

So lassen sich auch alle der in den hier besprochenen Verfahren vorhandenen Erfassungsbereiche (Skalen) den Unterpunkten der oben vorgenommenen Aufstellung zuordnen. Diese Untergliederung ist das Ergebnis historischer Entwicklungen und wird im weitgehenden Konsens von Experten als evident angesehen. Ebenso wie für den Entwicklungsbegriff als solchen gilt aber auch für die oben aufgeführten Entwicklungsbereiche, dass keine Theorie das bereichsspezifische Entwicklungsgeschehen erklären kann. Zwar können zum Beispiel umschriebene Aspekte der kognitiven Entwicklung oder der Sprachentwicklung theoretisch begründet werden, dennoch reichen diese spezifischen Theorien in keinem der hier näher betrachteten Verfahren, um die tatsächlich vorgenommene Aufgabenzusammenstellung zu fundieren. Vielmehr arbeiten die Testkonstrukteure dem Bedürfnis der Anwender nach lückenloser Abdeckung des gesamten Altersbereichs zu. In solchen Altersbereichen, in denen die theoretisch begründbare Itemdecke vergleichsweise dünn zu werden droht, werden Ergänzungen dann gelegentlich durch eher inhaltlich plausible, im Einzelfall auch aus der persönlichen klinischen Erfahrung des Testkonstrukteurs abgeleitete Aufgaben (bes. Münchener Funktionelle Entwicklungsdiagnostik, Entwicklungsgitter) vorgenommen.

 

Technische Umsetzung der Messung

Eine Minimalforderung an Entwicklungstests ist die mit dem Lebensalter kontinuierliche Verringerung der Aufgabenschwierigkeiten: mit zunehmendem Alter sollte also die Anzahl der Könner bzw. Löser einer Aufgabe ansteigen, wodurch dann auch die mittlere Gesamttestleistung einer älteren Altersgruppe höher ausfällt als bei einer jüngeren Altersgruppe (gerichteter Alterstrend).
Alle hier näher besprochenen Entwicklungstests erfassen die Ausbildung der Einzelfertigkeiten im Wesentlichen über Aufgaben, deren Lösungen bis auf wenige Ausnahmen zweikategoriell (gelöst vs. nicht gelöst; Fertigkeit vorhanden vs. nicht vorhanden) protokolliert werden. Auch wenn einige Tests zusätzliche Kategorien für Halblösungen oder Verweigerungen anbieten, wird doch grundsätzlich aus den gelösten Aufgaben das Ergebnis ermittelt. Innerhalb jedes Tests sind die einzelnen Aufgaben eindeutig jeweils einem Erfassungsbereich zugeordnet, auch wenn die inhaltliche Zuordnung zwischen den Tests zum Teil variiert: so wird zum Beispiel die Aufgabe Baut einen Turm aus ... (einigen) ... Klötzen bei den einzelnen Tests entweder ausschließlich der Handmotorik (Entwicklungsgitter, Denver Skalen, MFED), dem Bereich Auge und Hand (GES) oder der kognitiven Entwicklung (ET 6-6) zugeordnet. Bei vielen Verfahren ähneln sich die präsentierten Aufgaben. So sind gewisse elementare Fertigkeiten (wie z. B. das freie Gehen) Bestandteil aller für den jeweiligen Altersbereich ausgelegten Tests. Diese vermeintlichen Ähnlichkeiten suggerieren eine größere Vergleichbarkeit der Testergebnisse, als tatsächlich gegeben ist! Vielmehr sind die im nächsten Abschnitt beschriebenen Auswertungsmodi für die Qualität und Eigenschaften der Testwerte in weitaus höherem Maße prägend.
Neben der direkten Testung der Fertigkeiten sehen alle Tests in verschiedener Art und Weise den Einbezug der Elternauskunft vor (s.a. hier). Fast alle Verfahren beinhalten die Möglichkeit, bestimmte Items auch nach dem Elternurteil zu bewerten, die unmittelbare Testung kann also in einzelnen Fällen durch die Einschätzung der Eltern ersetzt werden. Weiter sehen der Wiener Entwicklungstest und der ET 6-6 ausdrücklich die Bearbeitung eines Elternfragebogens vor, um auf diese Weise besonders die Bereiche der Sozial- und der emotionalen Entwicklung abzubilden. Die Zuverlässigkeit der Elternauskunft hängt davon ab, inwieweit Eltern richtige Angaben überhaupt machen können und dieses auch wollen! Neben sprachlichen Problemen und inhaltlichen Verständnisschwierigkeiten können besonders auch bewusst manipulierende und unbewusst (z.B. durch Suggestionen) hervorgerufene Antworttendenzen die Entwicklungseinschätzung eines Kindes beträchtlich verzerren. Rennen-Allhoff, Allhoff, Bowi und Laaser (1993) weisen darauf hin, dass die Befundlage zur Einschätzung der Zuverlässigkeit elterlicher Angaben uneinheitlich ist. Gleichwohl stellt ab dem Vorschulalter die Elternbefragung für die allgemeine Einschätzung besonders des Bereichs sozialer und emotionaler Kompetenzen eine unverzichtbare Informationsquelle dar.

 

Auswertungsmodelle und Interpretationen

Grundsätzlich lassen sich die drei verschiedenen Testformen (1) Stufenleiter, (2) Testbatterie und (3) Inventar voneinander abgrenzen.

    Stufenleitern

    Von Stufenleitern sprechen wir an dieser Stelle, wenn innerhalb eines Erfassungsbereichs die Aufgaben ihrer Schwierigkeit nach in einer Reihenfolge angeordnet werden. Es werden dann aus dem Alter des Kindes Einstiegsregeln abgeleitet, so dass nicht alle Aufgaben einer Stufenleiter durchgeführt werden müssen, sondern entsprechend dem Alter von der Schwierigkeit passende (i.d.R. leicht unterfordernde) Items den Testeinstieg bilden. Im Anschluss daran werden die jeweils nächstschwierigeren Aufgaben präsentiert, bis das Kind an seine Leistungsgrenze gelangt und eine oder einige aufeinander folgende Aufgaben nicht mehr lösen kann.
    Ein besonderes Problem bedeutet bei Stufenleitern zunächst die Reihung nach der Aufgabenschwierigkeit. Solche Aufgabenreihungen gehen von einer starren Entwicklungsabfolge aus und sind häufig empirisch nicht zu belegen. Hinzu kommen rein technische Schwierigkeiten, die sich aus den Schwierigkeitsverläufen der einzelnen Aufgaben ergeben. Orientierung für eine Reihung nach den Aufgabenschwierigkeiten können zum Beispiel die Alterszeitpunkte liefern, zu denen 50% aller Kinder die entsprechenden Aufgaben lösen können. In einem konstruierten Beispiel könnte das für eine Aufgabe A der Alterszeitpunkt 12 Monate und für eine Aufgabe B der Alterszeitpunkt 13 Monate sein; demnach wäre also zunächst die Aufgabe A die leichtere und würde in der Stufenleiter vor der Aufgabe B platziert. Es kann jedoch nicht selbstverständlich davon ausgegangen werden, dass die Aufgabe A zu allen Zeitpunkten, bezogen auf das Lebensalter, die leichtere Aufgabe ist, denn tatsächlich ist empirisch zu beobachten, dass verschiedene Fertigkeiten sich in der Gesamtpopulation in unterschiedlichen Tempi manifestieren: in unserem konstruierten Beispiel könnten dann zum Zeitpunkt 14 Monate vielleicht 80% aller Kinder die Aufgabe A, aber bereits 90% aller Kinder die Aufgabe B lösen. Somit wäre Aufgabe B nun die leichtere und würde dem ursprünglich angewendeten Ordnungskriterium widersprechen.
    So weisen Brandt und Sticker (2001) auf die praktische Konsequenz hin, dass auch “... bei einer noch so sorgfältigen sequentiellen Anordnung der Testaufgaben...” es vorkommen kann, “... daß das normale Kind Aufgaben überspringt, d.h. schwierigere lösen kann, während einfachere in der Testreihenfolge noch nicht bewältigt werden ...”.
    Um solchen unmittelbar aus dem Konstruktionsschema eines Tests erwachsenden Ungenauigkeiten zu begegnen, werden die Testabbruchkriterien entsprechend weit gefasst. Je Stufenleiter erfolgt also ein Abbruch erst dann, wenn mehrere (z.B. mehr als zwei in der MFED 2-3) aufeinander folgende Aufgaben nicht gelöst werden können. Tatsächlich droht mit diesem Vorgehen jedoch lediglich eine zusätzliche Verwässerung.
    Die Leistungen des Kindes lassen sich im Sinne eines stufenleiterspezifischen Entwicklungsalters oder Entwicklungsquotienten ausdrücken. Je nach Auswertungsmodus lassen sich mit diesen Größen jedoch wiederum recht unterschiedliche Aussagen verknüpfen:
    Das Entwicklungsalter (EA) kennzeichnet, ob ein Kind gemäß seinem kalendarischen Alter Leistungen zeigt, die eher von älteren oder eher von jüngeren Kindern zu erwarten sind. Ziel einer Gegenüberstellung von Entwicklungsalter und kalendarischem Alter ist die Quantifizierung eines Entwicklungsvorsprungs (Akzeleration) oder eines Entwicklungsrückstands (Retardierung). So sind Fragen der Eltern oder von Kostenträgern („Wie weit ist es denn zurück?“) auch häufig bereits auf das Entwicklungsalter bezogen formuliert. Da den Ableitungen für die Entwicklungsalter jedoch in der Regel keine inhaltlich begründbaren Entwicklungsreihen zu Grunde liegen, müssen die Aussagen, welche mit „Entwicklungsaltern“ verknüpft werden sollen, sehr vorsichtig formuliert werden. Weiter nehmen „Nicht-„ oder „Halblösungen“ (s.o.) auf die Berechnung in den verschiedenen Verfahren zum Teil unterschiedlich Einfluss. Da zudem für die Stufenleitern häufig keine „echten Normen“ vorliegen (z.B. Entwicklungsgitter, MFED 1 und MFED 2-3), ist die Ableitung von Entwicklungsaltern also methodisch sehr fragwürdig.
    Die Berechnung eines Entwicklungsquotienten (EQ) setzt nicht unbedingt die Anwendung von Stufenleitern voraus, stellt aber gleichwohl häufig deren Ziel dar. Entwicklungsquotienten setzen die individuellen Leistungen zu den durchschnittlichen Leistungen gleichaltriger Kinder ins Verhältnis; in den meisten Fällen werden dabei Standardisierungen vorgenommen, die den EQ-Wert von 100 als Mittelwert setzen und eine Abweichung um eine Standardabweichung vom Mittelwert mit 15 Skalenpunkten abdecken.
    Ein Beispiel hierfür bilden die Griffiths-Skalen, die neben einem bereichsspezifischen Entwicklungsalter und einem Gesamtentwicklungsalter einen Gesamt-Entwicklungsquotienten ermitteln. Dabei ist jedoch wiederum der Aussagewert eines Gesamtentwicklungsquotienten in Bezug auf viele diagnostische Fragestellungen als eher gering einzuschätzen, da Beeinträchtigungen häufig spezifisch sind und somit die klinisch relevante Information nur aus einer Profildarstellung (separate Beurteilung des z.B. körpermotorischen, handmotorischen, kognitiven, sozialen etc. Bereichs) gewonnen werden kann.

     

    Testbatterien

    Unter einer Testbatterie verstehen wir eine Zusammenstellung von jeweils homogenen Einzeltests, die in ihrer Gesamtheit eine repräsentative Auswahl entwicklungsbezogener Merkmale abbilden wollen. Die Stärke von Testbatterien gegenüber Stufenleitern und Inventaren besteht in der Tatsache, dass jedes einzelne überprüfte Merkmal über eine größere Aufgabenzahl erhoben wird und somit also „genauer“ gemessen werden kann. Dieser erhöhten Messgenauigkeit der Untertests steht die zwangsläufig reduzierte Anzahl überprüfter „Entwicklungsqualitäten“ (entwicklungsbezogener Fertigkeiten) gegenüber. Jeder Untertest für sich erfasst also genau nur einen vergleichsweise eng umgrenzten Merkmalskomplex. Eine Testbatterie mit beispielsweise zwölf Untertests vermag somit also auch nur zwölf „Entwicklungsqualitäten“ abzubilden.
    Von den hier näher betrachteten Verfahren ist es der Wiener Entwicklungstest (WET), der die Entwicklungsbeurteilung auf der Grundlage einer Testbatterie vornimmt. Die Skalen des WET sind mit großer Sorgfalt konstruiert und entsprechen in ihrer handwerklichen Qualität von den hier besprochenen Verfahren gut den etablierten Standards für psychologische Testverfahren. Inwieweit jedoch Testbatterien den diagnostischen Ansprüchen in der allgemeinen Entwicklungsdiagnostik gerecht werden können, wird rege diskutiert. So überprüft zum Beispiel der WET die kognitive Entwicklung dreijähriger Kinder anhand der drei Untertests Muster legen, Gegensätze (Formulierung sprachlicher Gegensätze) und Quiz (Beantwortung von W-Fragen). Obgleich die Messung jedes Untertests die entsprechenden Teilfertigkeiten zuverlässig quantifiziert, kann doch die inhaltliche Repräsentativität dieser drei Untertests für die kognitive Entwicklung insgesamt im entsprechenden Altersbereich nur eingeschränkt angenommen werden.
    Als vorteilhaft erweisen sich Testbatterien aber in solchen Fällen, in denen die diagnostische Fragestellung bereits spezifiziert wurde und unmittelbar mit einem oder mehreren der Untertests eingegrenzt werden kann: wenn z.B. ein Kind zur Erfassung des allgemeinen Entwicklungsstands unter besonderer Berücksichtigung von Defiziten im Bereich der visuell-räumlichen Analyse vorstellig wird, so könnte dies mit einer Testbatterie, die diesen spezifischen Leistungsbereich auch durch einen Untertest repräsentiert, besonders ökonomisch abgeklärt werden.
    Für die Entwicklungsbeschreibung werden die in den Subtests des WET ermittelten Ergebnis-Rohwerte in C-Werte transformiert und auf diese Weise wird eine normorientierte Ergebnisinterpretation möglich (etwa: durchschnittliche vs. unterdurchschnittliche Leistungen). Durch die Zusammenfassung großer Leistungsbereiche in jeweils einem C-Wert (so wird z.B. eine Leistung mit einem Prozentrang von 16 ebenso wie eine Leistung mit einem Prozentrang von 30 zum C-Wert „3“ transformiert) und die Zuordnung mehrerer C-Werte zu einem Rohwert wird jedoch ein Teil der theoretisch möglichen Differenzierungsfähigkeit wieder aufgegeben.

     

    Inventare

    Inventare zeichnen sich durch die Erfassung möglichst vielfältiger Aspekte (Entwicklungsqualitäten, Fertigkeiten) des zu Grunde liegenden Merkmalsbereichs (hier also Entwicklung) aus. Je nach methodischem Verständnis werden Inventare häufig nicht als Tests im strengeren Sinne aufgefasst, da für die einzelnen Erfassungsbereiche die zwangsläufig inhaltlich heterogenen Skalen den Anforderungen an einen Aspekt der Reliabilität, der inneren Konsistenz, nicht genügen können und somit eine Überprüfung der Reliabilität nicht mehr vorgenommen werden kann (s.u.). Ein Inventar im Bereich der Allgemeinen Entwicklungsdiagnostik stellt der ET 6-6 dar, der praktisch mit jedem Item eine eigenständige Entwicklungsqualität überprüft. So werden dort z.B. zum Alterszeitpunkt 72 Monate für die Abbildung der kognitiven Entwicklung 27 Items erhoben, was zweifellos zu Messungenauigkeiten auf der Ebene des einzelnen Items führt, dennoch erscheint die Itemzusammenstellung in ihrer Gesamtheit plausibel. Inventaren wird in ihrer Gesamtheit durch Expertenurteile häufig eine hohe Gültigkeit zugebilligt, auch wenn die Überprüfung der Gütekriterien in einigen Belangen schwierig vorzunehmen ist. Gerade für die allgemein orientierende Entwicklungsdiagnostik eigenen sich aber Inventare in besonderem Maße, da eine tatsächlich vorliegende Beeinträchtigung eines Kindes mit vergleichsweise hoher Wahrscheinlichkeit aufgespürt werden kann.
    Der ET 6-6 stellt für jeden Erfassungsbereich Verteilungskennwerte der Normstichprobe zur Verfügung, die auf Summenwerten (Anzahlen gelöster Aufgaben) basieren. Die Argumentation mit Verteilungsparametern (Mittelwerten, Standardabweichungen) stellt zwar gewisse Ansprüche an das statistische Grundwissen des Testanwenders, beugt aber einigen Gefahren im Hinblick auf ungünstige Interpretationen (z.B. wie beim Entwicklungsalter) vor.

 

Gütekriterien

Für psychologische Tests sind einschlägige Anforderungen bezüglich der Hauptgütekriterien Objektivität, Reliabilität und Validität formuliert. Dabei wird allgemein eine Ordnungsbeziehung angenommen: Objektivität als notwendige, aber noch nicht hinreichenden Voraussetzung für Reliabilität, Reliabilität als notwendige, aber noch nicht hinreichenden Voraussetzung für Validität. Im Folgenden sollen kurz einige Probleme auf den Ebenen von Objektivität und Reliabilität aufgezeigt werden:

  • Die Objektivität kennzeichnet den Grad, in dem die Testergebnisse unabhängig vom Untersucher sind. Maße zur Einschätzung der Objektivität werden besonders über interpersonelle Übereinstimmungen bezüglich der Durchführung, Bewertung und Interpretation eines Tests gewonnen. Die Qualität solcher Angaben steht und fällt jedoch mit der Art (Repräsentativität) und Anzahl (zu fordern: n >> 2) der Untersucher sowie der Größe und Zusammensetzung (und somit Repräsentativität) der Stichprobe. Auf die Objektivität lässt sich insbesondere durch ausreichende Standardisierung der Materialien (!), der Durchführungsweise und der Bewertungskriterien hinwirken.
  • Die Reliabilität (Zuverlässigkeit) eines Tests betrifft den Grad der Genauigkeit der Messung, unabhängig davon, was denn überhaupt gemessen wird. Die in der Praxis überhaupt überprüfbaren Aspekte der Reliabilität von Entwicklungstests beziehen sich insbesondere auf
    • die Retest-Reliabilität (Testwiederholungsmethode): bringt der Test zu verschiedenen Messzeitpunkten das gleiche Ergebnis? Der Tatsache, dass wiederholte Messungen mit Lerneffekten einhergehen, bei der zweiten Messung also bessere Ergebnisse als bei der ersten Messung zu erwarten sind, muss durch einen hinreichenden zeitlichen Abstand zwischen den Messungen begegnet werden. Gerade in Bezug auf Entwicklungstests werden in Zeiträumen von Wochen oder gar Monaten aber Entwicklungsaspekte wirksam, so dass die Retest-Methode in der Entwicklungsdiagnostik also besondere Schwierigkeiten birgt: Leistungsverbesserungen sind immer zu erwarten, wobei schwierig zu überprüfen ist, in welchem Ausmaß jeweils Lerneffekte oder Entwicklungsaspekte wirksam wurden;
    • die innere Konsistenz (~Skalenhomogenität): messen die einzelnen Items eines Erfassungsbereichs (jeder Skala) in ausreichendem Maße dasselbe? Diese Maß ist nur dort sinnvoll zu berechnen, wo auch Homogenität angestrebt wird (Testbatterien).

Eine ausführliche Diskussion der Validität erfolgt an anderer Stelle.

In Bezug auf die Nebengütekriterien soll an dieser Stelle noch einmal besonders auf den Aspekt der Normiertheit eingegangen werden. Obwohl alle Verfahren sich auf “Normen” berufen, ist nicht für alle auch wirklich eine Eichung durchgeführt worden: so beruft sich Kiphard (2006) bei den Altersangaben innerhalb seines Entwicklungsgitters auf “Schätzungen”, die er zum Teil dann als “wissenschaftlich-statistisch gesichert” (S. 11) konstatiert; auch die Verfahren der MFED (Hellbrügge, 1994, 2001) greifen nach Angaben der Autoren auf Säuglinge und Kleinkinder zurück, die in den Jahren 1967 bis 1974 an der Münchener Pädiatrischen Längsschnittstudie teilnahmen“ (2001, S. 62), jedoch ohne dass zum Beispiel Normentabellen vorgelegt würden.
Ein nicht zu unterschätzender Aspekt der Normiertheit ist in der Aktualität der Normen zu sehen: Normenvergleiche bei Intelligenztests haben gezeigt, dass schon innerhalb von zwei Jahrzehnten die Testnormen zu einer Überschätzung der Intelligenz um 10 Punkte führen können! Gerade im unteren Leistungsspektrum können also aus der Bezugnahme auf veraltete Normen beträchtliche Fehleinschätzungen resultieren (Flynn-Effekt).

 

Zusammenfassende Bewertung

Allgemeine Entwicklungstests weisen im Vergleich zu anderen psychologischen Tests gewisse Besonderheiten auf. So werden zugunsten (!) der inhaltlichen Gültigkeit der Verfahren gelegentlich Aspekte der klassischen Testgütekriterien zurück gestellt, wodurch die Einschätzung der Testgüte im Einzelnen erschwert ist. Dennoch stellen allgemeine Entwicklungstests unverzichtbare Instrumente in der Breitbanddiagnostik des Kindesalters dar. Sie ermöglichen eine zeitökonomische Orientierung über breite Leistungsspektren und können somit in vielen Fällen die diagnostische Urteilsbildung beschleunigen. Für den Kinderarzt bieten sie die Möglichkeit, Kinder in einer standardisierten Situation zu untersuchen und neben der Auflistung erbrachter Leistungen (gekonnt vs. nicht gekonnt) weitere relevante qualitative Aspekte (wie wurde eine Aufgabe gelöst?) zu beobachten. Bei der Auswahl eines Entwicklungstests ist sicherzustellen, dass seine Konstruktionsmerkmale die Beantwortung einer (präzise zu formulierenden!) diagnostischen Fragestellung überhaupt ermöglichen. Liefert das Verfahren solche Ergebniswerte, die die Beantwortung einer (1) sondierenden oder (2) bereits spezifizierten, entweder defizit- oder ressourcenorientierten Fragestellung ermöglichen? Werden dabei normorientierte Aussagen (z.B. durchschnittlich, unterdurchschnittlich, Entwicklungsverzögerung) angestrebt, sind die Angemessenheit und die Aktualität der Normen zu prüfen.

[überarbeiteter Auszug aus Petermann und Macha, 2003a]

 

Entwicklungstest: Primäremotionen

Entwicklungstest: visuomotorische Koordination

Entwicklungstest: Explorationsverhalten

Entwicklungstest: Handlungsstrategien

Entwicklungstest: Ganzkörperkoordination

entwicklungsdiagnostik.de: Navigation

 

 

 

 

Google
 


 

 

 

 

 

 


Seitenanfang
 

 

 

EDButton2

EDButton2

update entwicklungsdiagnostik.de/entwicklungsdiagnostik/strategien

EDButton2

© 2007 Thorsten Macha

EDButton2