Katherine E. Ryan, J. Bradley Cousins: The Sage International Handbook of Educational Evaluation
Rezensiert von Prof. Dr. Wolfgang Beywl, 15.02.2012

Katherine E. Ryan, J. Bradley Cousins: The Sage International Handbook of Educational Evaluation.
SAGE Publications, Ltd
(London) 2009.
608 Seiten.
ISBN 978-1-4129-4068-9.
80.00 Pound (Listenpreis).
Entstehungshintergrund, Herausgeberteam, Autoreninnen und Autoren
Das Buch ist auf Initiative des Herausgeberduos entstanden. Zwischen der Einforderung der Beiträge (2006) und der Drucklegung liegen drei Jahre.
Katherine Ryan lehrt und forscht an der University of Illinois, von der in den vergangenen 50 Jahren immer wieder wichtige Innovationen in der Evaluation ausgegangen sind. Ihre Spezialgebiete sind Rechenschaftslegung im Bereich Bildung und Erziehung sowie Leistungsmessungen, die mit hohen Risiken für die Beteiligten verbunden sind (high-stakes assessments).
Bradley Cousins arbeitet an der Universität von Ottawa, hat zur partizipativen Evaluation veröffentlicht und forscht zum „Aufbau von Evaluationsvermögen in Bildungsorganisationen“. Er ist in vielen Regionen der Welt als Evaluator im Einsatz.
Von den insgesamt 44 Autorinnen und Autoren des Bandes gehören die meisten zum etablierten englischsprachigen internationalen Netzwerk der Evaluation, das sich um die amerikanische Evaluationsgesellschaft (AEA) gruppiert. Viele arbeiten in den USA und Grossbritannien, einige in Kanada oder Australien, Skandinavien, den Niederlanden oder Österreich, wenige in Schwellen- oder Entwicklungsländern.
Thema
Es geht um die Bildungsevaluation, die alleinstellende Merkmale gegenüber der Evaluation anderer personenbezogener Dienstleistungen aufweist: die weit verbreiteten psychometrischen Leistungsmessungen sowie die damit verbundene anhaltende Spannung zwischen qualitativen und quantitativen Methoden. Dabei ist es Zweck von Bildungsevaluationen, Politiken und Programmen, das Lehren und schliesslich das Lernen zu verbessern.
Mit der Verschiebung von der industrie- zur wissensbasierten Gesellschaft ist die Optimierung des Lernens noch mehr als bis dato Existenzberechtigung für jede Bildungsevaluation. Die Globalisierung hat im Verein mit Neoliberalismus und New Public Management (NPM) das Bildungswesen so verändert, dass es seine Leistungen vermehrt marktförmig bereitstellt. Dabei vergrössern sich die Abstände zwischen den Reichen und den Armen, auch in Bezug auf ihre Bildungschancen.
Bildungspolitik und -wissenschaft haben in den vergangenen Jahrzehnten zweifach auf diese Herausforderungen reagiert:
- Systeme der Leistungsmessung und der externen Schulevaluation/der empirisch basierten Schulinspektion sowie internationale Schulleistungsvergleiche haben sich, sowohl was ihre methodische Qualität als auch ihre quantitative Ausbreitung betrifft, stark entwickelt.
- Bildungsforschung fragt nach „Bester Praxis“, also „Was funktioniert?“ und danach, was sich global verbreiten lässt. Sie nutzt dazu bevorzugt (quasi-)experimentelle Forschung, ablesbar am Aufschwung zahlreicher damit befasster nationaler und internationaler Organisationen und Unternehmen.
Parallel und als Gegenstrom breitet sich ein Verständnis von „Evaluation als Lernen“ aus, der es unmittelbar um die Verbesserung der pädagogischen Praxis und das Lernen von Bildungsorganisationen geht.
Das Ziel des Sammelbandes besteht darin, die aus der Globalisierung resultierenden Herausforderungen und Spannungen anzusprechen, die sich innerhalb von Ansätzen der Bildungsevaluation und zwischen diesen stellen.
Aufbau
Die 31 – überwiegend neu verfassten – Beiträge sind zu sechs Teilen zusammengefasst: Die Teile II bis V enthalten die vier „Familien“ der Evaluationsansätze: die wissenschaftliche, die des Managements und des Aufbaus von Evaluationsvermögen, die des Lernens und schliesslich die politische oder ideologische. Eingefasst sind diese vier Haupt-Teile durch den Teil I zum Kontext der Bildungsevaluation und durch den resümierenden Teil VI, der Chancen und neue Dilemmata für die Evaluation aufzeigt. Hinzu kommen die Einleitung des Herausgeberduos, ein Autoren- und ein sehr gut erarbeitetes Sachregister, schliesslich Kurzbiografien aller Autoren und Autorinnen.
Zwischenbewertung
Vor die Aufgabe gestellt, das multiperspektivische und -thematische Werk zu besprechen, habe ich ein selektives Vorgehen gewählt (dieses ist durch meine Biografie und meine aktuellen Forschungsinteressen beeinflusst, beansprucht also keine Gültigkeit für andere Lesende): Nach Lektüre jedes Beitrages habe ich diesen auf einer Skala von 0-10 eingeschätzt, wobei zehn ‚herausragend‘ bedeutet (einmal vorkommend). Insgesamt 20 Beiträgen gebe ich sechs oder mehr Punkte; zu diesen mache ich zumindest eine kurze Inhaltsangabe. Einige Beiträge – als 9 oder 10 gewertet – werden ausführlicher vorgestellt. In jedem der sechs Haupt-Teile befindet sich mindestens ein Beitrag der ‚Spitzengruppe‘.
Teil I: Kontext der Bildungsevaluation im Wandel
Fazal Rizvi beschreibt Globalisierung als Veränderung der Basis „sozialer Imagination“. Diese entwickelt sich weg vom Nationalstaat und hin zu transnationalen Netzwerken. Dabei unterwerfen sich die Bildungssysteme dem ökonomischen Diktat, das Humankapital zu mehren, um der individuellen wie kollektiven globalen Wettbewerbsfähigkeit willen. Der Autor führt als Belege dafür an: die Betonung generischer Kompetenzen bezüglich „Mathematik, Informatik, Naturwissenschaften und Technik (MINT)“ oder der Fremdsprache Englisch als internationaler Geschäftssprache. Von der Evaluation fordert er, dass diese sich vom methodologischen Territoritalismus verabschiedet und globale Vernetzungen für jedes Bildungsprogramm und jedes Bildungswesen thematisiert.
Thomas Schwandt demonstriert in „Globalisierung der Einflüsse auf die westliche Imagination von Evaluation“ zunächst die Unmöglichkeit, Bildungsevaluation zu definieren. Er entfaltet Dutzende möglicher Facetten und porträtiert die „westliche Imagination“ mit „Aufklärung“ und „Demokratie“ als Eckpfeilern. Für die Globalisierung sieht er zwei Szenarien: „Homogenisierung“ versus „unabgeschlossene Vielfalt“. Er untersucht fünf Spannungsfelder, wobei – bei auch gegenläufigen Tendenzen – die „apokalyptische“ Sicht der neoliberal-technokratischen Gleichschaltung dominiert. Deren Unentrinnbarkeit stellt er abschliessend infrage: Die Tatsache, dass in der Bildungsevaluation bis auf weiteres verschiedene Strömungen konkurrieren, öffnet den politischen Diskurs über moralisch angemessene Evaluationspraktiken. Es müsse sorgfältig bedacht werden, wessen Interessen durch die Evaluation bedient werden und wie diese soziale Legitimität erreicht (S. 33).
Nick L. Smith skizziert „grundlegende Spannungsthemen von Evaluation in einer globalen Gesellschaft“, mit drei verschiedenen Konstruktionen von „Globalisierung“: „Verbreitung“ (westlicher Muster), „Interaktion“ und „unvorhersehbare Transformation“, die passiert, wenn ganz verschiedene kulturelle oder technologische Kontexte aufeinandertreffen und sich mischen. „Globalisierung als Transformation ist reziprok – die Veränderer werden selbst verändert“ (S. 45). Sechs zentrale Fragen seien zu beantworten: Was genau ist der Zweck von Evaluation? Wie definiert die evaluierende Person ihre Identität? Was soll als hinreichende Evidenz gelten? Mit welchen methodischen Zugängen wird diese erreicht? Was genau ist die Rolle der Stakeholder? Wie werden Evaluation und Organisationsentwicklung verbunden? Wenn Evaluation auch Dekolonialisierung einschlösse, würden sich die traditionellen „westlichen“ Antworten auf diese Fragen in unerwartete Richtungen verschieben.
Teil II Rolle der Wissenschaft in der Bildungsevaluation
Melvin Marks Beitrag zur Methodenwahl leitet aus der Globalisierung die These ab, dass diese das Interesse an Generalisierung noch erhöht. Evaluation könne das menschliche Bemühen um Mustererkennung und Sinngebung nicht ersetzen, jedoch unterstützen. Mark votiert gegen Best-Practice-Kataloge. Auch seien die breit geforderten zufallskontrollierten Experimente ausschliesslich für „Gabelentscheidungen“ geeignet, also die Frage: „Dieses oder jenes Programm?“ Selbst hier nutzten Entscheider die Evaluationsergebnisse selten direkt. Allerdings würden internationale Organisationen (er nennt u. a. die Campbell-Collaboration) die Nationalstaaten drängen, derartige Evaluationsergebnisse irgendwie zu nutzen („veranlasster Gebrauch“).
Peter Steiner, Angela Wroblewski und Thomas Cook vertiefen die Thematik der experimentellen Designs und plädieren für mehr Studien mit zufallsgebildeten Versuchs- und Kontrollgruppen (RCT), und einen Dialog mit den Skeptikern. Solche Designs seien der strengste Weg, um kausal zu beschreiben. Der stark technische Beitrag erläutert bei konzedierten Umsetzungsschwierigkeiten von RCT drei Alternativen „starker“ quasi-experimenteller Designs. RCT würden in Europa deutlich seltener eingesetzt als in den USA; daher werden drei Gruppen kritischer Argumente gegenüber diesen Designs für den Schulbereich diskutiert: die Schwierigkeit der treuen Umsetzung in der Schulpraxis, Einschränkungen bezüglich Generalisierbarkeit und Nützlichkeit, Konkurrenz durch vorgeblich bessere methodische Alternativen (z. B. Fallstudien oder logische Modelle).
Madhabi Chatterji fragt, ob die von der Politik oft bevorzugte „Evidenz-Hierarchie“ mit RCT an der Spitze für die Wirkungsfeststellung angemessen ist. Als Alternativmethodologie schlägt er ETMM (extended-term, mixed-method) vor. Darin gibt es mehrere explorative und bestätigende Phasen. Qualitative und quantitative Methoden werden komplementär genutzt. Im Unterschied zur positivistischen Methodologie wird eine „realistische“ bevorzugt, welche nicht nur Fakten sondern auch Werte einbezieht. Am Beispiel eines schulischen Leseprogramms werden sechs Leitlinien für ETMM formuliert. Zentral dafür sei, dass Untersuchungen im Feld, in einem realen kulturellen, sozialen und politischen Kontext, relevante Erkenntnisse zu komplexen sozialen Themen wie Unterricht generieren können.
Gary Henry und Dana Rickman präsentieren ein Lehrstück einer auf Verallgemeinerbarkeit abzielenden „wissenschaftlichen“ Evaluation. Gegenstand ist ein Ganztags-Vorschulprogramm in Georgia, das für einen Grossteil der Bevölkerung kostenlos ist, basierend auf Bildungsgutscheinen. Diese Studie fragte danach, wie sich die Lernverläufe der Kinder in diesem im Vergleich zu denen in kostenpflichtigen Privatangeboten und im Vergleich zu Kindern ohne Teilnahme an einem formalen Programm entwickeln. Diese werden bis in die erste Schulklasse nachverfolgt. Die Auswahl (nicht die Zuweisung!) der Kinder in den vier Teilgruppen der Untersuchung erfolgte nach Zufall. Im Zeitablauf gab es sehr geringe Stichprobenausfälle, so dass die Ergebnisse auf alle Kinder dieser Altersgruppe in Georgia verallgemeinerbar sind. Bemerkenswert ist die transparente nachvollziehbare Untersuchungsanlage der umfangreichen quantitativen Zeitreihenuntersuchung. Es wird dargelegt, wie die Ergebnisse zur Verbesserung des Programms in Georgia und für die Übertragung des Programms in andere Bundesstaaten genutzt wurden.
Lois-ellin Datta beschäftigt sich kritisch mit der „wissenschaftsbasierten“ Bildungsevaluation und dem Lernen von Schülerinnen und Schülern in einer globalen Gesellschaft. Die Autorin geht von einem Dominanzstreben westlicher Evaluationsansätze aus. Stichworte sind: intendierter Nutzen, summativ und wirkungsorientiert, RCT, quantitativ. Allerdings gebe es international auch Alternativpositionen sowohl in der Pädagogik wie in der Evaluation. Datta skizziert ein logisches Modell der „wissenschaftsbasierten“ (im Sinne von quantitativ-hypothesentestenden) Evaluation, welchem eine rationale Handlungstheorie zugrunde liege, und das von vielen „mit Leidenschaft“ vertreten werde. Dabei würden die zahlreichen notwendigen Voraussetzungen für RCT meist nicht getroffen, zum Beispiel, weil die Kontrollgruppen – entgegen den Modellannahmen – „aktiv“ werden. Im Unterschied zu diesem unrealistischen Goldstandard sei der Platinstandard situational angemessener Evaluation zu bevorzugen (S. 156). Nicht nur in der Entwicklungszusammenarbeit erweise sich „Campbells Law“ als gültig, dass RCT letztlich zur Korrumpierung führt (S. 158). So gäbe es keine Belege dafür, dass vermehrtes Testen die Schülerleistungen steigert. Man müsse akzeptieren, dass je nachdem RCT oder aber multimethodische Ansätze geeigneter seien.
Teil III Bildungsevaluation, Aufbau von Evaluationsvermögen und Monitoring
Katherine Ryan und Irwin Feller argumentieren, dass Rechenschaftslegung (accountability) und Performance Management sich angesichts der globalen Umgestaltungstrends der Bildungssysteme zunehmend vermischen. Sie diskutieren die Erträge speziell der auf Schüler-Leistungen bezogenen Outcome-Rechenschaftslegung und deren Alternative, nämlich Inhouse- und Selbstevaluationen. Für Evaluierende ergäben sich drei Rollenperspektiven: Messtechnikerin, Auditorin für Performanz (mit überlegener Machtposition) sowie Aufbauberaterin für internes Evaluationsvermögen.
Claudia Tamassia und Raymond Adams unterscheiden für „Internationale Vergleichsstudien und Indikatoren“ zwei Zugänge: A) indikatoren-bezogene, um Bildungssysteme zu vergleichen bzw. nationale Ergebnisse im internationalen Rahmen zu interpretieren (benchmarking). „Indikatoren“ integrieren mehrere Datenquellen und verschiedene Statistiken, die länderübergreifend operationalisiert und regelmässig über längere Zeit gemessen werden. Die Politik unterstellt, dass sich die darunter liegenden komplexen Prozesse angemessen erfassen lassen. B) Leistungsmessungen. Wie die Stichprobenbildung erfolgt (gemäss Klassenstufe oder gemäss Alter) hat erhebliche Auswirkungen auf Aussagekraft und Nutzungsmöglichkeiten der Ergebnisse. Angesprochen werden die Leistungsfähigkeit der Verfahren wie die Gefahren der Verzerrung und des Missbrauchs.
Edith Cisneros-Cohernouv und Thomas Grayson skizzieren Besonderheiten von Wirtschaft und Bildungssystem Mexikos, mit Fokus auf Ungleichheiten. Positiv sei, dass internationale Vergleichstests Aufmerksamkeit für dessen Schwächen geschaffen und erste, wenn auch unterfinanzierte Bildungsreformen ausgelöst haben. Allerdings seien die Tests oft unangemessen angesichts der kulturellen Vielfalt Mexikos, bis hin zu einer kumulativen Benachteiligung von Schülern und Schülerinnen aus der Armutsbevölkerung. Daher sollten standardisierte Tests mit lernnäheren Evaluationsverfahren ausbalanciert werden.
Gerry McNamara und Joe O‘Hara benennen im Beitrag „Wo das Globale das Lokale trifft“ Gründe für das Scheitern externer Schulevaluation: nicht-intendierte Auswirkungen wie (innere) Kündigungen von Lehrpersonen und Zwecküberfrachtung – sowohl Rechenschaftslegung als auch Verbesserung. Sie bezeichnen diese Zwecke als sich eher ausschliessend als unterstützend (S. 275). Daher gebe es einen starken Trend zur internen Schulevaluation. Am Beispiel von Irland, das allerdings über besonders starke Lehrergewerkschaften verfügt, wird gezeigt, dass schuleigene Evaluation kein Selbstläufer ist. John McBeath, ‚Papst‘ dieser Evaluationsart, plädiere bei aller Unterstützung der Schul- und Lehrpersonen-Autonomie dafür, extern Rechenschaft abzulegen. Dem gegenüber stünden radikalere Vertreter der Lehrerautonomie. Die Autoren fordern entschieden mehr Selbstevaluation, die mit Lehrerautonomie verbunden ist. Aus- und Weiterbildung dafür sei essentiell.
David Nevo liefert unter der Überschrift „Rechenschaftslegung und Aufbau von Evaluationsvermögen“ eine Art verdichteten Einführungstext in die Gesamtthematik. Eingangs nennt er als Besonderheiten von Bildungsevaluation ihre Herkunft aus der Programmevaluation, die ihr entgegengebrachte hohe öffentliche Aufmerksamkeit und dass Lehrpersonen, die als zentrale professionelle Aufgabe das Beurteilen haben, mit Evaluationen selbst Bewertungsakte erfahren. Im zweiten Teil beschäftigt er sich mit dem Verhältnis von interner und externer Evaluation: Schulevaluation werde weithin mit rechenschaftsorientierter externer Evaluation gleichgesetzt. Parallel dazu gebe es interne Schulevaluation, namentlich schulbasierte Inhouse- Evaluation oder unterrichtsnahe Selbstevaluation. Die Entwicklung der internen Schulevaluation sei eine Investition in eine dauerhafte Ressource, um die Informationsbedarfe der Bildungsorganisation zu bedienen (Wissensmanagement). Interne Evaluation übertrage auch Autorität von Zentrum an die Peripherie, von der zentralen Bildungsverwaltung an die lokale Gemeinde bzw. Schule.
In der internen Schulevaluation gebe es verschiedene Rollen, für Mitglieder der Schulleitung oder für ein speziell damit beauftragtes Mitglied des Kollegiums (Inhouse-Schulevaluatorin) oder für einzelne Lehrpersonen bzw. für Gruppen/Teams von ihnen, die unterrichtsnahe Selbstevaluationen durchführen.
Selbstevaluation beinhalte einerseits „Reflexion“; diese werde ergänzt um das für Evaluationen unverzichtbare Element der systematischen Datenerhebung: „Eine professionelle Wahrnehmung des Unterrichtens betrachtet diesen als ein komplexes Unterfangen, das unterstellt, dass Lehrpersonen Bedarfe identifizieren, Ziele analysieren, instruktionale Strategien wählen, ihre Arbeit planen und beobachten sollen. Dies ist nicht länger eng begrenzt auf die Beurteilung von Schülerleistungen, sondern Evaluation wird zu einem integralen Bestandteil der Lehrprofession, die für verschiedene Aspekte der Verantwortlichkeiten von Lehrpersonen bedeutsam ist. In diesem Zusammenhang wird interne Evaluation ein Hauptinstrument für das Bildungsmanagement von Schulen“ (S. 295).
Es sei daher geboten, Evaluationskompetenzen bei den schulischen Beteiligten zu fördern, als zentral für die Professionalität von Lehrenden (S. 295). In einem Bildungssystem mit einer professionellen Konzeption von Unterricht wird von seinen Lehrpersonen erwartet, dass sie ihre Arbeit planen, zuschneiden, umsetzen und evaluieren, dass sie festgelegte Ziele zu erreichen versuchen und dass sie Standards von Exzellenz treffen wollen.
Als Arbeitsteilung zwischen interner und externer Schulevaluation schlägt Nevo vor:
- Rollen: Die formative Rolle wird durch die interne Evaluation besser erfüllt, während Rechenschaftslegung, Kontrolle, Motivierung sowie andere administrative und sozialpolitische Funktionen eher und manchmal ausschliesslich extern erfüllt werden;
- gesellschaftliche Funktion: Evaluation muss aufmerksam gegenüber den Bedarfen und Werten der gesamten als pluralistisch wahrgenommenen Gesellschaft sein, sie muss daher auf die Stimmen der verschiedenen gesellschaftlichen und individuellen Stakeholder hören; sich sowohl auf das Allgemeine wie auf das Einzigartige konzentrieren;
- Nutzung: Man weiss aus der Forschung, dass gelingende Evaluationsnutzung zum einen von der Implementation der Evaluation (u.a. methodologische Qualität, Glaubwürdigkeit der Evaluierenden, Qualität der Kommunikation) abhängt, zum anderen vom Entscheidungssetting, in dem die Ergebnisse genutzt werden sollen (Klarheit der Informationsanliegen, Charakteristiken der Entscheidung, politisches Klima, Wettbewerb der Informationen, persönliche Merkmale der Entscheidenden sowie deren Selbstverpflichtung auf die Evaluation). Es gibt drei Hauptprädiktoren für die Evaluationsnutzung: (a) Evaluationsqualität (Genauigkeit und Bedeutsamkeit), (b) Einbezug von Stakeholdern und (c) Entwicklungsstand der organisationalen Evaluationskultur. Externe Evaluation wird die Genauigkeit und die Objektivität erhöhen, interne hingegen die Relevanz, indem Sie die Einzigartigkeit der jeweiligen Schule berücksichtigt.
Bezüglich des „Dialogs zwischen interner und externer Evaluation“ werden unterschieden:
- konzeptionelle Ebene: Evaluation als Mittel zum Verstehen und weniger zum Urteilen: Die Bewertungen sollen auf multiplen Kriterien beruhen, welche sich auf die verschiedenen Aspekte von Schule und Unterricht beziehen. Es soll kein zusammenfassendes Urteil über Schüler und Schülerinnen, Programme oder Schulen angegeben werden. Daher sollen Evaluierende Qualitäts-Profile bereitstellen und nicht zusammengesetzte verdichtende Kennzahlen. Allerdings sollten Evaluierende – in der Evaluationsliteratur umstritten – Empfehlungen geben;
- methodologische Ebene: Evaluation sollte als (fortlaufender) Prozess gehandhabt werden und nicht als einmalige Aktivität: „Es ist ein Prozess, Ergebnisse vorzustellen, diese zu interpretieren, sie mit den jeweiligen Adressierten zu diskutieren, sie mit anderen Ergebnissen zu vergleichen, zusätzliche Informationen zu gewinnen, zu mehr Ergebnissen zu kommen, und mit der dadurch erhöhten Komplexität umzugehen“ (S. 299). Intern und extern Evaluierende sollten Informationen für gegenseitiges Lernen austauschen. Mitarbeitende der Schulen müssen Methoden zur systematischen Datenerhebung und -auswertung beherrschen. Mit den attraktiven qualitativen Methoden handelt man sich damit hohen Aufwand ein; quantitative Methoden werden oft simplistisch genutzt;
- kommunikative Ebene: Zwischen den Beteiligten beider Evaluationsarten muss es sein Klima gegenseitigen Respekts und Vertrauens geben. Beide müssen überzeugt sein, dass jede Seite ein originäres Interesse hat, zu verstehen was auf dem Spiel steht, dass jede Seite einen signifikanten Beitrag zu einem solchen Verstehen leisten kann. Extern Evaluierende müssten Lehrpersonen Respekt erweisen, die in internen Schul-Evaluationsteams arbeiten, sie als gleichgestellte Partner ansprechen, auch wenn sie nicht über eine professionelle Evaluationsausbildung verfügen.
Evaluation müsse fair sein in Bezug auf beide in den Dialog einbezogene Parteien. Von Lehrpersonen, die erleben, dass sie unfair bewertet werden, sei es durch die Schulleitung oder die Eltern, von diesen könne nicht erwartet werden, dass sie in einen ernsthaften Dialog zu so angelegten Evaluationen eintreten.
Extern Evaluierende wie auch Schulinspektoren hätten eine klar definierte Autorität und Verantwortlichkeit bei ihrer Evaluationsaufgabe. Sie sollten sich definitiv dazu bekennen und in vollem Umfang die Verantwortung für die Konsequenzen ihrer Evaluation tragen. „Ich möchte schliessen mit dem Vorschlag, dass diejenigen von uns, die Parteigänger der externen Schulevaluation sind, in den Aufbau von internem Evaluationsvermögen investieren, um die Schulen und die Lehrpersonen instand zu setzen, als gleichgestellte Partner teilzunehmen. Diejenigen, die den Aufbau von Evaluationsvermögen für interne Evaluation als ein Mittel von Schulautonomie, Selbst-Verbesserung und Lehrer-Professionalisierung fordern, müssen die Legitimität des Anspruchs auf Rechenschaftslegung akzeptieren und das Recht der Öffentlichkeit, über die Ergebnisse informiert zu werden. Sie sollten ihrerseits die externe Evaluation als einen Partner für den Dialog suchen und nicht als Objekt der Kritik und Ablehnung“ (S. 301).
Teil IV: Bildungsevaluation als Lernen und Entdecken
Dahler-Larsen sieht die von der Globalisierung ergriffenen Gesellschaften im Modus der „reflexiven Modernisierung“. Sie seien verstärkt auf Techniken des Monitorings, des empirischen Untersuchens, der Diskussion und des Zweifels angewiesen. Prominent fungierten hier verschiedene „Ströme“ der Evaluation, darunter die partizipativen, lernorientierten, mit folgenden Überzeugungen:
- dass Lernen der wichtigste Evaluationszweck ist;
- dass Lernen voraussetzt, dass die Praktiker die Evaluation als bedeutsam erachten;
- dass Bedeutsamkeit erhöht werden kann, wenn Praktiker tiefgehend im Evaluationsprozess beteiligt werden;
- dass die soziale Arena der Evaluation meist die lokale Gruppe, die Gemeinde oder die Institution ist.
Beispiel hierfür sei die Selbstevaluation, in der die Leute kritisch auf etwas schauen, für das sie selbst verantwortlich sind (S. 312). Obwohl – bei relativ schwacher Forschungsbasis – vieles darauf hinweise, dass lern-orientierte Evaluation nützlich ist, gebe es Einschränkungen wie
- Zeitdruck
- Kompetenzlücken
- überstarker Fokus auf Lernen, wobei die „Bewertung“ auf der Strecke bleibt
- Ausblenden des grossen sozialen und politischen Kontextes.
Voraussetzungen (jeweils mit Literaturangaben) für gelingende lernorientierte Evaluation sind:
- freier Fluss von Information und Kommunikation in der Organisation
- organisational verankerte Sprache, für Probleme und mögliche Lösungen
- Fehlen einer hierarchischen Struktur, die verhindert, dass Probleme authentisch in der Linie auf- und abwärts berichtet werden
- ein Klima, in dem Fehler toleriert und bearbeitet aber nicht ignoriert oder rechtfertigt werden
- eine für multiple Perspektiven offene organisationale Kultur
- ein geringes Niveau politischer Konflikte
Der Schwerpunkt des Beitrages liegt auf der kritischen Betrachtung des Verhältnisses von Lernen (formativ/intern) und Rechenschaftslegung (summativ/extern), zu dem drei fundamental verschiedene Argumente referiert werden:
- Jede einzelne Evaluation sollte entweder auf Lernen oder auf Rechenschaftslegung, entweder formativ oder summativ angelegt sein. Beide Evaluationsarten wären dann „funktionale Alternativen“, wobei die externe Sicht Lernen verhindern würde.
- Dieselbe Evaluation kann faktisch auf verschiedene Arten genutzt werden. Eine Lehrperson mag entscheiden, eine bestimmte Lehrmethode zu verwerfen, nachdem sie diese summativ evaluiert hat (auf der Ebene ihrer eigenen Praktiken), während dieselbe Evaluation auf der Ebene der übergreifenden professionellen Entwicklung der Lehrpersonen (z. B. im Fachteam) formativ genutzt wird. Auf verschiedenen Ebenen des Schulsystems, einschliesslich der Leitung, sind demnach mehrere verschiedene simultane Nutzungen einer Evaluation möglich.
- Aus einer umfassenden Sicht einer demokratischen Gesellschaft sind Lernen und Rechenschaftslegung absolut nicht funktional alternativ, sondern beide notwendig. a) normativ kann man sich eine repräsentative Demokratie nicht ohne Kontrolle oder Rechenschaftslegung vorstellen. Der Autor zitiert Nevo (2002, S. 15): „wenn Sie [als Lehrperson] die Autorität und die Verantwortlichkeit des Erziehungsministeriums nicht akzeptieren wollen oder das Recht der Eltern, über die Schulen informiert zu sein, auf die ihre Kinder gehen, erwarten Sie von diesen nicht, dass diese Ihr Recht auf Autonomie und Reflexion respektieren, und dass sie Ihrem Urteil als professionelle Lehrpersonen vertrauen“. b) empirisch hat sich die Nachfrage nach externer Rechenschaftslegung für Bildungsorganisationen – gerade wegen der extremen Wichtigkeit in den globalisierten Ökonomien und wegen der Popularität performanzorientierter Regimes in der Politik und im Management – verstärkt. Im Rahmen der reflexiven Modernisierung ist demnach Evaluation ein Mittel, um mit Kontingenzen umzugehen, und vorwärtsweisender, als autoritativen oder traditionalen Aufforderungen zu vertrauen.
In der Konsequenz plädiert auch Dahler-Larsen für „neue Formen der Kooperation mit rechenschaftslegungsorientierter, externer Evaluation“ (S. 316). Ausserdem gebe es neben den beiden Reinformen interner und externer Evaluation praktisch bedeutsame Mischformen.
Im letzten Abschnitt diskutiert der Autor drei weitere Herausforderungen für lernorientierte Evaluation:
- Wenn sich lernorientiert Evaluierende zunehmend der Rechenschaftslegung stellen, können sie sich nicht darauf beschränken, ausschliesslich persönlich mit Menschen in kleinen lokalen Arenen zu arbeiten. Sie sollten ihr Wissen, ihre Erfahrung, ihre Perspektiven und manchmal auch ihre Kritik klarer in der grösseren gesellschaftlichen Arena vertreten.
- Lernorientiert Evaluierende sollen sich stärker beim Aufbau von organisationalen Regimes für Evaluationsvermögen, Evaluationskultur und Evaluationssysteme engagieren.
- Angesichts der Tatsache, dass fortdauerndes Lernen eine vorherrschenden Mentalität unserer Zeit ist, die beständigen Wandel und beständige Entwicklung hoch schätzt, kann Evaluation zu einem Lernen dritter oder gar vierter Ordnung beitragen.
Theo Niessen et al. behandelten das Thema „Lernen in (Inter-) Aktion“ am Beispiel der Einführung von problembasiertem Lernen für Lehrende der Universität Maastricht. Dabei werden die Beteiligten – Hochschullehrende, Hochschuldidaktik-Lehrende, Curriculum-Entwickelnde – zu einem Dialog eingeladen. Als empirische Basis dienen (in Auszügen abgedruckte) Fallgeschichten, die über Interviews und Fokusgruppen erstellt sind. Responsive Evaluation wird methodologisch begründet, aber die empirisch gewonnenen Erkenntnisse zum Curriculum bleiben recht impressionistisch.
John Eliott – britischer Nestor der erziehungswissenschaftlichen Aktionsforschung – schreibt über Bildungsevaluation als mediatisiertes gegenseitiges Lernen. Zu Beginn stellt er zwei Szenarien gegenüber: Konvergenz von Kulturen versus Vielheit der Kulturen. Erstgenanntes verbindet er sehr kritisch mit dem globalisierten Kapitalismus, den neuen Steuerungsmodellen in der öffentlichen Verwaltung sowie der Humankapitaltheorie. Dieser Pfad der „Wissenschaft des Messens“ verhindere langfristig Lernen. Dazu zählt er auch die international vergleichenden Schulleistungsstudien. „Je mehr Raum Evaluation für Methoden reserviert, desto weniger Raum gibt es für das Lernen“ (S. 399). Im zweiten Szenario geht es um Lernen als konvivialen, spontanen und intrinsisch bedeutsamen Prozess des Untersuchens. Hier gäbe es ausschliesslich im Gespräch selbst liegende Restriktionen, welche durch die Mit-Untersuchenden gesetzt werden. Innerhalb einer transformierten Pädagogik hätten die Lehrpersonen Autorität gegenüber einem Lernprozess, der so anzulegen ist, dass er ihren Schülerinnen und Schülern mehr Kontrolle über ihr zukünftiges Leben zu geben vermag (S. 401). Damit verbunden sei das Leitziel der Capability welches allgemeiner sei als die Employability. „Die Capability einer Person bezieht sich auf alternative Kombinationen des Funktionierens, welche durch sie erreichbar sind. Capability ist insofern eine Art von Freiheit: nämlich unterschiedliche Lebensstile erreichen zu können“ (in Anlehnung an Armatya Sen). Dieses Verständnis von Pädagogik beziehe die Menschen als fähig ein, eigene Ziele, Werte usw. in ihrem besten Interesse einzuschätzen. Evaluation müsse sich entscheiden, ob sie ein Faktor des auf Autonomie gerichteten Wandels des Bildungssystems sein will. Versuche, die bereits in diese Richtung gingen, namentlich „demokratische Evaluation“, seien an fehlender Nachhaltigkeit in den Bildungsorganisationen gescheitert; gleichfalls die Lehrerforschung oder die Selbstevaluation von Lehrpersonen am fehlenden Anschluss zum Diskurs mit den Stakeholdern. Abschliessend kritisiert er im Anschluss an Robert Stake und Thomas Schwandt die standard-basierte Evaluation, die dazu führe, die Anzahl der Sichtweisen, was Qualität ist, über Gebühr zu reduzieren. Der Beitrag ist mit grosser Emphase geschrieben und gibt wenig Hinweise zur Umsetzung.
Teil V: Bildungsevaluation in einer politischen Welt
Saville Kushners Beitrag „Eigene Ziele“ baut von vornherein eine Spannung auf: global versus lokal. Er sucht nach „flexiblen“ Lösungen. Er definiert demokratische Evaluation, die häufiger propagiert als praktiziert sei. Auch sei sie oft verbunden mit Vorstellungen von guter Regierung westlicher Demokratien. Der Autor betont die Relevanz lokaler in der lokalen Demokratie verorteter Evaluation und listet deren Prinzipien auf (S. 424). Weitgehend ist darunter folgendes: „Evaluierende haben keine Befugnis selbst zu urteilen – ihre Aufgabe ist es anderen zu helfen, ihre Urteile zu artikulieren. Dies bedeutet, dass Evaluierende sich sehr zurückhalten sollen, Empfehlungen zu machen“. (S. 424) Das Prinzip der rechte-basierten Evaluation lautet: „Einige haben Rechte über Information, wobei andere Verpflichtungen haben, diese bereitzustellen. Evaluation als der Generator und Broker von Informationen ist dabei der redistributive Mechanismus“ (S. 425). Kushner betont die dienstleistende und marginale Rolle der Evaluierenden, ein selten thematisierter Aspekt. Der Beitrag ist spezifisch auf diesen mikropolitischen Aspekt konzentriert.
Ove Karlsson Vestman und Christina Segerholm, ein schwedisches Evaluationsteam, berichten über ihren Versuch, den in westlichen Demokratien als „alternativ“ geltenden Ansatz der „deliberativen Evaluation“ in einen postsozialistischen Kontext einzubringen. Dies scheitert angesichts divergenter Normen in der politischen Kultur Russlands: bezüglich der Auffassung von Beamten/öffentlichen Angestellten zu Transparenz und Rechenschaftslegung gegenüber der Zivilgesellschaft; der exklusiven Verortung von Expertise in der Behördenhierarchie; der geringen Wertschätzung von reflexivem personalem oder organisationalem Lernen in Behörden. Dabei bestünden Ähnlichkeiten zu den neuen Steuerungsmodellen in der öffentlichen Verwaltung in westlichen Demokratien. Insgesamt verstehen die beiden ihren Beitrag als Warnung vor einer verfrühten oder unpassenden Übertragung westlicher Evaluationsansätze auf kulturell und normativ anders geprägte Gesellschaften. [Ein herausragender Beitrag zur Diskussion über interkulturelle Aspekte der Evaluation im Rahmen der Globalisierung.]
Harry Torrance stellt die kritische Frage, ob mit der leistungstest-basierten Rechenschaftslegung nicht die falschen Indikatoren vorangetrieben werden. Sein Hauptargument ist, dass das Testen sowohl die Regierungen als auch die Gesellschaft in Geiselhaft nimmt und eher zu schlechtem Unterricht führt. Er fordert stärkere Lokalisierung sowie partizipative, responsive und demokratische Evaluationsansätze. Zentral seien Feedback und Interaktionen im Unterricht. [Viel Emphase, leider keine Richtlinien zur Umsetzung; interessante Kritik international vergleichender Schulleistungsstudien.]
Teil VI: Chancen und neue Dilemmata der Bildungsevaluation im Zeitalter der Globalisierung
Ulf Lundgren sieht Evaluation ursprünglich als Teil eines offenen Zugangs zur Schulentwicklung. Nun sei sie wesentlich ein Treiber für mehr Effizienz und Kontrolle unter dem Regime bildungsökonomischer Theorien geworden. Er zeichnet in groben breiten Zügen die bildungspolitischen Trends nach (dezentral versus zentral; Gleichheit versus Qualität; Wissen versus Kompetenzen). Er kritisiert eine sich anpassende Evaluation.
Sandra Mathison schreibt einen kritischen Beitrag mit einem Bekenntnis bereits im Titel: „Dem öffentlichen Interesse durch Bildungsevaluation dienen: die Demokratie retten indem man den Neoliberalismus zurückweist“. Sie formuliert die Metapher, dass der neoliberale Staat nicht der „Staat der/für Familien“ ist obwohl er sich so darstelle. Er gebe vor, mehr Wahlmöglichkeiten für Eltern zu schaffen, zum Beispiel mit der freien Schulwahl. Hingegen sei er ein Familien-Staat, der autoritativ anordne, woran man „gut/schlecht“ festmacht, „gute/schlechte“ Schulen erkennen könne. Sie kritisiert die Verflechtungen des Messens und Testens in der Privatwirtschaft am Beispiel des McGraw-Hill-Konzerns, zu dem die Ratingagentur Standard & Poor'sebenso gehört wie der Test- und Lernmittelproduzent CTB. Hierzu gehöre auch die Konstruktion von versagenden Schulen (failing schools), die ausschliesslich durch staatlich kontrollierte Rechenschaftslegung gerettet werden können, hauptsächlich basierend auf Leistungsmessung. Die ökonomischen Verflechtungen von so genannten Nichtregierungsorganisationen wie des „What Works Clearing House“ oder des Fraser Institute in Kanada werden angesprochen. Rechenschaftslegung sei in deren Verständnis eine Ware, Schulen seien ein Geschäft, Bildung ein Produkt, das effizient bereitgestellt werden muss. Zu dieser Ideologie gehöre, dass Wahlmöglichkeiten und Wettbewerb die Qualität erhöhen und dass Employability ein moralisch überlegenes Erziehungsziel sei. Auch die Entwicklung von Instrumenten der Leistungsmessung sei ein riesiges Geschäft: Zwischen 2002 und 2008 wurden zwischen etwa 1,9 bis zu 5,3 Milliarden US-Dollar allein in den USA dafür ausgegeben.
Es sei notwendig, eine der neoliberalen gegenüber alternative Rhetorik zu entwickeln. Ein Beispiel hierfür ist FairTest, das sich kritisch mit der Test-Industrie und ihren Produkten auseinandersetzt. Evaluation müsse als demokratisierende Kraft im Bereich der Schul- und Unterrichtsentwicklung auftreten und dabei interventions-/unterrichtsnah sein. Sie schliesst mit folgender These: „Um dem öffentlichen Interesse zu dienen, müssen wir Evaluation als einen kontinuierlichen Prozess sehen, die Besonderheiten einzuschätzen, um Verbesserung voranzubringen mit der impliziten Erwartung, dass ein Idealzustand oder eine einzige Lösung weder erreicht werden kann noch wirklich existiert.“ (S. 536)
Bradley Cousins und Katherine Ryan verfassen das Schlusskapitel des Sammelbandes mit dem Ziel, aus den vorangehenden Aufsätzen zu lernen. Zunächst bearbeiten sie folgende Fragen zum Verhältnis von globalisierter Gesellschaft und Bildungsevaluation.
- Wie wird Globalisierung aufgefasst? a) sich gegenseitig befruchtende Ideen und Ideologien, Lebensstile, Menschen und Waren, Bilder und Botschaften, dabei Integration von Märkten, Nationalstaaten und Technologien in nie gekanntem Ausmass; b) Antreiber sind ökonomische Kräfte und Kommunikationstechnologien; c) Homogenisierung, ersichtlich an Bewegungen freier Märkte in Richtung einer einzigen auf Massenware basierenden Welt (alternativ: multiple eingeborene Kapitalismen); d) multinationale politische Organisationen und Unternehmen mit neuen Arenen für Wettbewerb.
- Was sind die Implikationen der so beschriebenen Globalisierung für Bildungspolitik und -praxis? Diese müssten neue und komplexere Fähigkeiten fördern, um die Anforderungen der technologischen Arbeitsmärkte zu befriedigen und weltweit im Wettbewerb zu bestehen. Von der Bildungsevaluation werde erwartet, Bildungssysteme in diese Richtung verändern zu helfen. Mittels Informationen aus Leistungsmessungssystemen werde überprüft, ob die Akteure und Organisationen in Bildungssystemen die gesetzten Schwellenwerte erfüllen. Die Gleichzeitigkeit von Dezentralisierung und neuer politischer Steuerung diene dazu, das öffentliche Vertrauen in die Regierung wiederherzustellen und die Effizienz zu steigern. Standardisierung führe zu erheblichen Problemen.
- Was folgt aus der Globalisierung für Bildungsevaluation? Technologisch-rationalistische Ansätze der Evaluation werden privilegiert, insbesondere internationale Schulleistungs-Vergleiche, andere auf Leistungsmessung abzielende sowie mit RCT verbundene. Evaluationsansätze und -methoden würden sich auf die sich mit der Globalisierung durchsetzenden Marktkräfte einstellen. Direkte Einflüsse der Globalisierung auf die Evaluation zeigten sich zum Beispiel in einer Ausweitung analytischer Werkzeuge für quantitative und qualitative Auswertungen oder in der Gründung nationaler und regionaler Verbände und Organisationen. Die Frage ist, welche Chancen ein reflexiver selbstkritischer Modernisierungsprozess hat.
Im zweiten Teil des Kapitels werden „fortdauernde Dilemmata, Spannungsthemen und Herausforderungen“ angesprochen. Im Anschluss an den Beitrag von Nick L. Smith werden sechs Spannungsthemen identifiziert, welche auf die vier „Familien“, die der Hauptgliederung des Buches zu Grunde liegen, bezogen werden:
- Was sind die angemessenen
Zwecke für Evaluation? Mit dem neoliberalen Ruf nach mehr
Rechenschaftslegung und Evidenz dafür, „Was funktioniert?“
entstehen zwei Spannungen: a) dass Lernen und Rechenschaftslegung
keine funktionalen Alternativen sind, sondern dass sie in der
reflexiven Modernisierung beide genutzt werden müssen, um mit
Kontingenzen umzugehen. b) dass der moralisch-politische Diskurs in
der Evaluation zu wenig betrieben wird. Hingegen müsse die Politik
mit bedeutungsvoller Aufklärung versorgt werden, auch in Bezug auf
ihre Fähigkeit, nicht behandelte/nicht hinreichend getroffene
soziale und pädagogische Bedarfe aufzugreifen – soziale Kritik
als Aufgabe der Evaluation, mit folgenden zehn, durch Autorinnen und
Autoren des Sammelbandes angesprochenen „dynamischen Spannungen“:
- der Regierung (government) oder der staatlich-gesellschaftlichen Handlungskoordination und Steuerung im Bildungssystem (governance) dienen?
- Konsistenz- vs. Diversitäts-Ausrichtung
- kundendienst- vs. service-public-orientiert
- apolitische Sicherung und Rechenschaftslegung vs. soziale Kritik
- Wahlfreiheit und value-for-money im Bildungswesen vs. Anfechtung und Aushandlung
- Evaluation von Lernsystemen vs. Evaluation von stattgefundenem Lernen
- Verbesserung vs. Innovation
- Lokale vs. globale Standards
- Verschmelzung zwischen Evaluation (Programme und Politiken) und Performance-Measurement (einschliesslich Individuen und Organisationen) oder kritisch-konstruktive Distanz.
- Evaluation zum Zweck der Kontrolle oder der Verbesserung
-
Welche Rollen sollten Evaluierende spielen? Messtechniker bzw. Performanz-Auditor versus responsiv-partizipativem Moderator und Broker? Es bedürfe wohl einer Diversifikation von Evaluationsrollen.
-
Welche Art von empirischen Belegen soll in der Evaluation zählen? Hier gebe es drei, teilweise widersprüchliche Tendenzen: a) RCT für Gabelentscheidungen; b) das steigende Interesse an internationalen Vergleichen mit seinen Risiken; c) das Drängen auf Ansätze, die mit gemischten Methoden arbeiten.
-
Wie können gültige Schlussfolgerungen erreicht werden? Verbindungen zu den lokalen Realitäten seien erforderlich; das Paradox der situierten Verallgemeinerung müsse berücksichtigt werden.
-
Wie und wann sollen Stakeholder in die Evaluation einbezogen werden?
-
Wie sollen Evaluierende die Qualität der Evaluationsmethoden selbst sichern?
Abschliessend hebt das Autorenduo hervor:
- eine Weltkultur von Werten, die sich einerseits vermischen, andererseits nationale und lokale Kulturen unterdrückt
- Zentralität von lebenslangem Lernen
- Erfordernis eines methodologischen Pluralismus
Diskussion
Der Sammelband behandelt eine umfassende Thematik, die auch im deutschen Sprachraum von grosser Relevanz ist und wohl noch wichtiger wird: die angesichts der Globalisierung stark angewachsene Bedeutung der Evaluation für Bildungspolitik und Bildungsmanagement, insbesondere im Bereich des öffentlich verantworteten Schulwesens. Inzwischen ist die externe Schulevaluation hier nahezu flächendeckend aufgebaut, Schulleistungsvergleiche gehören zum selbstverständlichen Repertoire der Bildungspolitik; zentrale Leistungstests und Aufgaben-Datenbanken breiten sich ebenso aus wie internetbasierte Instrumenten-Sammlungen für die interne Schulevaluation. An den Universitäten werden vermehrt Zentren und Lehrstühle für empirische Bildungsforschung eingerichtet – all dies unter dem Zeichen eines durch die Globalisierung beschleunigten Bemühens, Effektivität und Effizienz im Bildungswesen zu steigern, um im ökonomischen Standortwettbewerb der Wissensgesellschaften zu bestehen. Das Buch repräsentiert einen bemerkenswerten Versuch, den internationalen Diskurs der über Evaluation und benachbarte Felder Forschenden zu intensivieren, wenn nicht erst in Gang zu setzen. Bedenkt man, dass dieses Vorhaben ohne spezifische Finanzierung gelungen ist, über Grenzen von Nationalstaaten und Kontinente hinweg, wird die Leistung des Herausgeberduos deutlich.
Die überwiegend ökonomisch ausgelösten Entwicklungen im Bildungssystem – daran anschliessend in der Bildungsforschung und Bildungsevaluation – werden teils zustimmend, teils kritisch beschrieben und bewertet. Zentrale Fragestellung ist, wie sich das Verhältnis zwischen externer und interner Evaluation, zwischen den Evaluationszwecken der Rechenschaftslegung und der Verbesserung angesichts dieser mächtigen ökonomischen und politischen Kräfte entwickelt und wie es sich weiter entwickeln soll. Entwicklungen in den Bildungssystemen globalisierter Gesellschaften in mehreren Weltregionen werden beschrieben und daraus Herausforderungen für die professionelle Evaluation destilliert. Mit den zahlreichen Beiträgen sind verschiedenste kulturelle, ethische und methodische Perspektiven vertreten. Gleichzeitig wird deutlich, wie gross die Forschungslücken sind, und wie herausfordernd es ist, die drei komplexen Elemente – Globalisierung, Bildungssysteme und Evaluation – theoretisch und empirisch fundiert in ihren Wechselwirkungen zu analysieren.
Der Sammelband bietet viel Material und zahlreiche gut begründete und konzise Argumente, dass es einer neuartigen Beziehung zwischen externer Evaluation/Schulinspektion einerseits und interner Inhouse-Evaluation/unterrichtsintegrierter Selbstevaluation andererseits bedarf. Er bietet einige, dabei zu wenige Fallstudien und lässt die Lücke empirischer Forschung zu diesen Wechselbeziehungen weitgehend offen. Der überwiegende Teil der Beiträge ist klar strukturiert und behandelt das jeweilige Thema auf der Höhe der Zeit und des aktuellen Forschungsstandes. Allerdings stösst man oft auf allgemeine und sich wiederholende Ausführungen zum Thema Globalisierung. Man hätte sich mehr Fallbeispiele zum Beispiel zu gelingender Kooperation zwischen externer und interner Evaluation gewünscht, doch ist das wohl weniger ein Mangel des Buches sondern der aktuellen Praxis, die noch am oder gar vor dem Anfang steht. Das Buch ist in seiner Dichte und Breite international alleinstehend und damit Referenzwerk für alle Forschung und kritische Reflexion des Verhältnisses zwischen Globalisierung, Bildungssystemen und professioneller Evaluation. Angesichts des Globalisierungsdruckes auf Regierungen, Bildungsadministrationen, Leitende wie Unterrichtende in Schulen, Forschende und Evaluierende, angesichts der Ausbreitung von Leistungsmesssystemen, der Rufe nach Benchmarking und Verstärkung des Wettbewerbs nicht nur zwischen Nationalstaaten sondern auch den Bildungsregionen und einzelnen Schulen schafft es ein intellektuelles Fundament für die wissenschaftliche Auseinandersetzung. Wenn es in der Bildungsforschung und in der Bildungspolitik zu wenig Reflexion zu den geschilderten global fortschreitenden Entwicklungen gibt, so kann man nicht mehr sagen, es fehlten die substantiellen Grundlagen dafür.
Fazit
Die Pioniertat schafft einen wertvollen Überblick über den aktuellen Diskussions- und Forschungsstand zum Verhältnis von Globalisierung, Bildungspolitik und Evaluation, und lenkt den Blick darauf, neben den grossen Messsystemen und zentralen Evaluationsagenturen schulnah bis hin zu unterrichtsnah das Vermögen und die Kompetenzen zur Inhouse- und Selbstevaluation aufzubauen, nicht zuletzt, um originär pädagogischen Werten in einem veränderten ökonomischen und politischen Umfeld Geltungskraft zu verleihen. Dabei ist es mehr Studienbuch, um über ‚Bildungsevaluation in einer globalisierten Welt‘ zu orientieren, als dass es praktisch anleiten würde.
Rezension von
Prof. Dr. Wolfgang Beywl
Fachhochschule Nordwestschweiz, Pädagogische Hochschule, Institut Weiterbildung und Beratung. Professur für Bildungsmanagement und Schulentwicklung – wissenschaftlicher Leiter Univation– Institut für Evaluation, Köln.
Website
Mailformular
Es gibt 21 Rezensionen von Wolfgang Beywl.
Zitiervorschlag
Wolfgang Beywl. Rezension vom 15.02.2012 zu:
Katherine E. Ryan, J. Bradley Cousins: The Sage International Handbook of Educational Evaluation. SAGE Publications, Ltd
(London) 2009.
ISBN 978-1-4129-4068-9.
80.00 Pound (Listenpreis).
In: socialnet Rezensionen, ISSN 2190-9245, https://www.socialnet.de/rezensionen/9647.php, Datum des Zugriffs 28.03.2023.
Urheberrecht
Diese Rezension ist, wie alle anderen Inhalte bei socialnet, urheberrechtlich geschützt.
Falls Sie Interesse an einer Nutzung haben, treffen Sie bitte vorher eine Vereinbarung mit uns.
Gerne steht Ihnen die Redaktion der Rezensionen
für weitere Fragen und Absprachen zur Verfügung.