Prof. Dr. Detlef Kreuz

Durchschnittsnote

Früher oder später kommt jeder in die Situation andere zu bewerten. Das ist meistens nicht einfach, stehen doch unterschiedlichste Motive hinter der Bewertung. Zwar gibt es auch rein textuelle Bewertungen, auf Grund unserer Erziehung möchten die meisten Menschen die konkrete Note erfahren. Das gilt selbst für Arbeitszeugnisse, aus denen viele die dahinter stehende Note herauszulesen versuchen. Noten machen Leistungen vermeintlich vergleichbar, wie für manche das Einkommen Menschen vergleichbar zu machen scheint.

Auf das dahinterstehende Menschenbild möchte ich hier nicht eingehen. Unabhängig davon ist es so, dass manche Menschen bestimmte Fähigkeiten besitzen, manche nicht. Das Erlernen von Programmiersprachen bereitet mir selbst viel weniger Probleme, als das Erlernen einer Fremdsprache. Bei anderen ist es sicher genau andersherum. Insofern kann eine Note Feedback über Fähigkeiten, Kenntnisse oder Wissen geben, sofern die Notenvergabe selbst qualitativen Ansprüchen genügt.

Gute Noten, schlechte Wirkung

Eine gute oder sehr gute Note zu vergeben ist einfach. Kaum einer wird sich beschweren, ich muss mich kaum rechtfertigen oder muss gar mit anderen über meine Notenvergabe diskutieren. Im einfachsten Fall gebe ich allen, die nicht aus formalen Gründen in der Prüfung durchgefallen sind, die Note "1,3" / "1-". Diejenigen, die sich schlechter einschätzen, werden sich nicht beschweren. Diejenigen, die eine "1" verdient haben, sind meist so selbstkritisch, dass sie mit dieser Note leben können.

Solch ein Vorgehen hat mindestens zwei Probleme. Erstens, werden so die wirklich guten Leistungen entwertet. Für Außenstehende ist kein direkter Unterschied zwischen einem Studenten, der das Fach sehr gut verstanden hat und zwischen einem, der es gerade so eben verstanden hat, zu erkennen. Damit entziehe ich mich meiner professionellen Aufgabe, genau diese Bewertung durchzuführen. Die Folge ist eine Art Geheimsprache, wie sie auch gerne in Arbeitszeugnissen von manchen gepflegt wird.

Zweitens, gebe ich dem Studenten, der das Fach gerade so eben verstanden hat, keinen Anreiz, besser zu werden. Im Gegenteil, der sehr gute Student erhält keine Anerkennung für seine Leistung. Eine Komponente des Lernens ist Feedback und das entziehe ich über eine solche pauschale Bewertung.

Notenskala

Um nicht nur zwischen "bestanden" und "nicht bestanden" unterscheiden zu können, gibt es eine Notenskala. An meiner Hochschule gibt es zwei Noten, die mehr oder minder starke Nichtbestehen einer Prüfung signalisieren sollen ("4,7" und "5,0"), sowie zehn Noten des unterschiedlich guten Bestehens ("1,0", "1,3", ..., bis "4,0"). An anderen Hochschulen mag es andere (Teil-) Noten geben, aber das ist nicht so wichtig. Dieses Spektrum verschenke ich, wenn ich mich auf eine "1,3" beschränke.

Zu meinem Glück gibt mir die "Studien- und Prüfungsordnung" einen Hinweis, wie eine gute Notenverteilung aussehen sollte. In der aktuell gültiger Fassung heißt es in §11(1):

  • 1 = sehr gut = eine hervorragende Leistung;
  • 2 = gut = eine erheblich über dem Durchschnitt liegende Leistung;
  • 3 = befriedigend = eine Leistung, die durchschnittlichen Anforderungen entspricht;
  • 4 = ausreichend = eine Leistung, die trotz ihrer Mängel noch den Anforderungen genügt;
  • 5 = nicht ausreichend = eine Leistung, die wegen erheblicher Mängel den Anforderungen nicht mehr genügt.

Damit scheint es klar zu sein: im Durchschnitt sollte die Note "3" vergeben werden, mindestens wenn der Durchschnitt der zu bewertenden Menschen meinen durchschnittlichen Anforderungen entspricht. Alles ganz einfach, oder?

Der Durchschnitt und seine Probleme

Um die Qualität meiner Bewertung messen zu können, muss ich nur die Durchschnittsnote berechnen. Bei einer "3" ist alles in Ordnung, bei einer "4" oder "5" waren meine Anforderungen zu groß, bei einer "2" oder "1" waren sie zu gering. Um die erstrebenswerte Note "3" zu erreichen, brauche ich bei einer Klausur nur den Durchschnittswert der erzielten Punkte zu berechnen. Alle anderen Noten ergeben sich daraus.

Ganz so einfach ist es dann doch nicht. In diesem Beispiel könnte ein Student bei gleicher Punktzahl in unterschiedlichen Semestern unterschiedliche Note erzielen. Wenn er Glück hat (oder nachhilft), lässt er sich mit weniger fähigen Menschen vergleichen. Er kann aber auch weniger Glück haben, wenn die Vergleichsgruppe aus wesentlich fähigeren Studenten besteht.

Für mich bedeutet dieses, die Anforderungen unabhängig von den zu bewertenden Menschen zu definieren. Die Durchschnittsnoten können nur ein Baustein sein, um die Qualität meiner Bewertung zu messen. Tatsächlich strebte ich einen langjährigen Durchschnitt der Note "3" an, in der Hoffnung, dass sich die Unterschiede der Studenten über die Zeit hinweg herausmitteln. In letzter Zeit mehrten sich bei mir die Zweifel an diesem Vorgehen.

Aus verschiedenen Gründen stelle ich zum Beispiel in jedem Semester eine andere Klausur, evtl. mit leicht unterschiedlichem Schwierigkeitsgrad. Damit sind die einzelnen Klausuren nicht wirklich vergleichbar. Zum anderen beobachte ich nicht nur semesterweise Unterschiede zwischen Studenten, sondern zusätzlich längerfristige Tendenzen. Seit zehn Semestern unterrichte ich ein Fach, in dem es primär um Anforderungsanalyse geht. In den ersten Prüfungen wurden manche Aufgaben überdurchschnittlich gut beantwortet. Dagegen wurden die gleichen Aufgaben in den letzten Semestern unterdurchschnittlich beantwortet, wenn überhaupt. Die Vorlesung hat sich, was diese Aufgaben betrifft, wenig geändert. Umgekehrt beobachte ich an anderen Fächern Verbesserungen.

Eine reine Berechnung des Durchschnitts sollte auch die Lernprozesse der Studenten einbeziehen. Im oben beschriebenen Fach Anforderungsanalyse hatte ich im letzten Semester die Situation, dass ca. 10 Studenten zur Vorlesung erschienen. An der Prüfung nahmen 32 Studenten teil. Am Ergebnis der Klausur war abzulesen, dass das Lernen der ca. 20 Studenten nicht ausreichend war, um es vorsichtig auszudrücken. Dürfen diese Studenten, die offenbar nicht lernen konnten, in die Berechnung des Durchschnitts einbezogen werden? Ich bezweifle das.

Ein anderes Fach, dass seit einiger Zeit einen Durchschnittswert im Bereich von "4,x" ausweist, kann mit guten Ergebnissen in einem dritten Fach ausgeglichen werden. Diese Ausgleichsmöglichkeit wurde von externer Stelle gefordert. In diesem dritten Fach werden fast immer gute bis sehr gute Noten vergeben (nicht von mir). Einige Studenten haben mir mitgeteilt, dass sie deshalb für "mein" Fach nur oberflächlich lernen. Wie soll in solch einem Fach der Durchschnitt berechnet werden?

Die Studenten können vom Prüfungssystem den Durchschnitt der Bewertungen einer Prüfung erfahren. Lange Zeit war ich verwirrt, da dieser gemeldete Durchschnitt nicht dem von mir errechneten Durchschnitt entspricht. Wenn ich zusätzlich die nicht zur Prüfung erschienenen Studenten mit in die Berechnung einbeziehe, nähern sich beide Werte an. Es bleibt immer die Frage, von was der Durchschnitt berechnet werden soll.

Folgerung

Die Berechnung von Durchschnittsnoten hilft wenig. Sie trägt zur Sicherstellung der Bewertungsqualität kaum etwas bei. Im Gegenteil, sie gaukelt eine mathematische Qualität vor, die sie in der Realität nicht hat.

Ich selbst werde versuchen, die Anforderungen an das jeweilige Fach expliziter zu formulieren. Eine bloße Angabe von (Fach-) Kompetenzen, wie sie seit einiger Zeit in den Modulbeschreibungen gemacht werden, reicht meines Erachtens nicht aus. Die Anforderungen müssen zum einen im Kollegenkreis abgeglichen werden (hochschulinterne Qualitätssicherung) und zum anderen immer wieder explizit den Studenten in Gedächtnis gebracht werden. Es gibt sogar offizielle Wege, auf denen Studenten Feedback über Anforderungen geben können. Diese sollten jene nutzen. Anforderungen dürfen sich ändern.

Wenn ich mir den oben zitierten §11(1) genauer ansehe, steht dort nichts über eine numerische Verteilung der Noten. Dort steht etwas über Anforderungen und Leistungen, mehr nicht. Vielleicht schaffe ich es sogar, meine Anforderungen in Teilen auf Noten abzubilden. Aber das ist ein anderes Thema.

TL;DR: Vergesst Durchschnittsnoten. Traue keiner Statistik, die du nicht selbst gefälscht hast.