personalquarterly 02 / 13
48
State of the art
_SUBJEKTIVE LEISTUNGSBEURTEILUNGEN
Hier ist die sogenannte Interrater-Reliabilität von entschei-
dender Bedeutung, die die Korrelation zwischen den Beur-
teilungen desselben Mitarbeiters durch mehrere Vorgesetzte
misst. Ist diese deutlich kleiner als 1, so bedeutet dies, dass
ein und dieselbe Person sehr unterschiedliche Beurteilungen
bekommen kann, wenn sie von zwei verschiedenen Beurteilern
beurteilt wird. Eine immer noch sehr häufig zitierte Meta-Stu-
die von Viswesvaran et al. (1996) ermittelt eine Interrater-Re-
liabilität von subjektiven Beurteilungen der Arbeitsleistung
von nur 0,52.
Werden verschiedene Dimensionen der Arbeitsleistung ge-
trennt beurteilt, so finden sich die höchsten Interrater-Relia-
bilitäten für die Einschätzung von Produktivität und Qualität
und die geringsten für Kommunikationsfähigkeiten und inter-
personelle Kompetenz – die Subjektivität der Beurteilung ist
hier stärker ausgeprägt und führt zu uneinheitlicheren Beur-
teilungen.
Ein Kernproblem subjektiver Beurteilungen liegt also darin,
dass Beurteiler unterschiedliche Maßstäbe anlegen und somit
Beurteilungen, die von unterschiedlichen Vorgesetzten stam-
men, schwerer vergleichbar sind. So finden Kane et al. (1995)
beispielsweise grundlegende Unterschiede in der „Großzügig-
keit“ von Beurteilern. Diese Verzerrungen sowie die Tatsache,
dass Beurteilungsmaßstäbe innerhalb von Unternehmen nicht
einheitlich definiert sind, könnenweitreichende Konsequenzen
haben, da Mitarbeiter unter Umständen nur schwer direkt ver-
glichen werden können und verzerrte Beurteilungen auch zu
Fehlern bei Beförderungen oder Personalentwicklungsmaß-
nahmen führen oder die Fairness oder Leistungsorientierung
von Vergütungssystemen schwächen können.
Beurteilung durch Kollegen und Mitarbeiter
In vielen Fällen wird mittlerweile auch auf die Beurteilung
durch Kollegen oder auch unterstellte Mitarbeiter zurück-
gegriffen – beispielsweise in 360°-Feedbacks. Eine frühe
Meta-Studie von Conway und Huffcutt (1997) zeigt, dass die
Übereinstimmung zwischen subjektiven Beurteilungen mit
der Ebene abnimmt: die Korrelation zwischen Beurteilungen
durch verschiedene Vorgesetzte betrug 0,5 und bei Beurtei-
lungen durch verschiedene Kollegen 0,37. Beurteilungen durch
verschiedene unterstellte Mitarbeiter korrelierten nur noch
mit 0,3. Unterstellte Mitarbeiter betrachten eine Person also
aus deutlich heterogeneren Blickwinkeln als dies Kollegen auf
derselben Ebene tun, die wiederum aber auch unterschied-
licher urteilen als verschiedene Vorgesetzte.
Eine wichtige Frage ist nun, ob die Einbeziehung von Urtei-
len von Kollegen und unterstellten Mitarbeitern zusätzliche
Information bringt. Eine Möglichkeit, diese Frage zu untersu-
chen liegt darin zu prüfen, ob die Beurteilung durch Kollegen
oder unterstellte Mitarbeiter über die Vorgesetztenbeurteilung
hinaus Information enthält, die mit objektiven Leistungskrite-
rien korreliert. Ist dies der Fall, hilft also die Einbeziehung von
Beurteilungen durch Kollegen oder unterstellten Mitarbeitern
dabei, eine bessere Einschätzung der objektiven Leistung zu
erhalten. Eine Meta-Studie von Conway et al. (2001) aggre-
giert nun verschiedene Einzelstudien, die solche Information
bereitstellen und kommt in der Tat zu dem Ergebnis, dass die
zusätzlichen Beurteilungen „inkrementelle Validität“ liefern,
d. h. tatsächlich zu einer besseren Abschätzung objektiver Lei-
stungskriterien beitragen. Einen guten Literaturüberblick zu
empirischen Erkenntnissen über 360°-Feedbacks liefert ein
aktueller Überblicksartikel von Nowack und Mashihi (2012).
Anreizeffekte von subjektiver Leistungsbeurteilung
Aus der Sicht optimaler Anreizsetzung sollten Leistungsbeur-
teilungen dazu führen, dass überdurchschnittliche Leistung
belohnt und schlechte Leistung sanktioniert wird. Ein erheb-
licher Nachteil verzerrter Leistungsbeurteilungen liegt also
aus theoretischer Sicht in der Schwächung des Anreizeffektes,
da der Zusammenhang zwischen tatsächlicher Leistung und
Beurteilung und damit der erwartete Zugewinn eines Mitarbei-
ters aus höherer Anstrengung mit steigender Verzerrung sinkt.
Empirische Evidenz über die Anreizeffekte subjektiver Leis
tungsbeurteilung ist jedoch bisher eher rar, wie beispielsweise
auch Rynes et al. (2005) feststellen: „Although there is a volu-
minous psychological literature on performance evaluation,
surprisingly little of this research examines the consequences
of linking pay to evaluated performance in work settings.”
Erst in den letzten Jahren sind mehr Studien zu dieser Frage
entstanden. Bol (2011) untersucht beispielsweise einen Längs-
schnitt von Mitarbeitern eines niederländischen Finanzdienst-
leisters und findet einen positiven Zusammenhang zwischen
mehr Differenzierung (d. h. einem schwächeren „Centrality
Bias“) in den Leistungsbeurteilungen und nachfolgenden ob-
jektiven Leistungskennzahlen. Basierend auf Personaldaten
der Schweizer Tochtergesellschaft eines internationalen Unter-
nehmens für drei Jahre können Engellandt und Riphahn (2011)
zeigen, dass eine höhere Streuung in den Leistungsbeurtei-
lungen mit einer höheren Performance in der Zukunft, hier
gemessen durch die Anzahl an Überstunden, verbunden ist.
Kampkötter und Sliwka (2011) finden ebenfalls Evidenz für
einen positiven Anreizeffekt von mehr Differenzierung in Bo-
nuszahlungen, basierend auf einem Längsschnitt von mehr
als 40 Unternehmen des deutschen Finanzdienstleistungssek-
tors. In einem kontrollierten Laborexperiment zeigen Berger et
al. (im Erscheinen), dass erzwungene Differenzierung bei der
Leistungsbeurteilung zu mehr Leistung führt.
Auch wenn hier weiterer Forschungsbedarf besteht, so deu-
tet sich also die Erkenntnis an, dass mehr Differenzierung
bei der Leistungsbeurteilung in der Tat positive Anreizeffekte
hat. Vorsicht ist jedoch bei starken Team-Interdependenzen
geboten: Berger et al. zeigen auch, dass erzwungene Differen-