Neulich wurde ich gefragt, was denn gute Metriken für die Performance-Messung von Teams sind. Eine Frage, die sich so leicht und so pauschal nicht beantworten lässt. Dennoch will ich es mal versuchen.
Metriken für Teams in der agilen Arbeit sind essenziell. Ohne sie ist es nahezu unmöglich, den kontinuierlichen Verbesserungsprozess (KVP), der in der agilen Arbeitsweise tief verankert ist, wirklich zu beurteilen. Denn wie willst du wissen, ob ein Experiment tatsächlich eine Verbesserung oder eine Verschlechterung gebracht hat, wenn du keine verlässlichen Daten hast?
Wichtige Metriken in der agilen Teamarbeit
Mögliche Metriken in der agilen Teamarbeit sind vielfältig und jede bringt ihre eigenen Vor- und Nachteile mit sich. Hier eine kleine Auswahl:
- Durchsatz (Throughput): Misst die Anzahl der abgeschlossenen Aufgaben innerhalb eines bestimmten Zeitraums. Vorteil: Leicht verständlich und schnell messbar. Nachteil: Kann zulasten der Qualität gehen, wenn der Fokus nur auf Quantität liegt.
- Zykluszeit (Cycle Time): Die Zeit, die eine Aufgabe benötigt, um den gesamten Workflow zu durchlaufen. Vorteil: Gibt ein klares Bild über die Effizienz des Teams. Nachteil: Stark abhängig von äußeren Faktoren, die nicht immer im Einflussbereich des Teams liegen.
- Burn-Down-Chart: Zeigt, wie viele Aufgaben in einem Sprint noch offen sind. Vorteil: Sehr visuell und intuitiv. Nachteil: Kann leicht missverstanden werden, wenn z.B. Aufgaben falsch geschätzt wurden.
- Velocity: Die Anzahl der Story Points, die ein Team in einem Sprint abschließt. Vorteil: Hilft bei der Planung zukünftiger Sprints. Nachteil: Kann trügerisch sein, wenn Teams beginnen, Story Points zu optimieren, statt echten Wert zu liefern.
- Defect Density: Anzahl der Fehler pro ausgelieferter Funktionalität. Vorteil: Fokus auf Qualität. Nachteil: Kann zu defensivem Arbeiten führen, um Fehler zu vermeiden, was die Innovationsfreude einschränkt.
Diese Metriken lassen sich übrigens auch auf andere Bereiche jenseits der Softwareentwicklung übertragen. Zumindest aber kann man ähnliche Metriken finden.
Komplexität durch Rückkopplung
Die aufgezählten Metriken lassen sich mit relativ geringen Aufwand erfassen, doch man sollte nicht die erwähnten Nachteile aus dem Blick verlieren. Ein Problem, das nicht direkt sichtbar ist, liegt allerdings noch im Verborgenen: die mögliche Rückkopplung der Werte untereinander. Damit steigt die Komplexität und damit wird das Nachvollziehen von Ursachen und Wirkungen während eines KVP zur Glückssache. Was meine ich damit:
Legt man zu großen Wert auf eine der Dimensionen und bemisst die Performance nur z.B. am Durchsatz oder Zykluszeit, bekommt man am Ende vielleicht nicht mit, dass gleichzeitig womöglich die Anzahl von Fehlern steigt. Einfaches Beispiel hierzu aus der Praxis ist die Messung der Performance in einem fiktiven Call-Center: Die Mitarbeitenden werden angehalten, in einer maximalen vorgegebenen Zeit die Telefonanfragen durchzuführen, damit gleichzeitig die Anzahl der erledigten Anrufe pro Stunde steigt. Dass in der Konsequenz die Kundenzufriedenheit sinkt, weil Anrufende abgewimmelt werden müssen, oder dass die Kunden jetzt häufiger anrufen müssen, da ihre Probleme nicht gelöst werden können in der kurzen Zeit, wird so nicht erfasst.
Mehr Daten sind besser
Es ist daher von enormer Wichtigkeit, nicht nur eindimensional zu denken, sondern möglichst viele Metriken zu erfassen, um damit eventuell auftretenden Rückkopplungen zu erkennen. Damit steigt natürlich auch der Aufwand, sowohl was die Erfassung angeht, als auch bei der Auswertung von Experimenten.
Stabilität vor Experimenten: Warum Schwankungen gefährlich sind
Bevor man jedoch mit Experimenten beginnt, ist es entscheidend, dass die gewählte Metrik eine gewisse Stabilität erreicht hat. Denn wenn die Werte zu stark schwanken, ist es unmöglich zu sagen, ob eine Veränderung tatsächlich durch das Experiment verursacht wurde oder einfach nur eine zufällige Abweichung ist. Nur bei stabilen Metriken kann man valide Rückschlüsse auf die Auswirkungen von Veränderungen ziehen.
Team-Gesundheit: Die wichtigste Metrik?
Was mich persönlich betrifft, so schätze ich die Team-Gesundheit als Metrik am meisten. Diese setzt sich aus verschiedenen Faktoren zusammen, wie Kommunikation, Wissensaustausch, Feedbackkultur, Commitment, Motivation, Vertrauen, Sicherheit und ähnlichen Aspekten. Aus meiner Erfahrung sind Teams mit hoher Team-Gesundheit ohnehin motiviert und liefern dementsprechend hohe Qualität ab. Viele der Probleme, die man sonst durch technische Metriken zu erfassen versucht, lösen sich dann quasi von selbst.
Wie kann man multidimensionale Metriken erfassen?
Sowohl bei der Team-Gesundheit als auch bei den weiter oben erwähnten Werten stellt sich die Frage, wie man diese erfassen und darstellen kann. Sehr gut eigenen sich sogenannte Netzdiagramme (auch Spinnennetz- oder Radardiagramme genannt), bei denen relativ viele Dimensionen kontinuierlich erfasst werden und über die Zeit miteinander vergleichen werden können. Jede Achse hat eine Skala von 1 bis 10. Die Teammitglieder bewerten individuell jede der Skalen und am Ende werden mittels Mittel- und Min/Max-Werten die Daten visualisiert. Zu besseren Auswertung kann man die jeweiligen Werte pro Achsen verbinden und es kann mit der Auswertung begonnen werden.
Fazit: Der Schlüssel zum nachhaltigen Erfolg
In einem gesunden Team stimmt die Dynamik, und das merkt man nicht nur an den Ergebnissen, sondern auch an der Art und Weise, wie das Team arbeitet. Für mich ist das der eigentliche Schlüssel zu nachhaltigem Erfolg in der agilen Arbeit. Diese Sichtweise findet sich auch direkt in den Prinzipien des agilen Manifests wieder. Zum Beispiel:
Errichte Projekte rund um motivierte Individuen. Gib ihnen das Umfeld und die Unterstützung, die sie benötigen, und vertraue darauf, dass sie die Aufgabe erledigen.
Ein starkes, gesundes Team setzt genau dieses Prinzip um und liefert so automatisch Qualität – viele Probleme lösen sich dann quasi von selbst. Eine steile These, nicht wahr?
Es gibt durchaus wissenschaftlichen Studien aus dem Bereich der Arbeits- und Organisationspsychologie, die der Frage nachgehen, ob es einen Zusammenhang zwischen Arbeitszufriedenheit (= hohe Team-Gesundheit) und der Leistung gibt. Die Lage ist allerdings nicht eindeutig, wie beispielsweise die Meta-Analyse von Judge, Timothy A., et al. darlegt (vgl. JUDGE, Timothy A., et al. The job satisfaction–job performance relationship: A qualitative and quantitative review. Psychological bulletin, 2001, 127. Jg., Nr. 3, S. 376. DOI: I0.1037//0033–2909.I27.3.376)
Aber, wie ich bereits weiter oben geschrieben habe, sind mehr Daten besser als weniger. Man kann also sowohl die Team-Gesundheit als auch die technischen Werte erfassen und selbst kontrollieren, ob meine Hypothese richtig ist, oder vielleicht mit mehr „Happiness“ die Fehler zunehmen, weil man nachlässiger wird und Flüchtigkeitsfehler häufiger übersehen werden.