War­um Metri­ken in der agi­len Arbeit unver­zicht­bar sind

|

Neu­lich wur­de ich gefragt, was denn gute Metri­ken für die Per­for­mance-Mes­sung von Teams sind. Eine Fra­ge, die sich so leicht und so pau­schal nicht beant­wor­ten lässt. Den­noch will ich es mal versuchen.

Metri­ken für Teams in der agi­len Arbeit sind essen­zi­ell. Ohne sie ist es nahe­zu unmög­lich, den kon­ti­nu­ier­li­chen Ver­bes­se­rungs­pro­zess (KVP), der in der agi­len Arbeits­wei­se tief ver­an­kert ist, wirk­lich zu beur­tei­len. Denn wie willst du wis­sen, ob ein Expe­ri­ment tat­säch­lich eine Ver­bes­se­rung oder eine Ver­schlech­te­rung gebracht hat, wenn du kei­ne ver­läss­li­chen Daten hast?

Wich­ti­ge Metri­ken in der agi­len Teamarbeit

Mög­li­che Metri­ken in der agi­len Team­ar­beit sind viel­fäl­tig und jede bringt ihre eige­nen Vor- und Nach­tei­le mit sich. Hier eine klei­ne Auswahl:

  • Durch­satz (Through­put): Misst die Anzahl der abge­schlos­se­nen Auf­ga­ben inner­halb eines bestimm­ten Zeit­raums. Vor­teil: Leicht ver­ständ­lich und schnell mess­bar. Nach­teil: Kann zulas­ten der Qua­li­tät gehen, wenn der Fokus nur auf Quan­ti­tät liegt.
  • Zyklus­zeit (Cycle Time): Die Zeit, die eine Auf­ga­be benö­tigt, um den gesam­ten Work­flow zu durch­lau­fen. Vor­teil: Gibt ein kla­res Bild über die Effi­zi­enz des Teams. Nach­teil: Stark abhän­gig von äuße­ren Fak­to­ren, die nicht immer im Ein­fluss­be­reich des Teams liegen.
  • Burn-Down-Chart: Zeigt, wie vie­le Auf­ga­ben in einem Sprint noch offen sind. Vor­teil: Sehr visu­ell und intui­tiv. Nach­teil: Kann leicht miss­ver­stan­den wer­den, wenn z.B. Auf­ga­ben falsch geschätzt wurden.
  • Velo­ci­ty: Die Anzahl der Sto­ry Points, die ein Team in einem Sprint abschließt. Vor­teil: Hilft bei der Pla­nung zukünf­ti­ger Sprints. Nach­teil: Kann trü­ge­risch sein, wenn Teams begin­nen, Sto­ry Points zu opti­mie­ren, statt ech­ten Wert zu liefern.
  • Defect Den­si­ty: Anzahl der Feh­ler pro aus­ge­lie­fer­ter Funk­tio­na­li­tät. Vor­teil: Fokus auf Qua­li­tät. Nach­teil: Kann zu defen­si­vem Arbei­ten füh­ren, um Feh­ler zu ver­mei­den, was die Inno­va­ti­ons­freu­de einschränkt.

Die­se Metri­ken las­sen sich übri­gens auch auf ande­re Berei­che jen­seits der Soft­ware­ent­wick­lung über­tra­gen. Zumin­dest aber kann man ähn­li­che Metri­ken finden. 

Kom­ple­xi­tät durch Rückkopplung

Die auf­ge­zähl­ten Metri­ken las­sen sich mit rela­tiv gerin­gen Auf­wand erfas­sen, doch man soll­te nicht die erwähn­ten Nach­tei­le aus dem Blick ver­lie­ren. Ein Pro­blem, das nicht direkt sicht­bar ist, liegt aller­dings noch im Ver­bor­ge­nen: die mög­li­che Rück­kopp­lung der Wer­te unter­ein­an­der. Damit steigt die Kom­ple­xi­tät und damit wird das Nach­voll­zie­hen von Ursa­chen und Wir­kun­gen wäh­rend eines KVP zur Glücks­sa­che. Was mei­ne ich damit:

Legt man zu gro­ßen Wert auf eine der Dimen­sio­nen und bemisst die Per­for­mance nur z.B. am Durch­satz oder Zyklus­zeit, bekommt man am Ende viel­leicht nicht mit, dass gleich­zei­tig womög­lich die Anzahl von Feh­lern steigt. Ein­fa­ches Bei­spiel hier­zu aus der Pra­xis ist die Mes­sung der Per­for­mance in einem fik­ti­ven Call-Cen­ter: Die Mit­ar­bei­ten­den wer­den ange­hal­ten, in einer maxi­ma­len vor­ge­ge­be­nen Zeit die Tele­fon­an­fra­gen durch­zu­füh­ren, damit gleich­zei­tig die Anzahl der erle­dig­ten Anru­fe pro Stun­de steigt. Dass in der Kon­se­quenz die Kun­den­zu­frie­den­heit sinkt, weil Anru­fen­de abge­wim­melt wer­den müs­sen, oder dass die Kun­den jetzt häu­fi­ger anru­fen müs­sen, da ihre Pro­ble­me nicht gelöst wer­den kön­nen in der kur­zen Zeit, wird so nicht erfasst. 

Mehr Daten sind besser

Es ist daher von enor­mer Wich­tig­keit, nicht nur ein­di­men­sio­nal zu den­ken, son­dern mög­lichst vie­le Metri­ken zu erfas­sen, um damit even­tu­ell auf­tre­ten­den Rück­kopp­lun­gen zu erken­nen. Damit steigt natür­lich auch der Auf­wand, sowohl was die Erfas­sung angeht, als auch bei der Aus­wer­tung von Experimenten. 

Sta­bi­li­tät vor Expe­ri­men­ten: War­um Schwan­kun­gen gefähr­lich sind

Bevor man jedoch mit Expe­ri­men­ten beginnt, ist es ent­schei­dend, dass die gewähl­te Metrik eine gewis­se Sta­bi­li­tät erreicht hat. Denn wenn die Wer­te zu stark schwan­ken, ist es unmög­lich zu sagen, ob eine Ver­än­de­rung tat­säch­lich durch das Expe­ri­ment ver­ur­sacht wur­de oder ein­fach nur eine zufäl­li­ge Abwei­chung ist. Nur bei sta­bi­len Metri­ken kann man vali­de Rück­schlüs­se auf die Aus­wir­kun­gen von Ver­än­de­run­gen ziehen.

Team-Gesund­heit: Die wich­tigs­te Metrik?

Was mich per­sön­lich betrifft, so schät­ze ich die Team-Gesund­heit als Metrik am meis­ten. Die­se setzt sich aus ver­schie­de­nen Fak­to­ren zusam­men, wie Kom­mu­ni­ka­ti­on, Wis­sens­aus­tausch, Feed­back­kul­tur, Com­mit­ment, Moti­va­ti­on, Ver­trau­en, Sicher­heit und ähn­li­chen Aspek­ten. Aus mei­ner Erfah­rung sind Teams mit hoher Team-Gesund­heit ohne­hin moti­viert und lie­fern dem­entspre­chend hohe Qua­li­tät ab. Vie­le der Pro­ble­me, die man sonst durch tech­ni­sche Metri­ken zu erfas­sen ver­sucht, lösen sich dann qua­si von selbst.

Wie kann man mul­ti­di­men­sio­na­le Metri­ken erfassen?

Sowohl bei der Team-Gesund­heit als auch bei den wei­ter oben erwähn­ten Wer­ten stellt sich die Fra­ge, wie man die­se erfas­sen und dar­stel­len kann. Sehr gut eige­nen sich soge­nann­te Netz­dia­gram­me (auch Spin­nen­netz- oder Radar­dia­gram­me genannt), bei denen rela­tiv vie­le Dimen­sio­nen kon­ti­nu­ier­lich erfasst wer­den und über die Zeit mit­ein­an­der ver­glei­chen wer­den kön­nen. Jede Ach­se hat eine Ska­la von 1 bis 10. Die Team­mit­glie­der bewer­ten indi­vi­du­ell jede der Ska­len und am Ende wer­den mit­tels Mit­tel- und Min/­Max-Wer­ten die Daten visua­li­siert. Zu bes­se­ren Aus­wer­tung kann man die jewei­li­gen Wer­te pro Ach­sen ver­bin­den und es kann mit der Aus­wer­tung begon­nen werden. 

Fazit: Der Schlüs­sel zum nach­hal­ti­gen Erfolg

In einem gesun­den Team stimmt die Dyna­mik, und das merkt man nicht nur an den Ergeb­nis­sen, son­dern auch an der Art und Wei­se, wie das Team arbei­tet. Für mich ist das der eigent­li­che Schlüs­sel zu nach­hal­ti­gem Erfolg in der agi­len Arbeit. Die­se Sicht­wei­se fin­det sich auch direkt in den Prin­zi­pi­en des agi­len Mani­fests wie­der. Zum Beispiel: 

Errich­te Pro­jek­te rund um moti­vier­te Indi­vi­du­en. Gib ihnen das Umfeld und die Unter­stüt­zung, die sie benö­ti­gen, und ver­traue dar­auf, dass sie die Auf­ga­be erledigen.

(Prin­zi­pi­en hin­ter dem Agi­len Mani­fest)

Ein star­kes, gesun­des Team setzt genau die­ses Prin­zip um und lie­fert so auto­ma­tisch Qua­li­tät – vie­le Pro­ble­me lösen sich dann qua­si von selbst. Eine stei­le The­se, nicht wahr?

Es gibt durch­aus wis­sen­schaft­li­chen Stu­di­en aus dem Bereich der Arbeits- und Orga­ni­sa­ti­ons­psy­cho­lo­gie, die der Fra­ge nach­ge­hen, ob es einen Zusam­men­hang zwi­schen Arbeits­zu­frie­den­heit (= hohe Team-Gesund­heit) und der Leis­tung gibt. Die Lage ist aller­dings nicht ein­deu­tig, wie bei­spiels­wei­se die Meta-Ana­ly­se von Judge, Timo­thy A., et al. dar­legt (vgl. JUDGE, Timo­thy A., et al. The job satisfaction–job per­for­mance rela­ti­onship: A qua­li­ta­ti­ve and quan­ti­ta­ti­ve review. Psy­cho­lo­gi­cal bul­le­tin, 2001, 127. Jg., Nr. 3, S. 376. DOI: I0.1037//0033–2909.I27.3.376)

Aber, wie ich bereits wei­ter oben geschrie­ben habe, sind mehr Daten bes­ser als weni­ger. Man kann also sowohl die Team-Gesund­heit als auch die tech­ni­schen Wer­te erfas­sen und selbst kon­trol­lie­ren, ob mei­ne Hypo­the­se rich­tig ist, oder viel­leicht mit mehr „Hap­pi­ness“ die Feh­ler zuneh­men, weil man nach­läs­si­ger wird und Flüch­tig­keits­feh­ler häu­fi­ger über­se­hen werden.