Die ehrliche Antwort auf die Produktivitätsfrage
Generative KI wird die Produktivität Ihres Teams nicht über Nacht explodieren lassen, und der Grund dafür ist nicht das Modell, sondern alles drumherum. Das ist die unbequeme Schlussfolgerung, sobald man den Hype von 2026 neben die Daten und die Wirtschaftsgeschichte legt. KI hilft wirklich bei Recherche, Standardcode, ersten Entwürfen und Reviews. Der Fehler liegt darin, ein Verzehnfachen über Nacht zu erwarten. Der Engpass sind Prozesse, Urteilsvermögen und eine Steuer des Informationsrauschens, nicht die Leistungsfähigkeit des Werkzeugs.
Ich führe eine WordPress-Agentur. Ich nutze diese Werkzeuge täglich. Das ist keine bewusste Provokation für Klicks. Es ist die Sicht aus der Projektarbeit heraus, dort, wo die Kluft zwischen einer überzeugenden Demo und einer ausgelieferten, wartbaren Website genau die Stelle ist, an der die versprochenen Gewinne zu verdunsten pflegen. Das Problem ist nicht die Begeisterung. Das Problem ist das Tempo, das wir erwarten.
Ein Bonmot von 1987, das immer wiederkehrt
Beginnen wir mit dem Satz, der dem ganzen Phänomen seinen Namen gab. 1987 beobachtete der Nobelpreisträger Robert Solow in der New York Times, dass man “das Computerzeitalter überall sehen kann, nur nicht in den Produktivitätsstatistiken”. Computer standen auf jedem Schreibtisch. Die aggregierten Zahlen bewegten sich nicht so, wie es die Prospekte versprachen. Diese Beobachtung säte das, was Ökonomen heute das Produktivitätsparadox oder das Solow-Paradox nennen.
Es wäre bequem, das als uralte Geschichte aus der Ära der beigefarbenen Computertürme abzutun. Erik Brynjolfsson vom MIT tat das nicht. In einem Artikel von 1993 prägte er “The Productivity Paradox of Information Technology” und argumentierte sorgfältig, dass das Fehlen sichtbarer Gewinne nicht bedeute, die Technologie sei nutzlos. Es bedeute, dass Messung, Verzögerung und Missmanagement den Wert verbargen. Seine jüngeren Arbeiten legen nahe, dass sich die Gegenwart mit den späten 1980er-Jahren reimt: die Leistungsfähigkeit ist real, der Ertrag verzögert, und ein Großteil der frühen Enttäuschung ist selbst verschuldet.
Das ist der erste Grund für Skepsis gegenüber der Geschichte vom Zehnfachen über Nacht. Wir haben dieses Experiment bereits durchgeführt, mit einer Universaltechnologie, die mindestens so folgenreich ist wie generative KI, und die Produktivitätskurve bog nicht in dem Zeitplan ab, den die Anbieter wollten.
Elektrifizierung, oder warum 40 Jahre eine echte Zahl sind
Die tiefere Erklärung stammt vom Wirtschaftshistoriker Paul A. David. Sein Argument ist unverblümt: echte Gewinne treten erst ein, wenn die Welt um eine Technologie herum neu aufgebaut wird. Sein durchgerechnetes Beispiel ist der Elektromotor. Fabriken wurden nicht in dem Moment produktiver, in dem sie Dampf gegen Elektrizität tauschten. Sie wurden produktiver, sobald sie um die Elektrizität herum neu gestaltet wurden, was rund 40 Jahre dauerte.
Der Grund ist physisch und organisatorisch. Fabriken der Dampfära waren um eine einzige zentrale Maschine und einen Wald aus Riemen und Wellen herum gebaut. Der eigentliche Vorteil der Elektrizität, der Einzelantriebsmotor an jeder Maschine, zahlte sich erst aus, als die Fabrikbesitzer das alte mehrstöckige Layout aufgaben und einstöckige Werke bauten, in denen Maschinen nach Arbeitsablauf statt nach Nähe zur Antriebswelle angeordnet werden konnten. Die Technologie war jahrzehntelang verfügbar, bevor Gebäude, Management und Arbeitspraktiken nachzogen. Erst dann bewegten sich die Statistiken.
Wenden Sie diese Linse auf eine WordPress-Agentur im Jahr 2026 an. Sie können heute einen KI-Assistenten in den Block-Editor setzen. Aber Ihr Aufnahmeprozess, Ihr QA-Gate, Ihre Übergabe an Kunden, Ihr Abrechnungsmodell und Ihre Definition von “fertig” wurden alle für eine Welt entworfen, in der ein Mensch jede Zeile schrieb. Der Motor steht auf der Werkbank. Die Fabrik ist noch nicht neu gebaut.
Die Zahl, die niemand zitiert: etwa 3 Prozent
Hier wird die Polemik konkret. Frühe, dem MIT nahestehende Behauptungen kursierten mit Effizienzsteigerungen in der Größenordnung von 40 Prozent für KI-gestützte Wissensarbeit. Diese Zahl verbreitete sich schnell, weil sie Budgets rechtfertigte. Dann maß eine Studie des National Bureau of Economic Research vom Frühjahr 2025 das Ganze sorgfältiger und fand, dass der durchschnittlich gemessene Effizienzgewinn durch KI-Werkzeuge bei etwa 3 Prozent lag. Nicht 40. Drei.
Schlimmer für den Hype: dieselbe Forschung fand, dass KI bei komplexeren, urteilsintensiven Aufgaben mitunter der Motivation und der Qualität schadete. Das deckt sich mit dem, was ich in der Praxis sehe. Ein Modell bitten, ein Grundgerüst für einen Custom-Block zu erstellen, einen Migrationsplan zu entwerfen oder ein Plugin-Changelog zusammenzufassen: netto positiv, manchmal deutlich. Es bitten, eine Architekturentscheidung zu treffen, ob ein Kunde ein Headless-Frontend oder einen gehärteten klassischen Stack braucht: netto negativ, sobald jemand die Ausgabe als Antwort behandelt statt als Ausgangsposition, mit der man streitet.
Drei Prozent sind nicht nichts. Über ein Jahr, über ein Team hinweg aufgezinst, sind drei Prozent echtes Geld. Aber drei Prozent sind keine Revolution, um die man in einem Quartal seinen Einstellungsplan umbaut. Es ist die Art von Gewinn, der sich nur zeigt, wenn man die Disziplin hält, ihn einzufangen, und der in dem Moment verschwindet, in dem man das Werkzeug Arbeit erzeugen lässt, die niemand brauchte.
Volumen ist nicht Wert
Die nützlichere Rahmung dessen, woher die Gewinne tatsächlich kommen, findet sich in einem EY-Bericht zu KI und Produktivität. Sein zentraler Schritt ist es, die Produktivität des Volumens von der Produktivität des Werts zu trennen. Generative KI dehnt die Automatisierung über repetitive Aufgaben hinaus in die Wissens- und Kreativarbeit aus, was wirklich neu ist. Doch die Gewinne, die zählen, liegen laut EY in Qualität, Kreativität und der Geschwindigkeit von Entscheidungen, nicht im reinen Output.
In einem optimistischen Modell beziffert derselbe Bericht den Beitrag von KI auf rund 3 Prozent zusätzlich zum globalen BIP bis 2033. Beachten Sie das Datum. Nicht bis zum nächsten Quartal. Bis 2033. Das ist, wiederum, der Takt des Prozesswandels, nicht der Modell-Releases.
Die Unterscheidung zwischen Volumen und Wert ist die praktisch nützlichste Idee in dieser ganzen Debatte für eine Agentur. Wenn Sie Ihre KI-Nutzung daran messen, wie viele Wörter, Entwürfe oder Tickets sie produziert, werden Sie den Sieg ausrufen, während Sie still ertrinken. Wenn Sie sie daran messen, wie schnell Sie zu einer guten Entscheidung gelangen und wie wenig Sie nacharbeiten müssen, werden Sie herausfinden, ob sie funktioniert.
Drei Wege, auf denen die Gewinne versickern
Über jede Welle enttäuschender Technologieadoption hinweg wiederholen sich dieselben drei Mechanismen. Es lohnt sich, sie zu benennen, weil jeder ein direktes WordPress-Pendant hat.
| Mechanismus | Das allgemeine Muster | Die WordPress-Version 2026 |
|---|---|---|
| Werkzeuge ohne Prozesswandel | Die Technologie kaufen, aber den alten Arbeitsablauf behalten, sodass sie zu einer kostspieligen Schicht über der bisherigen Arbeitsweise wird | Ein KI-Panel auf eine unveränderte Aufnahme-, Build- und QA-Pipeline schrauben und erwarten, dass es sich aufzinst |
| Die Anpassungsverzögerung | Standards, Regulierung und Kultur müssen sich ändern, bevor die Gewinne eintreffen, so Paul A. David | Teams, Verträge und Kundenerwartungen gehen durchgehend noch von handgeschriebener Arbeit aus |
| Nebenwirkungen, die die Gewinne auffressen | 1966 erzeugten Computer mehr Berichte, als Manager lesen konnten | Eine Flut von KI-generierten Entwürfen, Briefings und Zusammenfassungen mit geringem realen Wert, die jemand dennoch sichten muss |
Die dritte Zeile würde ich unterstreichen. Das Problem von 1966 war real: die Maschine konnte mehr Managementberichte erzeugen, als irgendein Manager aufnehmen konnte, sodass der Engpass von der Produktion der Information zu deren Lesen wanderte. Die Version von 2026 ist die Flut von KI-generiertem Allem. Pull Requests, die niemand vollständig geprüft hat. Dokumentation, die erzeugt wurde, um eine Checkliste zu erfüllen. Kundentexte, in Sekunden entworfen und dann eine Stunde lang zerredet. Das Modell machte den billigen Teil billiger und schob die Kosten in den teuren Teil: menschliche Aufmerksamkeit und Urteilsvermögen. Das ist die Steuer des Informationsrauschens, und sie ist auf jedem Dashboard, das Output zählt, unsichtbar.
Zwei echte Fälle aus der Projektpraxis
Bei Abstraktionen nickt man leicht zustimmend, deshalb hier zwei gegensätzliche Fälle aus der Art von Arbeit, die eine Agentur tatsächlich leistet.
Fall eins. Ein WooCommerce-Shop mit mehr als 30 Plugins und einer Time-to-First-Byte von rund 1,8 Sekunden. Der Inhaber hatte gehört, KI könne “die Performance reparieren”, und wollte, dass wir ein Werkzeug darauf ansetzen. Wir nutzten KI tatsächlich stark, aber nicht so, wie er es sich vorstellte. Sie war hervorragend bei den abgegrenzten, lesbaren Teilen: sortieren, welche Plugins die meisten Abfragen auslösten, die erste Version einer Transient-Caching-Schicht entwerfen, Testfälle für eine Checkout-Regressionssuite erzeugen, einen unbekannten Drittanbieter-Hook erklären. Was sie nicht konnte, war zu entscheiden, dass die eigentliche Lösung darin bestand, elf Plugins zu entfernen und zwei als kleines Custom-Plugin neu zu bauen, denn diese Entscheidung verlangte, die Roadmap des Kunden, seine internen Kompetenzen und seine Risikobereitschaft abzuwägen. Die KI komprimierte die lesbaren 60 Prozent der Aufgabe. Die unlesbaren 40 Prozent, der Teil, der tatsächlich der Engpass war, konnte sie nicht berücksichtigen. Nettoergebnis: schneller, ja. Zehnmal schneller, nein. Das Urteilsvermögen war immer der begrenzende Faktor, und unsere WordPress-Wartung und -Pflege besteht größtenteils aus Urteilsvermögen.
Fall zwei. Eine Elementor-Website, die unter einem Traffic-Ansturm durch eine Kampagne zusammenbrach. Hier war die Versuchung, KI eine Mauer aus “Optimierungs”-Empfehlungen erzeugen zu lassen, und sie hätte das bereitwillig getan. Genau das ist die Falle des Informationsrauschens. Ein Modell wird zwanzig plausible Vorschläge produzieren, achtzehn davon generisch und zwei davon wichtig, und nun muss eine erfahrene Person ihre knappste Ressource, Aufmerksamkeit, darauf verwenden, Signal von selbstsicher klingendem Rauschen zu trennen. Der Erfolg kam, als ein Mensch entschied, aggressiv am Edge zu cachen und die schwersten Widgets des Page-Builders zu verzögern, und KI dann nur für den Entwurf der Umsetzung nutzte. Das Nachdenken war der langsame Teil. Das Tippen war der schnelle Teil. KI beschleunigte das Tippen.
Das Muster in beiden Fällen: KI ist ein Multiplikator auf den Teilen der Arbeit, die nie der Engpass waren. Der Engpass ist das Urteilsvermögen, und Urteilsvermögen hat keinen Zehnfach-Knopf.
Was das für WordPress 7.0 und KI-Funktionen bedeutet
WordPress 7.0 liefert native KI-Fähigkeiten aus, die tiefer in der Bearbeitungs- und Workflow-Oberfläche verankert sind als alles zuvor. Das ist wirklich nützlich, und ich argumentiere nicht dagegen. Ich argumentiere gegen das Tempo, das die Leute davon erwarten.
Wenn Sie die KI-Funktionen von WordPress 7.0 als Schicht behandeln, die Sie auf Ihren aktuellen Prozess aufschrauben, erhalten Sie das Ergebnis von 1966: mehr Entwürfe, mehr Vorschläge, mehr “Content”, und ein Team, das seine zurückgewonnene Zeit still damit verbringt, Material zu prüfen, das nie hätte erzeugt werden dürfen. Das sind Mechanismus eins und Mechanismus drei, die zusammenwirken.
Wenn Sie es stattdessen als Anlass behandeln, den Arbeitsablauf neu zu gestalten, so wie Fabrikbesitzer schließlich um den Elektromotor herum neu gestalteten, sind die Gewinne real und dauerhaft. Konkret heißt das, im Voraus zu entscheiden, welche Aufgaben KI entwirft, welche ein Mensch prüfen muss, bevor irgendetwas ausgeliefert wird, und welche Sie schlicht ablehnen zu automatisieren, weil die Urteilskosten genau der Punkt sind. Es heißt, Durchlaufzeit und Nacharbeitsquote zu messen, nicht Wortzahl oder Ticket-Durchsatz. Es heißt, ehrlich zu sein, dass sich der Wert eines WordPress-Entwicklers hin zu den Entscheidungen verschiebt, die KI nicht treffen kann, nicht von ihnen weg.
Bei der Preisgestaltung ist es dieselbe Geschichte. Kunden nehmen manchmal an, KI müsse alles billiger machen, weil das Tippen billiger ist. Das Tippen war nie der teure Teil. Die Architektur, die Sicherheitslage, das Performance-Budget, die Barrierefreiheits-Konformität, die Entscheidung, was man nicht baut: das ist die Arbeit, und deshalb bleibt unsere Preisgestaltung individuell statt eine Ware pro Wort. KI senkt die Kosten der lesbaren Aufgaben und hebt den relativen Wert der unlesbaren.
Was Sie also tatsächlich tun sollten
Nichts davon ist ein Argument, KI zu ignorieren. Es ist ein Argument, das richtige Tempo und die richtigen Messgrößen zu setzen. Wenn ich die fundierte Einschätzung auf eine Handvoll Betriebsregeln verdichten müsste:
- Setzen Sie KI zuerst für die abgegrenzten, lesbaren Aufgaben ein: Recherche, Standardcode, erste Entwürfe, Test-Gerüste, Code- und Content-Review. Dort liegen die gemessenen Gewinne wirklich.
- Gestalten Sie den umgebenden Prozess neu, bevor Sie aufgezinste Erträge erwarten. Das Werkzeug ist der Elektromotor. Sie müssen die Fabrik trotzdem neu bauen.
- Budgetieren Sie die Steuer des Informationsrauschens ausdrücklich ein. Jedes Stück KI-generierter Arbeit ist ein Entwurf, dessen Prüfung menschliche Aufmerksamkeit kostet. Wenn das Prüfen mehr kostet als das Schreiben, haben Sie verloren.
- Messen Sie Wert, nicht Volumen. Durchlaufzeit, Nacharbeitsquote und Entscheidungsgeschwindigkeit sagen Ihnen, ob KI hilft. Output-Zahlen sagen Ihnen nichts Nützliches und schmeicheln Ihnen in die Selbstzufriedenheit.
- Halten Sie Menschen bei den Urteilsentscheidungen. Bei komplexen, urteilsintensiven Aufgaben zeigen die NBER-Daten, dass KI der Qualität schaden kann. Behandeln Sie ihre Ausgabe als zu prüfendes Argument, niemals als auslieferungsreife Antwort.
Es geht um das Tempo, nicht um das Werkzeug
Das Produktivitätsparadox ist keine Vorhersage, dass KI scheitert. Solows Computer tauchten schließlich doch in den Statistiken auf, Jahrzehnte später, als sich die Welt um sie herum neu organisiert hatte. Brynjolfssons Verzögerung löste sich auf. Davids Elektromotor formte die Fertigung um, vierzig Jahre danach. Die Technologie war jedes Mal real. Die Enttäuschung drehte sich stets darum, den Gewinn nach dem Kalender der Marketingabteilung zu erwarten statt nach dem Kalender des organisatorischen Wandels.
Generative KI im Jahr 2026 ist dieselbe Form der Geschichte. Etwa 3 Prozent heute gemessen, plausibel deutlich mehr in den frühen 2030er-Jahren, aber nur für die Teams, die diszipliniert genug sind, ihren Prozess um sie herum neu zu bauen, und ehrlich genug, Wert statt Volumen zu zählen. Das Problem war nie die Begeisterung. Das Problem ist das Tempo, das wir erwarten. Bringen Sie das Tempo richtig hin, und das Paradox ist keine Warnung. Es ist eine Roadmap.
Zuletzt aktualisiert: 31. Mai 2026.



