Det ærlige svaret på produktivitetsspørsmålet
Generativ KI kommer ikke til å få produktiviteten til teamet ditt til å eksplodere over natten, og grunnen er ikke modellen, men alt rundt den. Det er den ubehagelige konklusjonen så snart du legger hypen fra 2026 ved siden av dataene og økonomihistorien. KI hjelper virkelig med research, standardkode, første utkast og gjennomgang. Feilen er å forvente en tidobling over natten. Flaskehalsen er prosess, dømmekraft og en skatt på informasjonsstøy, ikke verktøyets kapasitet.
Jeg driver et WordPress-byrå. Jeg bruker disse verktøyene hver dag. Dette er ingen kontrær positur for klikk. Det er synet innenfra leveransen, der gapet mellom en overbevisende demo og et levert, vedlikeholdbart nettsted er nettopp stedet der de lovede gevinstene pleier å fordampe. Problemet er ikke entusiasmen. Problemet er tempoet vi forventer.
En spissformulering fra 1987 som stadig dukker opp igjen
Start med utsagnet som ga hele fenomenet navn. I 1987 observerte nobelprisvinneren Robert Solow i The New York Times at du “kan se datamaskinalderen overalt unntatt i produktivitetsstatistikken”. Datamaskiner sto på hvert skrivebord. De aggregerte tallene beveget seg ikke slik brosjyrene lovet. Den observasjonen sådde det økonomer i dag kaller produktivitetsparadokset, eller Solow-paradokset.
Det ville vært beleilig å avfeie dette som eldgammel historie fra de beige tårnkabinettenes tid. Erik Brynjolfsson ved MIT gjorde ikke det. I en artikkel fra 1993 lanserte han “The Productivity Paradox of Information Technology” og argumenterte nøye for at fraværet av synlige gevinster ikke betydde at teknologien var ubrukelig. Det betydde at måling, etterslep og dårlig styring skjulte verdien. Hans nyere arbeid argumenterer for at dagens situasjon kan rime med slutten av 1980-tallet: kapasiteten er reell, gevinsten er forsinket, og mye av den tidlige skuffelsen er selvpåført.
Det er den første grunnen til skepsis mot historien om tidobling over natten. Vi har kjørt dette eksperimentet før, med en generell teknologi som er minst like betydningsfull som generativ KI, og produktivitetskurven bøyde ikke av etter tidsplanen leverandørene ønsket.
Elektrifisering, eller hvorfor 40 år er et reelt tall
Den dypere forklaringen kommer fra økonomihistorikeren Paul A. David. Argumentet hans er rett på sak: reelle gevinster kommer først når verden rundt en teknologi bygges om. Det gjennomregnede eksempelet hans er elektromotoren. Fabrikker ble ikke mer produktive i det øyeblikket de byttet damp mot elektrisitet. De ble mer produktive da de ble redesignet rundt elektrisiteten, noe som tok rundt 40 år.
Grunnen er fysisk og organisatorisk. Fabrikker fra dampalderen var bygd rundt én sentral maskin og en skog av remmer og aksler. Elektrisitetens egentlige fordel, enhetsdrevet motor på hver maskin, lønnet seg først da fabrikkeierne forlot den gamle fleretasjeslayouten og bygde enetasjes anlegg der maskinene kunne plasseres etter arbeidsflyt i stedet for etter nærhet til drivakselen. Teknologien var tilgjengelig i flere tiår før bygningene, ledelsen og arbeidspraksisene tok igjen. Først da beveget statistikken seg.
Bruk det perspektivet på et WordPress-byrå i 2026. Du kan legge en KI-assistent inn i blokkeditoren i dag. Men inntaksprosessen din, QA-porten din, overleveringen til kundene, faktureringsmodellen din og definisjonen din av “ferdig” ble alle utformet for en verden der et menneske skrev hver linje. Motoren ligger på arbeidsbenken. Fabrikken er ikke bygd om.
Tallet ingen siterer tilbake: om lag 3 prosent
Her blir polemikken konkret. Tidlige påstander nær MIT-miljøet svevde rundt effektivitetsforbedringer i størrelsesorden 40 prosent for KI-støttet kunnskapsarbeid. Det tallet spredte seg fort fordi det rettferdiggjorde budsjetter. Så målte en studie fra National Bureau of Economic Research våren 2025 dette mer nøye og fant at den gjennomsnittlig målte effektivitetsgevinsten fra KI-verktøy var om lag 3 prosent. Ikke 40. Tre.
Verre for hypen: den samme forskningen fant at på mer komplekse, dømmekraftstunge oppgaver skadet KI noen ganger motivasjon og kvalitet. Det stemmer med det jeg ser i praksis. Å be en modell sette opp et stillas for en egendefinert blokk, lage utkast til en migreringsplan eller oppsummere en endringslogg for en plugin: netto positivt, av og til betydelig. Å be den ta en arkitekturbeslutning om hvorvidt en kunde trenger en frikoblet frontend eller en herdet klassisk stakk: netto negativt hvis noen behandler utdataene som et svar i stedet for et utgangspunkt å argumentere med.
Tre prosent er ikke ingenting. Sammensatt over et år, over et team, er tre prosent reelle penger. Men tre prosent er ingen revolusjon du legger om bemanningsplanen rundt på et kvartal. Det er den typen gevinst som bare dukker opp hvis du holder disiplinen til å fange den, og forsvinner i det øyeblikket du lar verktøyet produsere arbeid ingen trengte.
Volum er ikke verdi
Den mer nyttige innrammingen av hvor gevinstene faktisk kommer fra, finnes i en EY-rapport om KI og produktivitet. Det sentrale grepet er å skille volumets produktivitet fra verdiens produktivitet. Generativ KI utvider automatisering forbi repetitive oppgaver inn i kunnskaps- og kreativt arbeid, noe som er genuint nytt. Men gevinstene som betyr noe, hevder EY, ligger i kvalitet, kreativitet og hvor raskt beslutninger tas, ikke i ren produksjon.
I en optimistisk modell anslår den samme rapporten KIs bidrag til i størrelsesorden 3 prosent lagt til globalt BNP innen 2033. Merk datoen. Ikke innen neste kvartal. Innen 2033. Det er, igjen, prosessendringens tidslinje, ikke modellutgivelsenes.
Skillet mellom volum og verdi er den mest praktisk nyttige tanken i hele denne debatten for et byrå. Hvis du måler KI-bruken din etter hvor mange ord, utkast eller saker den produserer, kommer du til å erklære seier mens du i det stille drukner. Hvis du måler den etter hvor raskt du når en god beslutning og hvor lite du må gjøre om, finner du ut om den virker.
Tre måter gevinstene lekker bort på
Gjennom hver bølge av skuffende teknologibruk gjentar de samme tre mekanismene seg. Det er verdt å navngi dem, fordi hver enkelt har et direkte WordPress-motstykke.
| Mekanisme | Det generelle mønsteret | WordPress-versjonen 2026 |
|---|---|---|
| Verktøy uten prosessendring | Å kjøpe teknologien, men beholde den gamle arbeidsflyten, slik at den blir et kostbart lag oppå måten du allerede jobbet på | Å bolte et KI-panel på en uendret inntaks-, bygge- og QA-pipeline og forvente at det skal forrente seg |
| Tilpasningsetterslepet | Standarder, regulering og kultur må endres før gevinstene lander, ifølge Paul A. David | Team, kontrakter og kundeforventninger forutsetter fortsatt håndskrevet arbeid fra ende til ende |
| Bivirkninger som spiser opp gevinstene | I 1966 genererte datamaskiner flere rapporter enn ledere klarte å lese | En flom av KI-genererte utkast, briefer og sammendrag av liten reell verdi som noen likevel må sortere |
Den tredje raden er den jeg ville understreket. Problemet fra 1966 var reelt: maskinen kunne generere flere ledelsesrapporter enn noen leder klarte å fordøye, så flaskehalsen flyttet seg fra å produsere informasjon til å lese den. Versjonen fra 2026 er flommen av KI-generert alt. Pull requests ingen fullt ut gjennomgikk. Dokumentasjon generert for å tilfredsstille en sjekkliste. Kundetekst skrevet på sekunder og deretter kranglet om i en time. Modellen gjorde den billige delen billigere og skjøv kostnaden inn i den dyre delen: menneskelig oppmerksomhet og dømmekraft. Det er skatten på informasjonsstøy, og den er usynlig på ethvert dashbord som teller produksjon.
To virkelige saker fra leveransen
Abstraksjoner er lette å nikke til, så her er to motstridende saker fra den typen arbeid et byrå faktisk gjør.
Sak én. En WooCommerce-butikk med mer enn 30 plugins og en time-to-first-byte rundt 1,8 sekunder. Eieren hadde hørt at KI kunne “fikse ytelsen”, og ville at vi skulle rette et verktøy mot den. Vi brukte faktisk KI mye, men ikke slik han så det for seg. Den var utmerket på de avgrensede, lesbare delene: å sortere hvilke plugins som utløste flest spørringer, lage første versjon av et lag med transient-caching, generere testtilfeller for en regresjonssuite for kassen, forklare en ukjent tredjeparts-hook. Det den ikke kunne, var å avgjøre at den egentlige løsningen var å fjerne elleve plugins og bygge to om til en liten egendefinert plugin, fordi den beslutningen krevde å veie kundens veikart, deres interne kompetanse og deres risikotoleranse. KI komprimerte de lesbare 60 prosentene av jobben. De ulesbare 40 prosentene, delen som faktisk var flaskehalsen, klarte den ikke å berøre. Nettoresultat: raskere, ja. Ti ganger raskere, nei. Dømmekraften kom alltid til å være den begrensende faktoren, og vårt WordPress-vedlikehold og oppfølging er stort sett dømmekraft.
Sak to. Et Elementor-nettsted som falt sammen under en trafikktopp fra en kampanje. Her var fristelsen å la KI generere en vegg av “optimaliserings”-anbefalinger, og det ville den gjerne gjort. Det er nettopp fellen med informasjonsstøy. En modell vil produsere tjue plausible forslag, atten av dem generiske og to av dem viktige, og nå må en erfaren person bruke sin knappeste ressurs, oppmerksomhet, på å skille signal fra selvsikker støy. Seieren kom da et menneske bestemte seg for å cache aggressivt på edge og utsette sidebyggerens tyngste widgeter, og deretter bare brukte KI til å lage utkast til implementeringen. Tenkningen var den langsomme delen. Tastingen var den raske delen. KI akselererte tastingen.
Mønsteret i begge: KI er en multiplikator på de delene av arbeidet som aldri var begrensningen. Begrensningen er dømmekraft, og dømmekraft har ingen tidoblingsknapp.
Hva dette betyr for WordPress 7.0 og KI-funksjoner
WordPress 7.0 leveres med native KI-funksjoner dypere i redigerings- og arbeidsflytflaten enn noe tidligere. Det er genuint nyttig, og jeg argumenterer ikke mot det. Jeg argumenterer mot tempoet folk forventer av det.
Hvis du behandler KI-funksjonene i WordPress 7.0 som et lag å bolte på den nåværende prosessen din, får du utfallet fra 1966: flere utkast, flere forslag, mer “innhold”, og et team som i det stille bruker den gjenvunne tiden sin på å gjennomgå materiale som aldri burde vært generert. Det er mekanisme én og mekanisme tre som virker sammen.
Hvis du i stedet behandler det som en grunn til å redesigne arbeidsflyten, slik fabrikkeierne til slutt redesignet rundt elektromotoren, er gevinstene reelle og varige. Konkret betyr det å bestemme på forhånd hvilke oppgaver KI lager utkast til, hvilke et menneske må gjennomgå før noe leveres, og hvilke du rett og slett nekter å automatisere fordi dømmekraftskostnaden er hele poenget. Det betyr å måle syklustid og omarbeidingsgrad, ikke ordtelling eller saksgjennomstrømning. Det betyr å være ærlig om at verdien til en WordPress-utvikler forskyves mot beslutningene KI ikke kan ta, ikke vekk fra dem.
Prising er den samme historien. Kunder antar noen ganger at KI bør gjøre alt billigere fordi tastingen er billigere. Tastingen var aldri den dyre delen. Arkitekturen, sikkerhetsholdningen, ytelsesbudsjettet, samsvar med universell utforming, beslutningen om hva man ikke skal bygge: det er arbeidet, og det er derfor prisingen vår forblir individuell i stedet for en vare per ord. KI senker kostnaden for de lesbare oppgavene og hever den relative verdien av de ulesbare.
Så hva bør du egentlig gjøre
Ingenting av dette er et argument for å ignorere KI. Det er et argument for å sette riktig tempo og riktige målinger. Hvis jeg måtte komprimere den erfarne vurderingen til en håndfull driftsregler:
- Ta i bruk KI for de avgrensede, lesbare oppgavene først: research, standardkode, første utkast, teststillas, kode- og innholdsgjennomgang. Det er der de målte gevinstene faktisk bor.
- Redesign den omkringliggende prosessen før du forventer sammensatt avkastning. Verktøyet er elektromotoren. Du må fortsatt bygge fabrikken om.
- Sett av budsjett til skatten på informasjonsstøy eksplisitt. Hvert stykke KI-generert arbeid er et utkast som koster menneskelig oppmerksomhet å gjennomgå. Hvis det koster mer å gjennomgå det enn å skrive det, har du tapt.
- Mål verdi, ikke volum. Syklustid, omarbeidingsgrad og beslutningshastighet forteller deg om KI hjelper. Produksjonstall forteller deg ingenting nyttig og smigrer deg inn i selvtilfredshet.
- Hold mennesker på dømmekraftsbeslutningene. På komplekse, dømmekraftstunge oppgaver viser NBER-dataene at KI kan skade kvaliteten. Behandle utdataene som et argument å teste, aldri som et svar å levere.
Poenget er tempoet, ikke verktøyet
Produktivitetsparadokset er ingen spådom om at KI mislykkes. Solows datamaskiner dukket til slutt opp i statistikken, flere tiår senere, da verden hadde omorganisert seg rundt dem. Brynjolfssons etterslep løste seg opp. Davids elektromotor formet industriproduksjonen om, førti år etter. Teknologien var reell hver gang. Skuffelsen handlet alltid om å forvente gevinsten etter markedsavdelingens kalender i stedet for den organisatoriske endringens kalender.
Generativ KI i 2026 er den samme typen historie. Om lag 3 prosent målt i dag, plausibelt langt mer tidlig på 2030-tallet, men bare for de teamene som er disiplinerte nok til å bygge prosessen sin om rundt den og ærlige nok til å telle verdi i stedet for volum. Problemet var aldri entusiasmen. Problemet er tempoet vi forventer. Få tempoet riktig, og paradokset er ingen advarsel. Det er et veikart.
Sist oppdatert: 31. mai 2026.



