Co zmierzyliśmy i co znaleźliśmy
Przez kwartał kierowaliśmy monitoring widoczności w AI na własną stronę i spisywaliśmy to, co pokazywał, łącznie z fragmentami, które nie były pochlebne. W skrócie: nasz wskaźnik cytowań w AI jest niski tam, gdzie liczy się najbardziej, metoda, której użyliśmy, ruszała tę liczbę bardziej niż sama rzeczywistość, a najużyteczniejszym efektem ćwiczenia było nauczenie się nieufności wobec ładnie wyglądającej liczby pochodzącej ze złego przyrządu. To pierwszy odcinek serii kwartalnej, więc poniższe liczby to punkt odniesienia, nie runda honorowa.
Większość tekstów o widoczności w AI to porady. To jest pomiar. Jesteśmy agencją, która namawia do serwowania AI czystego HTML renderowanego po stronie serwera, więc uczciwie było sprawdzić, czy sama agencja jest cytowana. Odpowiedź, w trzech pomiarach w kwietniu, maju i czerwcu 2026, okazała się ciekawsza niż pojedyncza liczba.
Najpierw problem przyrządu
Przed jakimkolwiek wnioskiem zastrzeżenie, które przestawia je wszystkie. Są dwa popularne sposoby mierzenia, jak często AI Cię cytuje, i one się nie zgadzają.
Tani sposób to proxy API. Wysyłasz swoje zapytania przez API modelu, czytasz tekst, który wraca, i liczysz wzmianki o marce oraz linki. Jest powtarzalny i niemal darmowy, dlatego jest wszędzie. Jego słabością jest to, że ścieżka API to nie produkt, którego używa klient. Publikowane porównania szacują pokrycie źródeł między odpowiedziami API a konsumenckim interfejsem webowym na niskie pojedyncze procenty, więc proxy może Ci powiedzieć, że model zna Twoją nazwę w abstrakcji, nie mówiąc nic wiarygodnego o tym, co widzi realny użytkownik.
Uczciwy sposób to monitorowanie realnych odpowiedzi konsumenckich, tych samych, które dostaje człowiek w interfejsie ChatGPT czy Perplexity, łącznie ze źródłami, które produkt faktycznie pokazuje. Kosztuje więcej i trudniej go zautomatyzować. To też jedyna liczba, która odpowiada utraconej lub wygranej wizycie.
Użyliśmy obu, w tej kolejności, a różnica między nimi to najbardziej uniwersalna lekcja tego raportu.
Kwiecień: tani punkt odniesienia z proxy
Nasz pierwszy pomiar, 6 kwietnia, był runem proxy API. Liczby nagłówkowe, na 26 zapytaniach wobec ChatGPT:
| Metryka | Wynik |
|---|---|
| Wskaźnik wzmianek o marce | 7,7 procent (2 z 26) |
| Wskaźnik cytowania URL | 0 procent |
| Najsilniejsza kategoria | Wtyczki, 14,3 procent wzmianek |
| Kategoria transakcyjna | 12,5 procent wzmianek |
| Informacyjne i lokalne | 0 procent wzmianek |
Wskaźnik wzmianek poniżej ośmiu procent i zerowy wskaźnik cytowania czyta się jak katastrofa. Ciekawszy jest szczegół, kogo cytowano zamiast nas. Gdy model sięgał po źródło na temat polskiej pracy z WordPress, wymieniał katalogi i portale ogłoszeniowe: pracuj.pl pojawił się trzy razy, obok clutch.co, olx.pl, home.pl, nazwa.pl i ogłoszenia o meetupie deweloperskim. To nie konkurenci, którzy nas przepisali. To agregatory, którym model ufa jako ogólnym odpowiedziom na pytanie komercyjne. Ten wzorzec, asystent domyślający się katalogu zamiast specjalisty, okazał się prawdziwą historią, a polor on-page tego nie naprawia.
Sam raport niósł ostrzeżenie, które chcemy, żebyś też niósł: proxy API, trendy wyłącznie kierunkowe, około cztery procent pokrycia źródeł z interfejsem webowym. Nie doceniliśmy jeszcze, jak bardzo to ostrzeżenie ma znaczenie.
Maj: przyrząd psuje się uczciwie
Pomiar z 11 maja, również proxy, zwrócił wynik, który wyglądał jak błąd, a był najuczciwszym efektem kwartału. Na 20 zapytaniach, rozłożonych na ChatGPT, Perplexity, Bing Copilot i Claude, rozkład był taki:
| Silnik | Zapytania | Cytowania | Wskaźnik |
|---|---|---|---|
| ChatGPT | 6 | 0 | nierozstrzygnięty |
| Perplexity | 6 | 0 | nierozstrzygnięty |
| Bing Copilot | 4 | 0 | nierozstrzygnięty |
| Claude | 4 | 0 | nierozstrzygnięty |
Każde zapytanie wróciło jako nierozstrzygnięte. Nie “niecytowane”, nierozstrzygnięte. Proxy nie potrafiło ustalić, czy odpowiedź w ogóle była ugruntowana w pobranych stronach, więc odmówiło punktacji. Naiwne odczytanie zamienia to w “zerowy wskaźnik cytowań” i panikę w poniedziałek. Poprawne odczytanie jest takie, że przyrząd powiedział nam, że nie widzi tego, o czego pomiar prosimy. Pomiar zwracający “nierozstrzygnięty” robi swoją robotę. Pomiar, który w tej samej sytuacji cicho zwraca zero, kłamie, a sporo dashboardów widoczności w AI robi dokładnie to.
Czerwiec: realny monitoring i użyteczny rozjazd
W czerwcu przeszliśmy na monitorowanie realnych odpowiedzi modeli zamiast API. Obraz wyostrzył się natychmiast i nie był jednolity.
Dla jednego wąskiego zapytania, o polskie studio obsługujące zagranicznych klientów WordPress, byliśmy pierwsi w pięciu z sześciu testowanych modeli. To realna, broniona pozycja i pasuje do tego, jak się opisujemy. Pasuje też do rzeczywistości: to konkretne stwierdzenie tożsamości z niewielką konkurencją, dokładnie taki typ zapytania, który specjalista powinien posiadać.
Dla zapytań transakcyjnych o WooCommerce, najbliższych przychodom, byliśmy niemal niewidoczni. Modele odpowiadały pewnie i nie sięgały po nas. ChatGPT był konsekwentnie najsłabszym kanałem dla marki, zwracając najmniejszą obecność w całym zestawie. Perplexity było najsilniejsze, co nie dziwi, gdy wiesz, że Perplexity mocno opiera się na żywym wyszukiwaniu w sieci, a nie tylko na pamięci treningowej. Konkurenci, którzy się pojawili, to głównie ogólne agencje SEO i SEM reklamujące się jako robiące “AI SEO”, nie specjaliści od WooCommerce. Luka jest więc kwestią autorytetu i skojarzenia, nie jakości strony.
Co dają trzy pomiary razem
Czytane łącznie kwartał mówi trzy rzeczy wprost.
Po pierwsze, metoda jest częścią liczby. Kwietniowy i majowy run proxy oraz czerwcowy run realnego monitoringu mierzyły tę samą stronę w tych samych tygodniach, a różniły się na tyle, że podawanie którejkolwiek liczby bez metody wprowadzałoby w błąd. Jeśli narzędzie daje Ci wskaźnik cytowań w AI bez informacji, czy czytało API, czy produkt, nie ufaj mu.
Pomiar z pierwszej ręki to sedno całego ćwiczenia i ta sama dyscyplina, którą stosujemy w pracy dla klientów: liczba, której nie potrafisz odtworzyć, nie jest dowodem. Tej samej lekcji nauczyliśmy się boleśnie przy eksperymencie z fikcyjną marką, gdzie model pewnie opisał firmę, która nie istniała. Pomiar realnej marki ma odwrotny tryb porażki, pewne raportowanie zera, gdy prawda jest nieznana, a oba sprowadzają się do sprawdzenia przyrządu przed zaufaniem odczytowi.
Po drugie, zapytania o tożsamość są do wygrania, a transakcyjne nie, przynajmniej nie on-page. Trzymamy wąskie zapytanie o pozycjonowanie, bo jest konkretne i lekko obstawione. Tracimy zapytania komercyjne, bo modele opierają się na katalogach i szerokich agencjach, a żadna ilość czystszego HTML nie zmienia tego, z kim model już kojarzy “dewelopera WooCommerce”. To problem autorytetu poza stroną.
Po trzecie, kanał ma znaczenie. Marka może być cytowana w Perplexity i niemal nieobecna w ChatGPT w tym samym tygodniu, bo oba produkty gruntują odpowiedzi inaczej. Pojedynczy uśredniony “wynik widoczności w AI” ukrywa dokładnie tę informację, której potrzebujesz.
Co zmieniliśmy
Nie przepisywaliśmy stron w reakcji na liczbę z proxy, bo to byłaby optymalizacja pod przyrząd, a nie pod klienta. Zamiast tego pomiar zmienił, gdzie wkładamy wysiłek.
- Ustaliliśmy zestaw zapytań i kadencję: stała lista zapytań tożsamościowych, informacyjnych i transakcyjnych, zapisywana co miesiąc, z silnikiem i datą stemplowanymi przy każdej liczbie.
- Przestaliśmy porównywać liczby z proxy z liczbami z realnego monitoringu i teraz oznaczamy każdą liczbę jej metodą.
- Pracę nad widocznością transakcyjną przenieśliśmy poza stronę, bo luka tam to skojarzenie i autorytet, nie treść on-page.
- Nadal serwujemy wszystko w HTML renderowanym po stronie serwera, co jest warunkiem bycia w ogóle cytowalnym i tematem naszej notatki o tym, dlaczego zachodnie asystenty czytają surowy HTML.
Jak zrobić to u siebie
Nie potrzebujesz naszego budżetu, żeby zacząć. Minimalny uczciwy zestaw to stała lista od dziesięciu do dwudziestu zapytań, które zadałby realny klient, uruchamiana raz w miesiącu, z trzema kolumnami zapisywanymi za każdym razem: silnik, data oraz czy wymieniono Twoją markę lub zalinkowano Twój adres URL. Dodaj czwartą kolumnę na to, które inne domeny zacytowano, bo to mówi, z kim faktycznie konkurujesz w odpowiedzi, a rzadko jest to ten, kogo podejrzewasz.
Jeśli używasz narzędzia automatycznego, zadaj mu jedno pytanie, zanim zaufasz jakiemukolwiek wykresowi: czytasz API czy produkt? Jeśli nie potrafi odpowiedzieć, traktuj wynik wyłącznie kierunkowo, tak jak nasze runy z kwietnia i maja. I nigdy nie pozwól narzędziu zamienić wyniku nierozstrzygniętego w pewne zero.
Uczciwy wniosek
Kwartał mierzenia własnych cytowań w AI dał jedną niewygodną liczbę, nasz transakcyjny wskaźnik cytowań jest niski, i jeden naprawdę cenny nawyk, nigdy nie podawaj liczby o widoczności w AI bez metody, która ją wytworzyła. Runy proxy w maju pokazały nas gorzej niż rzeczywistość, a realny monitoring ujawnił bronioną pozycję tożsamościową, którą proxy przeoczyło. Oba odczyty były użyteczne właśnie dlatego, że spisaliśmy, jak każdy zrobiono. To raport pierwszy. Kolejne ujęcie opublikujemy na koniec kwartału, na tym samym zestawie zapytań, żeby serię dało się porównywać, a nie tylko podziwiać. Jeśli chcesz, żeby cytowało Cię AI, zacznij od uczciwego mierzenia tego i wbuduj to w przepływ, który opisujemy przy optymalizacji GEO i LLMO.

