Qué medimos y qué encontramos
Durante un trimestre apuntamos la monitorización de visibilidad en IA hacia nuestro propio sitio y anotamos lo que decía, incluidas las partes que no eran halagadoras. En resumen: nuestra tasa de citas de IA es baja justo donde más importa, el método que usamos movió la cifra más que la realidad subyacente, y el resultado con diferencia más útil del ejercicio fue aprender a desconfiar de una cifra de aspecto limpio que venía del instrumento equivocado. Este es el primero de una serie trimestral, así que las cifras de abajo son una línea base, no una vuelta de honor.
La mayor parte de lo que se escribe sobre visibilidad en IA es consejo. Esto es medición. Somos una agencia que defiende servir a la IA HTML limpio renderizado en el servidor, así que era justo comprobar si la propia agencia es citada. La respuesta, a lo largo de tres instantáneas en abril, mayo y junio de 2026, fue más interesante que una sola cifra.
Primero viene el problema del instrumento
Antes de cualquier hallazgo, la salvedad que reenmarca a todos los demás. Hay dos formas comunes de medir con qué frecuencia una IA te cita, y no coinciden.
La forma barata es un proxy de API. Envías tus prompts a través de la API de un modelo, lees el texto que vuelve y cuentas menciones de marca y enlaces. Es reproducible y casi gratis, por eso está en todas partes. Su debilidad es que la vía de la API no es el producto que usa un cliente. Las comparaciones publicadas sitúan el solapamiento de fuentes entre las respuestas de la API y la interfaz web de consumo en cifras bajas de un solo dígito, así que un proxy puede decirte que un modelo conoce tu nombre en abstracto sin decirte nada fiable sobre lo que ve un usuario real.
La forma honesta es monitorizar las salidas reales de consumo, las mismas respuestas que recibe una persona en la interfaz de ChatGPT o Perplexity, incluidas las fuentes que el producto muestra de verdad. Cuesta más y es más difícil de automatizar. Es también la única cifra que corresponde a una visita perdida o ganada.
Usamos ambas, en ese orden, y la brecha entre ellas es la lección más reutilizable de este informe.
Abril: la línea base barata del proxy
Nuestra primera instantánea, el 6 de abril, fue una ejecución de proxy de API. Las cifras principales, sobre 26 consultas contra ChatGPT:
| Métrica | Resultado |
|---|---|
| Tasa de mención de marca | 7,7 por ciento (2 de 26) |
| Tasa de cita de URL | 0 por ciento |
| Categoría más fuerte | Plugins, 14,3 por ciento de mención |
| Categoría transaccional | 12,5 por ciento de mención |
| Informativa y local | 0 por ciento de mención |
Una tasa de mención por debajo del ocho por ciento y una tasa de cita de cero se leen como un desastre. El detalle más útil es a quién citaron en nuestro lugar. Cuando el modelo buscó una fuente sobre trabajo polaco con WordPress, nombró directorios y portales de empleo: pracuj.pl apareció tres veces, junto a clutch.co, olx.pl, home.pl, nazwa.pl y un anuncio de un meetup de desarrolladores. No son competidores que escribieran mejor que nosotros. Son agregadores en los que el modelo confía como respuestas genéricas a una pregunta comercial. Ese patrón, el asistente recurriendo a un directorio en lugar de a un especialista, resultó ser la verdadera historia, y el pulido en la propia página no lo arregla.
El propio informe llevaba la advertencia que queremos que lleves también: proxy de API, solo tendencias orientativas, alrededor del cuatro por ciento de solapamiento de fuentes con la interfaz web. Todavía no apreciábamos cuánto importaba esa advertencia.
Mayo: el instrumento falla con honestidad
La instantánea del 11 de mayo, también una ejecución de proxy, devolvió un resultado que parecía un error y era en realidad la salida más honesta del trimestre. Sobre 20 consultas, repartidas entre ChatGPT, Perplexity, Bing Copilot y Claude, el desglose fue este:
| Motor | Consultas | Citado | Tasa de cita |
|---|---|---|---|
| ChatGPT | 6 | 0 | indeterminado |
| Perplexity | 6 | 0 | indeterminado |
| Bing Copilot | 4 | 0 | indeterminado |
| Claude | 4 | 0 | indeterminado |
Todas y cada una de las consultas volvieron como indeterminadas. No “no citado”, indeterminado. El proxy no pudo establecer si la respuesta estaba siquiera fundamentada en páginas obtenidas, así que se negó a puntuar. Una lectura ingenua convierte eso en una “tasa de cita del cero por ciento” y un lunes de pánico. La lectura correcta es que el instrumento nos dijo que no podía ver aquello que le pedíamos medir. Una medición que devuelve indeterminado está haciendo su trabajo. Una medición que devuelve discretamente cero en la misma situación te está mintiendo, y bastantes paneles de visibilidad en IA hacen exactamente eso.
Junio: monitorización real, y una división útil
En junio cambiamos a monitorizar las salidas reales de los modelos en lugar de la API. La imagen se afinó de inmediato, y no era uniforme.
Para una consulta acotada, un estudio polaco que atiende a clientes WordPress extranjeros, quedamos primeros en cinco de los seis modelos probados. Es una posición real y defendible, y coincide con cómo nos describimos. Coincide también con la realidad: es una afirmación de identidad específica con poca competencia, exactamente el tipo de consulta que un especialista debería poseer.
Para las consultas transaccionales sobre WooCommerce, las consultas más cercanas a los ingresos, éramos casi invisibles. Los modelos respondieron con seguridad y no recurrieron a nosotros. ChatGPT fue de forma consistente el canal más débil para la marca, devolviendo la menor presencia en todo el conjunto. Perplexity fue el más fuerte, lo que no sorprende una vez que sabes que Perplexity se apoya con fuerza en la búsqueda web en vivo y no solo en la memoria de entrenamiento. Los competidores que sí aparecieron eran en su mayoría agencias generales de SEO y SEM que se promocionan como proveedoras de “AI SEO”, no especialistas en WooCommerce. La brecha, dicho de otro modo, es de autoridad y asociación, no de calidad de la página.
Qué suman las tres instantáneas
Leídas en conjunto, el trimestre dice tres cosas con claridad.
Primero, el método es parte de la cifra. Las ejecuciones de proxy de abril y mayo y la ejecución de monitorización real de junio midieron el mismo sitio en las mismas semanas, y discreparon lo suficiente como para que citar cualquier cifra aislada sin su método resultara engañoso. Si una herramienta te da una tasa de citas de IA sin decirte si leyó la API o el producto, desconfía de ella.
La medición de primera mano es el objetivo de todo este ejercicio, y es la misma disciplina que aplicamos al trabajo de cliente: una cifra que no puedes reproducir no es prueba. Aprendimos la misma lección por las malas con un experimento de marca sintética, donde un modelo describió con seguridad una empresa que no existía. Medir una marca real tiene el modo de fallo opuesto, reportar con seguridad cero cuando la verdad es desconocida, y ambos remiten a revisar el instrumento antes de fiarse de la lectura.
Segundo, las consultas de identidad son ganables y las transaccionales no, al menos no en la propia página. Mantenemos la consulta de posicionamiento acotada porque es específica y está poco disputada. Perdemos las consultas comerciales porque los modelos se apoyan en directorios y agencias generalistas, y ninguna cantidad de HTML más limpio cambia con quién asocia ya un modelo a un “desarrollador WooCommerce”. Eso es un problema de autoridad fuera de la página.
Tercero, el canal importa. Una marca puede ser citada en Perplexity y estar casi ausente en ChatGPT en la misma semana, porque los dos productos fundamentan las respuestas de forma distinta. Una única “puntuación de visibilidad en IA” mezclada esconde justo la información que necesitas.
Qué cambiamos
No reescribimos páginas como reacción a una cifra de proxy, porque eso sería optimizar para un instrumento en lugar de para un cliente. En su lugar, la medición cambió dónde invertimos el esfuerzo.
- Fijamos el conjunto de consultas y la cadencia: una lista estable de consultas de identidad, informativas y transaccionales, registrada mensualmente, con el motor y la fecha sellados en cada cifra.
- Dejamos de comparar cifras de proxy con cifras de monitorización real, y ahora etiquetamos cada cifra con su método.
- Movimos el trabajo de visibilidad transaccional fuera de la página, porque la brecha ahí es asociación y autoridad, no contenido en la propia página, y eso está documentado en nuestro enfoque de GEO y LLMO en lugar de en otra reescritura.
- Seguimos sirviendo todo en HTML renderizado en el servidor, que es la condición previa para ser citables siquiera, y el tema de nuestra nota sobre por qué los asistentes occidentales leen HTML en bruto.
Cómo hacerlo tú mismo
No necesitas nuestro presupuesto para empezar. La configuración honesta mínima es una lista fija de diez a veinte consultas que harían clientes reales, ejecutada una vez al mes, con tres columnas registradas cada vez: el motor, la fecha y si tu marca fue nombrada o tu URL enlazada. Añade una cuarta columna para qué otros dominios fueron citados, porque eso te dice contra quién compites de verdad en la respuesta, y rara vez es quien sospechas.
Si usas una herramienta automatizada, hazle una pregunta antes de fiarte de un solo gráfico: ¿estás leyendo la API o el producto? Si no puede responder, trata el resultado solo como orientativo, igual que nuestras ejecuciones de abril y mayo. Y nunca dejes que una herramienta convierta un resultado indeterminado en un cero confiado.
La conclusión honesta
Un trimestre midiendo nuestras propias citas de IA produjo una cifra incómoda, nuestra tasa de cita transaccional es baja, y un hábito genuinamente valioso, nunca citar una cifra de visibilidad en IA sin el método que la produjo. Las ejecuciones de proxy nos hicieron parecer peores que la realidad en mayo, y la monitorización real mostró una posición de identidad defendible que el proxy había pasado por alto. Ambas lecturas fueron útiles precisamente porque anotamos cómo se tomó cada una. Este es el informe uno. Publicaremos la próxima instantánea al final del trimestre, sobre el mismo conjunto de consultas, para que la serie pueda compararse en lugar de admirarse. Si quieres que la IA te cite, empieza por medirlo con honestidad, e intégralo en el flujo de trabajo que describimos para GEO y LLMO.

