Medir visibilidad en IA, informe del Q2 2026 | WPPoland

Mariusz Szatkowski

ES

Medir visibilidad en IA

Última verificación: 1 de julio de 2026

14 min de lectura

Caso de estudio

PageSpeed 100/100

Datos Clave : Medición de citas de IA de wppoland.com, Q2 2026

1wppoland.com ejecutó monitorización de visibilidad en IA contra su propio sitio a lo largo del Q2 2026, con tres instantáneas en abril, mayo y junio.
2Una instantánea de proxy de API de abril de 2026 encontró una tasa de mención de marca del 7,7 por ciento en ChatGPT sobre 26 consultas y una tasa de cita de URL del 0 por ciento.
3En esa instantánea de abril, los asistentes de IA citaron en su lugar directorios generales y portales de empleo, incluidos pracuj.pl, clutch.co y olx.pl.
4Una instantánea de proxy de mayo de 2026 devolvió un resultado indeterminado para las 20 consultas, lo que expuso que los proxies de API no pueden detectar de forma fiable si hubo grounding.
5La monitorización de salidas reales de los modelos en junio de 2026 situó a wppoland.com en primer lugar en cinco de seis modelos para la consulta sobre una agencia polaca que atiende a clientes WordPress extranjeros, pero encontró una presencia casi nula en las consultas transaccionales sobre WooCommerce.
6ChatGPT mostró la presencia más débil de la marca y Perplexity la más fuerte, coherente con que Perplexity se apoya en la búsqueda web en vivo.
7El método de medición cambió la cifra reportada más que la realidad subyacente, por lo que el método debe indicarse junto a cualquier cifra de citas de IA.

Última actualización: 2026-06-22

#Qué medimos y qué encontramos

Durante un trimestre apuntamos la monitorización de visibilidad en IA hacia nuestro propio sitio y anotamos lo que decía, incluidas las partes que no eran halagadoras. En resumen: nuestra tasa de citas de IA es baja justo donde más importa, el método que usamos movió la cifra más que la realidad subyacente, y el resultado con diferencia más útil del ejercicio fue aprender a desconfiar de una cifra de aspecto limpio que venía del instrumento equivocado. Este es el primero de una serie trimestral, así que las cifras de abajo son una línea base, no una vuelta de honor.

La mayor parte de lo que se escribe sobre visibilidad en IA es consejo. Esto es medición. Somos una agencia que defiende servir a la IA HTML limpio renderizado en el servidor, así que era justo comprobar si la propia agencia es citada. La respuesta, a lo largo de tres instantáneas en abril, mayo y junio de 2026, fue más interesante que una sola cifra.

#Primero viene el problema del instrumento

Antes de cualquier hallazgo, la salvedad que reenmarca a todos los demás. Hay dos formas comunes de medir con qué frecuencia una IA te cita, y no coinciden.

La forma barata es un proxy de API. Envías tus prompts a través de la API de un modelo, lees el texto que vuelve y cuentas menciones de marca y enlaces. Es reproducible y casi gratis, por eso está en todas partes. Su debilidad es que la vía de la API no es el producto que usa un cliente. Las comparaciones publicadas sitúan el solapamiento de fuentes entre las respuestas de la API y la interfaz web de consumo en cifras bajas de un solo dígito, así que un proxy puede decirte que un modelo conoce tu nombre en abstracto sin decirte nada fiable sobre lo que ve un usuario real.

La forma honesta es monitorizar las salidas reales de consumo, las mismas respuestas que recibe una persona en la interfaz de ChatGPT o Perplexity, incluidas las fuentes que el producto muestra de verdad. Cuesta más y es más difícil de automatizar. Es también la única cifra que corresponde a una visita perdida o ganada.

Usamos ambas, en ese orden, y la brecha entre ellas es la lección más reutilizable de este informe.

#Abril: la línea base barata del proxy

Nuestra primera instantánea, el 6 de abril, fue una ejecución de proxy de API. Las cifras principales, sobre 26 consultas contra ChatGPT:

Métrica	Resultado
Tasa de mención de marca	7,7 por ciento (2 de 26)
Tasa de cita de URL	0 por ciento
Categoría más fuerte	Plugins, 14,3 por ciento de mención
Categoría transaccional	12,5 por ciento de mención
Informativa y local	0 por ciento de mención

Una tasa de mención por debajo del ocho por ciento y una tasa de cita de cero se leen como un desastre. El detalle más útil es a quién citaron en nuestro lugar. Cuando el modelo buscó una fuente sobre trabajo polaco con WordPress, nombró directorios y portales de empleo: pracuj.pl apareció tres veces, junto a clutch.co, olx.pl, home.pl, nazwa.pl y un anuncio de un meetup de desarrolladores. No son competidores que escribieran mejor que nosotros. Son agregadores en los que el modelo confía como respuestas genéricas a una pregunta comercial. Ese patrón, el asistente recurriendo a un directorio en lugar de a un especialista, resultó ser la verdadera historia, y el pulido en la propia página no lo arregla.

El propio informe llevaba la advertencia que queremos que lleves también: proxy de API, solo tendencias orientativas, alrededor del cuatro por ciento de solapamiento de fuentes con la interfaz web. Todavía no apreciábamos cuánto importaba esa advertencia.

#Mayo: el instrumento falla con honestidad

La instantánea del 11 de mayo, también una ejecución de proxy, devolvió un resultado que parecía un error y era en realidad la salida más honesta del trimestre. Sobre 20 consultas, repartidas entre ChatGPT, Perplexity, Bing Copilot y Claude, el desglose fue este:

Motor	Consultas	Tasa de cita
ChatGPT	6	indeterminado
Perplexity	6	indeterminado
Bing Copilot	4	indeterminado
Claude	4	indeterminado

Todas y cada una de las consultas volvieron como indeterminadas. No “no citado”, indeterminado. El proxy no pudo establecer si la respuesta estaba siquiera fundamentada en páginas obtenidas, así que se negó a puntuar. Una lectura ingenua convierte eso en una “tasa de cita del cero por ciento” y un lunes de pánico. La lectura correcta es que el instrumento nos dijo que no podía ver aquello que le pedíamos medir. Una medición que devuelve indeterminado está haciendo su trabajo. Una medición que devuelve discretamente cero en la misma situación te está mintiendo, y bastantes paneles de visibilidad en IA hacen exactamente eso.

#Junio: monitorización real, y una división útil

En junio cambiamos a monitorizar las salidas reales de los modelos en lugar de la API. La imagen se afinó de inmediato, y no era uniforme.

Para una consulta acotada, un estudio polaco que atiende a clientes WordPress extranjeros, quedamos primeros en cinco de los seis modelos probados. Es una posición real y defendible, y coincide con cómo nos describimos. Coincide también con la realidad: es una afirmación de identidad específica con poca competencia, exactamente el tipo de consulta que un especialista debería poseer.

Para las consultas transaccionales sobre WooCommerce, las consultas más cercanas a los ingresos, éramos casi invisibles. Los modelos respondieron con seguridad y no recurrieron a nosotros. ChatGPT fue de forma consistente el canal más débil para la marca, devolviendo la menor presencia en todo el conjunto. Perplexity fue el más fuerte, lo que no sorprende una vez que sabes que Perplexity se apoya con fuerza en la búsqueda web en vivo y no solo en la memoria de entrenamiento. Los competidores que sí aparecieron eran en su mayoría agencias generales de SEO y SEM que se promocionan como proveedoras de “AI SEO”, no especialistas en WooCommerce. La brecha, dicho de otro modo, es de autoridad y asociación, no de calidad de la página.

#Qué suman las tres instantáneas

Leídas en conjunto, el trimestre dice tres cosas con claridad.

Primero, el método es parte de la cifra. Las ejecuciones de proxy de abril y mayo y la ejecución de monitorización real de junio midieron el mismo sitio en las mismas semanas, y discreparon lo suficiente como para que citar cualquier cifra aislada sin su método resultara engañoso. Si una herramienta te da una tasa de citas de IA sin decirte si leyó la API o el producto, desconfía de ella.

La medición de primera mano es el objetivo de todo este ejercicio, y es la misma disciplina que aplicamos al trabajo de cliente: una cifra que no puedes reproducir no es prueba. Aprendimos la misma lección por las malas con un experimento de marca sintética, donde un modelo describió con seguridad una empresa que no existía. Medir una marca real tiene el modo de fallo opuesto, reportar con seguridad cero cuando la verdad es desconocida, y ambos remiten a revisar el instrumento antes de fiarse de la lectura.

Segundo, las consultas de identidad son ganables y las transaccionales no, al menos no en la propia página. Mantenemos la consulta de posicionamiento acotada porque es específica y está poco disputada. Perdemos las consultas comerciales porque los modelos se apoyan en directorios y agencias generalistas, y ninguna cantidad de HTML más limpio cambia con quién asocia ya un modelo a un “desarrollador WooCommerce”. Eso es un problema de autoridad fuera de la página.

Tercero, el canal importa. Una marca puede ser citada en Perplexity y estar casi ausente en ChatGPT en la misma semana, porque los dos productos fundamentan las respuestas de forma distinta. Una única “puntuación de visibilidad en IA” mezclada esconde justo la información que necesitas.

#Qué cambiamos

No reescribimos páginas como reacción a una cifra de proxy, porque eso sería optimizar para un instrumento en lugar de para un cliente. En su lugar, la medición cambió dónde invertimos el esfuerzo.

Fijamos el conjunto de consultas y la cadencia: una lista estable de consultas de identidad, informativas y transaccionales, registrada mensualmente, con el motor y la fecha sellados en cada cifra.
Dejamos de comparar cifras de proxy con cifras de monitorización real, y ahora etiquetamos cada cifra con su método.
Movimos el trabajo de visibilidad transaccional fuera de la página, porque la brecha ahí es asociación y autoridad, no contenido en la propia página, y eso está documentado en nuestro enfoque de GEO y LLMO en lugar de en otra reescritura.
Seguimos sirviendo todo en HTML renderizado en el servidor, que es la condición previa para ser citables siquiera, y el tema de nuestra nota sobre por qué los asistentes occidentales leen HTML en bruto.

#Cómo hacerlo tú mismo

No necesitas nuestro presupuesto para empezar. La configuración honesta mínima es una lista fija de diez a veinte consultas que harían clientes reales, ejecutada una vez al mes, con tres columnas registradas cada vez: el motor, la fecha y si tu marca fue nombrada o tu URL enlazada. Añade una cuarta columna para qué otros dominios fueron citados, porque eso te dice contra quién compites de verdad en la respuesta, y rara vez es quien sospechas.

Si usas una herramienta automatizada, hazle una pregunta antes de fiarte de un solo gráfico: ¿estás leyendo la API o el producto? Si no puede responder, trata el resultado solo como orientativo, igual que nuestras ejecuciones de abril y mayo. Y nunca dejes que una herramienta convierta un resultado indeterminado en un cero confiado.

#Diseñar un panel que no premie el autoengaño

Antes de lanzar consultas, definimos qué cuenta como éxito. Distinguimos entre aparición del nombre, uso del dominio como fuente, enlace visible y recomendación explícita. Son señales relacionadas, pero no intercambiables. Una marca puede aparecer en una respuesta crítica, una URL puede figurar entre varias fuentes sin sostener la afirmación principal y una recomendación puede no incluir enlace. Guardar estas señales por separado evita que una cifra agregada convierta cualquier presencia en una victoria.

El panel también necesita denominadores claros. Si un producto no pudo acceder a la web o no mostró fuentes, el resultado no entra como ausencia confirmada. Se marca como indeterminado y se conserva para evaluar la fiabilidad del instrumento. Publicamos tanto el número de consultas válidas como el total intentado. De ese modo, una mejora aparente no puede proceder simplemente de descartar las ejecuciones incómodas o de mezclar veinte pruebas observables con otras veinte que no lo eran.

La clasificación de la consulta se decide de antemano: identidad, descubrimiento de problema, evaluación, comparación o contratación. Conservamos la redacción exacta durante el trimestre y evitamos añadir la marca cuando queremos medir descubrimiento sin ayuda. También anotamos idioma, mercado, fecha, producto, modalidad de acceso y estado de sesión. Estos detalles parecen burocráticos hasta que dos personas ejecutan la misma pregunta desde contextos distintos y obtienen fuentes diferentes.

#Del dato a una prioridad de negocio

No todas las citas tienen el mismo valor potencial. Una mención en una pregunta general sobre WordPress puede ampliar reconocimiento, mientras que aparecer en una comparación de proveedores puede influir en una lista corta. Por eso no perseguimos una tasa única. Revisamos cobertura por etapa de compra, mensaje asociado y página citada. Si la IA nos relaciona con un tema que no ofrecemos o lleva al usuario a una página sin siguiente paso, la cifra puede ser alta y el resultado comercial seguir siendo pobre.

La lectura práctica combina cuatro preguntas. ¿Aparecemos donde existe intención relevante? ¿La descripción de la empresa es correcta? ¿La fuente elegida demuestra capacidad? ¿La página permite avanzar sin fricción? La acción cambia según la respuesta. Un problema de identidad requiere coherencia entre el sitio y referencias externas. Una ausencia en comparaciones puede revelar falta de casos verificables o de cobertura independiente. Una cita correcta que no convierte exige revisar la propuesta, no fabricar más texto para el buscador.

La atribución también debe ser prudente. El usuario puede conocer una marca en un asistente, buscarla después en Google y contactar desde tráfico directo. Para acercarnos a la realidad, combinamos referencias visibles, evolución de búsquedas de marca, páginas de entrada y una pregunta breve en el formulario sobre el origen del contacto. Ninguna señal aislada demuestra que la IA generó el proyecto. Juntas permiten priorizar trabajo sin presentar correlación como causalidad.

#Controles de calidad para cada ronda

Una segunda persona debería revisar una muestra de respuestas sin ver la puntuación inicial. Su tarea es confirmar que la marca corresponde a la entidad correcta, que el enlace pertenece al dominio esperado y que la fuente realmente respalda el fragmento relevante. Los casos dudosos se documentan, no se fuerzan a positivo o negativo. También conservamos pruebas de la respuesta completa, porque los enlaces y resúmenes pueden cambiar después y dejar una hoja de cálculo imposible de auditar.

Cuando actualizamos contenido, no modificamos simultáneamente todas las variables si queremos aprender algo. Registramos qué páginas cambiaron, qué prueba nueva se añadió y cuándo pudo ser rastreada. Después observamos varias rondas antes de sacar conclusiones. La volatilidad entre ejecuciones hace que una sola mejora sea una pista, no una prueba. Este control es menos vistoso que un gráfico ascendente, pero protege decisiones de presupuesto.

#Lo que este estudio no puede demostrar

La muestra es pequeña, se limita a nuestro dominio y no representa a todas las empresas de WordPress ni a todos los mercados lingüísticos. Los productos cambian sus mecanismos de búsqueda, la disponibilidad de fuentes varía y no controlamos personalización, experimentos internos ni actualizaciones del índice. Además, la observación real de junio usa un instrumento distinto de los proxies de abril y mayo. La diferencia ilustra el riesgo metodológico, pero no demuestra una subida mensual de rendimiento.

Tampoco podemos observar la razón interna por la que un modelo seleccionó una fuente. Podemos contrastar páginas, autoridad externa y asociaciones temáticas, pero no asignar una causa cierta a cada cita. Por eso no prometemos que añadir FAQ, schema o una cantidad concreta de palabras produzca presencia. Esos recursos solo ayudan cuando expresan información real, accesible y respaldada. La medición sirve para encontrar brechas y comprobar tendencias bajo condiciones declaradas, no para garantizar posiciones.

#Un briefing escrito para convertir la medición en trabajo útil

Si quieres que revisemos tu visibilidad, envía por escrito el dominio, países e idiomas prioritarios, servicios con valor comercial, competidores que aparecen en ventas y las preguntas que escuchas antes de una contratación. Añade los asistentes que te interesa observar y cualquier migración, publicación o campaña reciente que pueda afectar la línea base. No hacen falta cientos de prompts: necesitamos un conjunto pequeño que represente decisiones reales.

Con ese briefing podemos separar reconocimiento de demanda, proponer una cadencia reproducible y señalar qué páginas o pruebas merecen intervención primero. También indicaremos qué no puede concluirse con los datos disponibles. El entregable útil no es una puntuación decorativa, sino una lista priorizada de consultas, fuentes competidoras, páginas de destino y acciones que puedan comprobarse en la siguiente ronda.

#La conclusión honesta

Un trimestre midiendo nuestras propias citas de IA produjo una cifra incómoda, nuestra tasa de cita transaccional es baja, y un hábito genuinamente valioso, nunca citar una cifra de visibilidad en IA sin el método que la produjo. Las ejecuciones de proxy nos hicieron parecer peores que la realidad en mayo, y la monitorización real mostró una posición de identidad defendible que el proxy había pasado por alto. Ambas lecturas fueron útiles precisamente porque anotamos cómo se tomó cada una. Este es el informe uno. Publicaremos la próxima instantánea al final del trimestre, sobre el mismo conjunto de consultas, para que la serie pueda compararse en lugar de admirarse. Si quieres que la IA te cite, empieza por medirlo con honestidad, e intégralo en el flujo de trabajo que describimos para GEO y LLMO.

Medir visibilidad en IA

#Qué medimos y qué encontramos

#Primero viene el problema del instrumento

#Abril: la línea base barata del proxy

#Mayo: el instrumento falla con honestidad

#Junio: monitorización real, y una división útil

#Qué suman las tres instantáneas

#Qué cambiamos

#Cómo hacerlo tú mismo

#Diseñar un panel que no premie el autoengaño

#Del dato a una prioridad de negocio

#Controles de calidad para cada ronda

#Lo que este estudio no puede demostrar

#Un briefing escrito para convertir la medición en trabajo útil

#La conclusión honesta

Transforma el artículo en una implementación real

Próximos pasos más relevantes

¿Quieres implementar esto en tu sitio?

Explora otros servicios WordPress y base de conocimiento

Categorías relacionadas

Artículos de apoyo

Preguntas Frecuentes

Artículos Relacionados

Cómo seguimos las citas de IA de wppoland.com durante 90 días

Por qué Perplexity cita tu marca y ChatGPT no

Monitoreo de citaciones de IA: qué seguir y con qué frecuencia

Mariusz Szatkowski