AEO/GEO
Guía Técnica 2026 — Actualizada

Optimiza tu web para la IA

Requerimientos y mejores prácticas de AEO y GEO para que tu sitio sea indexado, citado y referenciado por OpenAI, Anthropic, Google Gemini y Perplexity.

AEOGEORAGllms.txtE-E-A-TSchema.org
4
Plataformas IA analizadas
8+
Bots de rastreo documentados
25%
Top 1000 webs bloquean GPTBot
3.2×
Más citas con contenido fresco
Scroll
01 — Introducción

Del SEO al AEO y GEO

La búsqueda ha evolucionado. Los usuarios ya no solo buscan listas de enlaces; esperan respuestas directas, sintetizadas por inteligencia artificial.

🔍Pasado

SEO Tradicional

Optimización para que Googlebot indexe y clasifique tu web en resultados de búsqueda. Basado en palabras clave, backlinks y señales técnicas.

🤖Presente

AEO

Answer Engine Optimization

Optimización para que los motores de respuesta (ChatGPT, Claude, Perplexity) citen tu contenido al responder preguntas de usuarios.

Futuro

GEO

Generative Engine Optimization

Optimización para que los modelos generativos incluyan tu marca en sus respuestas sintetizadas, tanto en entrenamiento como en inferencia.

Conceptos Clave

Terminología esencial para entender el ecosistema de búsqueda generativa

RAG
Retrieval-Augmented Generation

Proceso por el que una IA busca información en tiempo real para complementar su conocimiento entrenado antes de generar una respuesta.

Training Crawlers
Bots de Entrenamiento

Rastrean tu web para incorporar el contenido a los pesos del modelo durante el entrenamiento. Ausencia = marca poco conocida por la IA durante 12-24 meses.

Inference Crawlers
Bots de Inferencia

Rastrean en tiempo real durante una conversación activa. Determinan si tu web aparece en respuestas actuales de la IA.

E-E-A-T
Experience, Expertise, Authoritativeness, Trustworthiness

Marco de calidad de Google adoptado por todas las IAs para evaluar la credibilidad de una fuente antes de citarla.

02 — Plataformas

Guía por Plataforma

Cada plataforma de IA usa bots distintos con propósitos diferentes. Conocer la diferencia entre entrenamiento e inferencia es crítico.

OpenAI

ChatGPT & GPT-5

Bots de Rastreo

GPTBotGPTBot/1.3
Entrenamiento

Excluye tu marca de los pesos del modelo (12-24 meses de impacto)

→ Permitir si quieres que GPT-5+ conozca tu marca

OAI-SearchBotOAI-SearchBot/1.3
Búsqueda en tiempo real

Excluye tu web de las respuestas de ChatGPT Search

→ ⚡ CRÍTICO — Permitir siempre para visibilidad actual

ChatGPT-UserChatGPT-User/1.0
Navegación de usuario

ChatGPT no puede leer tu web durante conversaciones

→ Permitir para que ChatGPT acceda a tu contenido en tiempo real

Recomendaciones Técnicas

  • OAI-SearchBot y GPTBot son independientes — bloquear uno no afecta al otro
  • Bloquear GPTBot solo impacta el entrenamiento futuro, no la visibilidad actual
  • Actualiza robots.txt y espera ~24h para que los sistemas de OpenAI se ajusten
  • Publica IPs permitidas desde openai.com/searchbot.json en tu firewall

Configuración robots.txt

robots.txt
# Permitir búsqueda en tiempo real (CRÍTICO)
User-agent: OAI-SearchBot
Allow: /
# Permitir entrenamiento (recomendado)
User-agent: GPTBot
Allow: /
# Bloquear rutas privadas
User-agent: GPTBot
Disallow: /admin/
Disallow: /api/
Disallow: /checkout/
03 — Estándar Emergente

El archivo llms.txt

El llms.txt es para la IA lo que el sitemap.xml es para Google. Proporciona a los modelos de lenguaje una versión limpia y estructurada de tu sitio, sin el ruido del HTML.

📍

Ubicación

Coloca el archivo en la raíz de tu dominio: tudominio.com/llms.txt

📝

Formato

Markdown simplificado. Legible por humanos y por modelos de lenguaje por igual.

🎯

Propósito

Guiar a los LLMs sobre qué páginas son relevantes y qué información es crítica.

Configura tu llms.txt

llms.txt — Vista previa en tiempo real
# Nombre de tu sitio web
> Descripción breve de tu sitio para el contexto de la IA.
 
## Secciones Clave
- [Documentación](/docs): Guía técnica completa
- [Precios](/pricing): Planes y tarifas actualizadas
- [Blog](/blog): Artículos y novedades
 
## Idioma
- Idioma principal: Español
04 — Mejores Prácticas

Implementación Técnica

Ejemplos de código reales y listos para implementar. Cada práctica está respaldada por datos de citación de los principales motores de IA.

🏗️

Schema.org

Datos estructurados para IA

Schema.org es el lenguaje que las IAs entienden sin ambigüedad. Implementar JSON-LD elimina la necesidad de que el modelo interprete el HTML y reduce drásticamente las alucinaciones sobre tu marca.

Puntos Clave

  • Reduce alucinaciones al dar contexto explícito al modelo
  • FAQPage schema aumenta la probabilidad de ser citado en respuestas directas
  • Article schema con Author Person mejora la señal E-E-A-T
  • Organization schema establece la identidad de marca de forma inequívoca
index.html
<!-- Schema.org JSON-LD — Artículo con Autor verificado -->
<script type="application/ld+json">
{
"@context": "https://schema.org",
"@type": "Article",
"headline": "Cómo optimizar tu web para IA en 2026",
"datePublished": "2026-04-29",
"dateModified": "2026-04-29",
"author": {
"@type": "Person",
"name": "Ruben García",
"jobTitle": "Desarrollador con IA",
"url": "https://tudominio.com/equipo/ruben"
},
"publisher": {
"@type": "Organization",
"name": "Tu Empresa",
"url": "https://tudominio.com",
"logo": {
"@type": "ImageObject",
"url": "https://tudominio.com/logo.png"
}
},
"mainEntityOfPage": {
"@type": "WebPage",
"@id": "https://tudominio.com/articulo"
}
}
</script>
 
<!-- FAQPage Schema — Aumenta citas en respuestas directas -->
<script type="application/ld+json">
{
"@context": "https://schema.org",
"@type": "FAQPage",
"mainEntity": [{
"@type": "Question",
"name": "¿Qué es AEO?",
"acceptedAnswer": {
"@type": "Answer",
"text": "AEO (Answer Engine Optimization) es la práctica de
optimizar contenido para que los motores de respuesta
basados en IA citen tu web en sus respuestas."
}
}]
}
</script>
05 — Checklist

Plan de Implementación

26 acciones priorizadas para optimizar tu sitio. Marca tu progreso — se guarda automáticamente en tu navegador.

Progreso de implementación0/26
0%0% completado100%

Técnico Base

0/8
HTTPS activo con certificado SSL válidoCrítico

Las IAs no citan sitios sin HTTPS. Verifica en SSL Labs.

OAI-SearchBot permitido en robots.txtCrítico

Crítico para aparecer en ChatGPT Search. Verificar en openai.com/searchbot.json

anthropic-ai permitido en robots.txtCrítico

Crítico para citas en tiempo real de Claude.

PerplexityBot permitido en robots.txtCrítico

Esencial para el 'answer engine' con +780M consultas/mes.

Googlebot NUNCA bloqueadoCrítico

Googlebot alimenta Gemini AI Overviews. Bloquearlo elimina visibilidad en Google y Gemini.

sitemap.xml actualizado y enviado a Search ConsoleAlto

Facilita el rastreo de todas las páginas relevantes.

Core Web Vitals en verde (LCP < 2.5s, CLS < 0.1)Alto

La velocidad impacta la frecuencia de rastreo de los bots.

Diseño responsive y mobile-firstAlto

Google indexa en modo mobile-first. Gemini hereda este comportamiento.

llms.txt

0/4
Archivo llms.txt creado en la raíz del dominioAlto

Usa el generador de esta guía para crear tu archivo.

Descripción clara del sitio en llms.txtAlto

Primera línea con > debe resumir tu propuesta de valor en 1-2 frases.

Secciones clave enlazadas en llms.txtMedio

Incluir: /pricing, /docs, /about, /blog con descripciones.

llms.txt actualizado tras cambios importantesMedio

Actualiza cuando cambien precios, productos o información crítica.

Schema.org

0/4
Organization schema implementado en homepageAlto

Define nombre, URL, logo, descripción y redes sociales de la empresa.

Article schema en todos los artículos del blogAlto

Incluir: headline, datePublished, dateModified, author (Person), publisher.

FAQPage schema en páginas con preguntas frecuentesAlto

Aumenta un 37% la probabilidad de ser citado en respuestas directas.

Product schema en páginas de producto/servicioMedio

Incluir: name, description, price, availability, review.

E-E-A-T y Contenido

0/7
Biografías de autor con credenciales verificablesAlto

Nombre, cargo, años de experiencia, enlace a LinkedIn/perfil.

Citas a fuentes externas de autoridad en artículosAlto

Estudios, datos oficiales, publicaciones académicas. Mínimo 2-3 por artículo.

Fecha 'Última actualización' visible en páginas claveAlto

Perplexity penaliza contenido con más de 30 días sin actualizar.

Respuesta directa en los primeros 50-60 palabrasAlto

Patrón: Definición → Explicación → Ejemplo. Facilita extracción por RAG.

Encabezados H2/H3 formulados como preguntas realesMedio

Ejemplo: '¿Cómo funciona X?' en lugar de 'Funcionamiento de X'.

Tablas HTML para datos comparativos y especificacionesMedio

Los LLMs procesan tablas mejor que párrafos densos para comparaciones.

Datos y estadísticas propias publicadasMedio

El contenido original con datos únicos recibe 3.2× más citas en IA.

Presencia Multi-plataforma

0/3
Presencia activa y auténtica en Reddit (subreddits relevantes)Medio

Reddit representa el 46.7% de las citas de Perplexity. Sin spam.

Contenido en YouTube con descripciones detalladasMedio

YouTube es el 13.9% de las citas de Perplexity. Títulos como preguntas.

Artículos de liderazgo en LinkedInMedio

Refuerza la autoridad de marca y la señal E-E-A-T de los autores.