Cómo seleccionan contenido los motores IA
Los modelos de lenguaje como ChatGPT, Perplexity y Gemini utilizan sistemas RAG (Retrieval-Augmented Generation) para seleccionar qué contenido citar en sus respuestas. Estos sistemas extraen fragmentos de texto — normalmente párrafos o secciones — y los evalúan según señales medibles.
El estudio de Aggarwal et al. (Princeton, KDD 2024) identificó 9 estrategias de optimización y evaluó su impacto sobre 10.000 consultas. Las tres con mayor efecto documentado son: estadísticas verificables (+22-40% de visibilidad), citas a fuentes autoritativas (+115% para sitios fuera del top 3) y respuesta directa al inicio del contenido.
Los 10 factores que aplicamos
Nuestro motor de scoring evalúa cada página contra 10 factores con peso diferenciado:
- Estadísticas verificables (peso 15%) — datos concretos con fuente identificable
- Citas autoritativas (peso 15%) — referencias a estudios, instituciones o expertos reconocidos
- Respuesta directa (peso 12%) — la información clave en las primeras 60 palabras
- Frescura (peso 10%) — señales de actualización reciente
- Estructura clara (peso 10%) — headings, listas, tablas que facilitan la extracción por RAG
- Menciones de terceros (peso 10%) — earned media, comparativas, casos de estudio
- Señales E-E-A-T (peso 8%) — experiencia, expertise, autoridad y confianza demostradas
- Longitud adecuada (peso 8%) — entre 800 y 2.500 palabras para consultas complejas
- Ausencia de keyword stuffing (peso 8%) — repetición natural, sin forzar términos
- Sección FAQ (peso 4%) — formato pregunta-respuesta que coincide con consultas a LLMs
Proceso de optimización
- Scoring inicial: evaluamos cada página con el motor de 10 factores y generamos un informe base
- Priorización: seleccionamos las páginas con mayor impacto potencial (combinación de relevancia comercial y margen de mejora)
- Reescritura: optimizamos el contenido aplicando los factores, integrando datos reales y restructurando para extracción RAG
- Scoring final: medimos la mejora con el mismo motor, comparando puntuación factor por factor
Contenido GEO vs contenido SEO tradicional
La diferencia principal es el enfoque en citabilidad. El contenido SEO busca posicionar en los resultados de búsqueda; el contenido GEO busca ser seleccionado como fuente por un modelo de lenguaje. En la práctica, ambos objetivos se refuerzan mutuamente: los factores que priorizan los LLMs — datos concretos, fuentes verificables, respuestas directas — son los mismos que Google valora bajo el marco E-E-A-T.