De la palabra clave (keywords) a “entidades”. La diferencia clave que muchos no entienden entre Google y los LLMs (IAs como Chat GPT, Gemini, etc.)

marzo 9, 2026

Hay una escena que se repite en salas de juntas y videollamadas de marketing:

“¿Cuál es la keyword?”
“¿La ponemos en el H1 o en el H2?”
“¿Y si repetimos la keyword 17 veces, Google nos quiere más?”

Y ahí es donde, con cariño profesional y una ceja levantada, toca decirlo: si tu estrategia sigue orbitando “la keyword”, no vas tarde. Vas en otra galaxia.

La conversación real hoy no es “keywords vs no keywords”. Es strings vs entidades. Y, de paso, entender por qué Google y los LLMs juegan en tableros distintos, aunque a simple vista parezcan el mismo juego de “buscar y responder”.

1) “Keyword” es una cadena. “Entidad” es una cosa (con apellido, historia y relaciones)

Una keyword es texto: caracteres en fila. “Jaguar”, “Apple”, “Mercurio”, “Java”. Fin.

Una entidad es un objeto del mundo con identidad:

un animal (Jaguar, especie)
una marca (Jaguar, automóviles)
un planeta (Mercurio)
un elemento químico (Mercurio)
un lenguaje de programación (Java)
una isla (Java)

Google lleva más de una década gritando esto con modales de ingeniero: “things, not strings”. Su Knowledge Graph se construyó justo para entender entidades y sus relaciones (Google).

Si tu contenido solo “apunta” a una palabra, estás apuntando a una sombra. Si apunta a la entidad correcta (y la rodea con contexto verificable), ya estás hablando el idioma de los sistemas modernos.

2) Google no “lee tu keyword”. Google te rastrea, te indexa y luego decide si mereces existir

Google Search funciona (simplificando) en tres etapas: crawling, indexing y serving (Google).

En español humano:

Crawling: te encuentran (si te dejas).
Indexing: entienden “de qué va” tu página (contenido, etiquetas, estructura).
Serving: si alguien busca algo, deciden si tu página ayuda o estorba.

Y aquí viene el golpe suave: puedes tener la keyword perfecta y seguir fuera del juego si tu sitio es difícil de rastrear, si tu render rompe contenido, si tu indexabilidad está cojeando, o si tu arquitectura no conecta conceptos.

Ahora, cuando Google “entiende”, cada vez más entiende en términos de entidades. Incluso existe una API pública para “encontrar entidades” del Knowledge Graph y trabaja con tipos de schema.org y JSON-LD (Google).

Traducción para marketing: no es solo “qué palabra pusiste”, sino “qué entidad afirmas ser y qué tan bien la describes y conectas con el resto del universo web”.

3) Un LLM no es un índice. Es un motor probabilístico que piensa en “vectores” (y a veces consulta fuentes)

Aquí es donde muchos se confunden y empiezan a tratar a ChatGPT como si fuera Google con un filtro de “habla bonito”.

Los LLMs trabajan con representaciones matemáticas del lenguaje. Un concepto clave son los embeddings: transformar texto en números para medir “cercanía” semántica (OpenAI).

Eso permite cosas como:

“esto se parece a aquello”
“esto pertenece a esta familia de ideas”
“esto responde a esa intención”

Pero ojo: eso no es lo mismo que tener un índice web actualizado ni un ranking clásico de “10 links azules”.

Y cuando hablamos de “IA que responde con fuentes”, entramos en lo que la investigación llama generative engines: sistemas que recopilan información de varias fuentes y la sintetizan en una respuesta (Princeton / arXiv). Relativo a esto tenemos un artículo que te explica qué es el RAG: Retrieval Augmented Generation

4) La diferencia clave: Google te posiciona. Un generative engine te selecciona (o te ignora) para construir su respuesta

Aquí va la comparación sin humo:

Tema	Google (Search)	LLMs en modo “respuesta” / Generative engines
Unidad de competencia	Páginas y documentos indexados	Fragmentos útiles para sintetizar
Objetivo del sistema	Elegir resultados relevantes	Construir una respuesta coherente (idealmente con citas)
Tu “premio”	Ranking, clics, tráfico	Ser citado, ser usado como fuente, ser “la verdad” en el resumen
Riesgo típico	No indexar / no rankear	No ser elegido (o ser mal interpretado)

Y aquí entra GEO.

5) GEO no es “SEO para ChatGPT”. Es optimizar para que tu contenido sea citable y seleccionable

La investigación académica ya lo formalizó como Generative Engine Optimization (GEO): un paradigma para mejorar la visibilidad del contenido dentro de respuestas generadas (Princeton / arXiv).

En esa línea, reportan mejoras de visibilidad “hasta 40%” bajo su marco experimental (Princeton / arXiv).

El punto no es “meter keywords en el prompt”. El punto es:

Que tu contenido tenga afirmaciones claras
Que esas afirmaciones estén ancladas a entidades
Que haya estructura (schema, secciones, definiciones)
Que existan datos verificables
Que sea fácil “cortar y citar” sin perder el sentido

6) Ejemplo práctico: “Jaguar” (y por qué tu contenido puede quedar en ridículo sin querer)

Imagina que una agencia creativa tiene un cliente: un taller premium que trabaja con Jaguar (marca de autos). Publican un artículo titulado:

“Jaguar: potencia, elegancia y velocidad”

Keyword: “jaguar”. Listo. Champagne.

Problema: “jaguar” también es un animal.

¿Qué pasa en Google?

Google intenta desambiguar. Si tu página no deja claro “Jaguar (automóviles)”, puede competir en un territorio confuso. Y si además no hay señales estructurales (entidad, contexto, schema, términos relacionados, modelos, años, servicios), la página se vuelve una carta sin remitente.

¿Qué pasa en un LLM?

Si alguien pregunta:

“¿Cada cuánto se cambia el aceite a un Jaguar?”
un sistema generativo puede:
Responder genérico (y aburrido),
Mezclar modelos,
O peor: “inventar con seguridad” si no está apoyado en fuentes (las famosas alucinaciones).

La versión “GEO-ready”

En lugar de escribir poesía vaga, escribes claridad utilizable:

Definición directa: “Jaguar es una marca de automóviles…”
Atributos concretos: “modelos comunes, rangos de años, especificaciones generales (si aplica), recomendaciones por modelo…”
Contexto de servicio: “intervalos típicos, variables que cambian el intervalo, advertencias”
Estructura: secciones con encabezados, listas, preguntas frecuentes, schema FAQ si aplica
Conexiones semánticas: “mantenimiento preventivo”, “aceite sintético”, “intervalo de servicio”, “filtros”, “diagnóstico OBD”, etc.

Eso hace dos cosas:

Ayuda a Google a entender la entidad correcta
Hace que un generative engine diga: “esta fuente me sirve para construir respuesta”

7) Señales de que tu equipo sigue atrapado en 2016 (y no lo sabe)

Si en tu junta se escucha mucho esto:

“Pon la keyword exacta”
“¿Cuántas veces la repetimos?”
“Hagamos un post por keyword”
“Luego vemos lo técnico”

… entonces sí: esto se sale de tu liga actual. No por falta de talento creativo, sino porque es otra disciplina.

Y no pasa nada. La creatividad no está peleada con la ingeniería, solo que rara vez viven en el mismo departamento.

8) El cierre incómodo (pero útil): creatividad que no se encuentra, no existe. Contenido que no se cita, no manda

En Factor SEO trabajamos con agencias de diseño y creatividad todo el tiempo. Y casi siempre la historia es la misma: una idea brillante que se estrella contra:

Tracking mal implementado,
Conversiones mal configuradas,
Indexabilidad rota,
Arquitectura sin lógica,
Contenido que “suena bonito” pero no afirma nada utilizable.

Ahí entramos nosotros: ciencia aplicada al marketing, obsesión por indexabilidad, instrumentación de conversiones, y ahora, con toda intención, GEO.

Si tu agencia quiere seguir siendo la que diseña el mensaje, perfecto. Nosotros nos encargamos de que ese mensaje tena más probabilidades de que:

Se encuentre
Se entienda
Se elija
Y, cada vez más importante, Se cite

Porque el futuro cercano no es “rankear #1”. Es ser la fuente.

Fuentes (referencia básica)

Google Knowledge Graph y “things, not strings” (Google).
Cómo funciona Google Search: crawling, indexing, serving (Google).
Knowledge Graph Search API y entidades con schema.org/JSON-LD (Google).
Embeddings: texto a números y “relatedness” semántica (OpenAI).
GEO: Generative Engine Optimization, GEO-bench y visibilidad hasta 40% (Princeton / arXiv).