El archivo llms.txt
actúa como una guía o mapa de sitio estructurado que ayudas a las IAs a comprender y procesar mejor el contenido de tu sitio web.
El llms.txt
es un archivo en formato Markdown ubicado en el directorio raíz de tu sitio web (ejemplo.com/llms.txt
). Su propósito es proporcionar a los modelos de lenguaje una visión clara y estructurada de los contenidos más relevantes de tu sitio, destacando documentación clave, enlaces importantes y descripciones concisas.
A diferencia de robots.txt
o sitemap.xml
, que están orientados a los motores de búsqueda tradicionales, llms.txt
está diseñado específicamente para optimizar la interacción con IAs.
El incluir este archivo en tu sitio web puede ayudarte a:
- Mejorar la visibilidad en respuestas generadas por IAs: Al proporcionar una estructura clara, aumentas las posibilidades de que tu contenido sea citado en respuestas de modelos de lenguaje. Digamos que es una especie de mezcla entre un sitemap y datos estructurados de tu web.
- Control sobre la representación de tu contenido: Puedes guiar a las IA hacia la información que consideras más relevante, asegurando una representación precisa de tu marca o servicios.
- Complementa tu estrategia SEO tradicional:
llms.txt
no reemplaza arobots.txt
ositemap.xml
, sino que los complementa. - Facilita la comprensión del contenido complejo: Al eliminar elementos como anuncios o scripts innecesarios, las IA pueden centrarse en el contenido esencial de tu sitio.
Estructura del contenido
Cómo estructurar tu archivo llms.txt
La estructura recomendada para llms.txt
es la siguiente:
# Nombre de tu Sitio o Proyecto
> Breve descripción de tu sitio o proyecto.
## Documentación
- [Título del Enlace](URL): Descripción breve del recurso.
## Ejemplo para posts
- [Título del Enlace](URL): Descripción breve del post.
## Opcional
- [Título del Enlace](URL): Información adicional menos crítica.
Es importante mantener las descripciones concisas y utilizar encabezados (##
) para organizar el contenido (como si fueran H1 # y H2 ## ,en html). La sección «Opcional» puede incluir enlaces a recursos adicionales que, aunque pueden ser útiles, no son imprescindibles.
Herramientas para generar llms.txt
Pese a que encontrarás online muchas «gratuitas», las que he probado (dependiendo de la cantidad de urls que tenga tu site) te va a hacer una especie de muestra de llms.txt , por lo que, si tienes por ejemplo WordPress como yo, te recomiendo que te instales el plugin gratuito «Website LLMs.txt» que te generará de forma actualizada y completa el llms.txt completo.
Yo lo tengo generado con ese plugin de WordPress en otro sitio web, y además del llms.txt, te genera un llms-sitemap.xml que puedes subir a Search Console o BingWMT para facilitar su rastreo.
Otras herramientas que te van a pedir acceso completo si quieres un llms.txt full del site, son:
Mejores prácticas para llms.txt
- Incluye solo contenido relevante: Evita sobrecargar el archivo con información innecesaria.
- Utiliza descripciones claras y concisas: Facilita la comprensión por parte de las IA.
- Organiza el contenido de manera lógica: Agrupa enlaces relacionados bajo encabezados apropiados.
- Actualiza regularmente el archivo: Refleja cambios en tu sitio para mantener la información actualizada
En mi caso, he probado a incluirlo en algunos de mis sitios web que ya estaban recibiendo algo de contenido referido por IAs como ChatGPT (hoy 16/04/25), y haré seguimiento por si pudiera notar algo en cuanto al volumen de sesiones recibidos. Aunque ya puedo adelantarte que, sólo por el simple hecho de incluir este fichero (al igual que pasa con los sitemas.xml) no va a hacer que vaya a recibir más tráfico de las IAs, pero sí que creo que puede ayudar a que entiendan la estructura del site y pueda llegar a mostrarme como fuente…
Medición básica en GA del tráfico recibido por las IAs
Puedes hacer tú también lo mismo con tu sitio web, midiendo el tráfico que recibe de las IAs.
Si no has incluido aún tu sitio web en GA4, aquí te dejo un artículo sencillo para que lo añadas.
Una vez añadido, puedes crear tus propios dashboards o informes («Explorar» en GA4) configurándolo a través de la creación de un segmento por sesiones en GA4:
URL referente de la página = https://chatgpt.com/
A partir de aquí es cuestión de ir revisando cómo evoluciona ese tráfico, ya que Google por ahora no ha incluido en Search Console ninguna funcionalidad que te permita revisar cuál es el rendimiento de dicho elemento en el buscador (AIO).