La mayoría de artículos sobre llms.txt son teoría. Este no. Aquí te cuento, paso a paso y con honestidad, cómo lo implementé en un proyecto real y propio: HacerDeporte.es, un directorio nacional de deporte. Lo que funcionó, lo que decidí y cómo lo verifico — sin promesas mágicas.
En una frase: añadí un llms.txt bien estructurado, reforcé los datos estructurados y abrí el acceso a los rastreadores de IA. Coste: prácticamente cero. Tiempo: una tarde. Objetivo: que cuando alguien le pregunte a la IA por deporte, el directorio sea una fuente clara y fácil de citar.
El punto de partida
HacerDeporte.es es un directorio con muchas páginas (centros, actividades, zonas). Ese tipo de webs tiene una ventaja y un problema de cara a la IA:
- Ventaja: mucha información útil y estructurable.
- Problema: a un modelo de IA le cuesta saber por dónde empezar y qué es lo importante entre cientos de URLs.
Justo para eso sirve el llms.txt: darle a la IA un "índice con contexto" de lo que de verdad importa.
Paso 1: decidir qué quería que la IA entendiera
Antes de escribir nada, me hice tres preguntas, que son las mismas que recomiendo a cualquier cliente:
- ¿Qué es el sitio, en una frase que cualquiera entienda?
- ¿Cuáles son las 5-8 páginas que resumen su valor?
- ¿Qué preguntas de usuario debería poder responder con mi web como fuente?
Este paso es el 80% del trabajo. El archivo en sí es lo fácil; lo difícil es tener claro el mensaje.
Paso 2: redactar el llms.txt
Seguí el estándar (llmstxt.org): un H1 con el nombre, un resumen en cita y secciones con enlaces. Una versión simplificada de la estructura que usé:
# HacerDeporte > HacerDeporte.es es un directorio nacional de deporte en España: ayuda a > encontrar centros, actividades y opciones para hacer deporte por zonas. ## Páginas principales - [Inicio](https://hacerdeporte.es/): qué es y cómo encontrar deporte cerca. - [Buscar por zona](...): listado de centros y actividades por provincia/ciudad. - [Categorías de deporte](...): tipos de actividad y disciplinas. ## Información útil - [Cómo funciona](...): cómo usar el directorio. - [Contacto](...)
Fíjate en la cita inicial: es la frase que más leerá la IA. La escribí pensando en cómo quiero que me "resuma" un asistente a un usuario.
Paso 3: no quedarse solo en el llms.txt
Aquí está la lección más importante y la más honesta: el llms.txt por sí solo no hace milagros. Es una pieza de un conjunto. Así que en paralelo me aseguré de:
- Datos estructurados (schema.org): reforcé el marcado para que cada ficha se entienda sola. (Lo explico en esta guía.)
- Acceso de los rastreadores de IA: revisé el
robots.txtpara no bloquear aGPTBot,OAI-SearchBot,PerplexityBot, etc. - Rendimiento y HTML legible: que el contenido esté disponible sin depender de JavaScript pesado.
Paso 4: subirlo y comprobar que es accesible
El archivo va en la raíz: hacerdeporte.es/llms.txt. Comprobé dos cosas:
- Que abre como texto Markdown (no como una página de error 404).
- Que empieza por un H1 (
# HacerDeporte) — algunos validadores, como el de Google, lo exigen.
Paso 5: cómo verifico si sirve
Seamos honestos: esto no es un interruptor con resultado instantáneo. La forma sensata de medirlo:
- Prueba conversacional: preguntar a ChatGPT (con navegación) y a Perplexity por "dónde hacer deporte en [ciudad]" y ver si el directorio aparece o se cita como fuente.
- Repetir la prueba pasadas unas semanas: la mejora en IA es progresiva, según los modelos vuelven a rastrear.
- Registrar el "antes": guardé capturas del estado inicial para comparar. Recomiendo a todo el mundo hacer esta foto de partida.
No te fíes de quien te prometa "saldrás el primero en ChatGPT en 3 días". Nadie controla eso. Lo que sí controlas es poner todas las señales a tu favor, que es exactamente lo que hace este proceso.
Qué aprendí (y aplico con clientes)
- El mensaje > el archivo. Un
llms.txtclaro vale más que uno largo y confuso. - Es un conjunto. llms.txt + datos estructurados + acceso de bots + rendimiento. Juntos.
- Adelantarse compensa. Casi ninguna web española lo tiene aún. Hoy es una ventaja barata; mañana será lo normal.
Si tienes un negocio o un directorio y quieres el mismo tratamiento, el primer paso es ver cómo te encuentra hoy la IA. Es gratis.
