Caso real

Cómo implementé llms.txt en un directorio nacional (HacerDeporte.es)

La mayoría de artículos sobre llms.txt son teoría. Este no. Aquí te cuento, paso a paso y con honestidad, cómo lo implementé en un proyecto real y propio: HacerDeporte.es, un directorio nacional de deporte. Lo que funcionó, lo que decidí y cómo lo verifico — sin promesas mágicas.

En una frase: añadí un llms.txt bien estructurado, reforcé los datos estructurados y abrí el acceso a los rastreadores de IA. Coste: prácticamente cero. Tiempo: una tarde. Objetivo: que cuando alguien le pregunte a la IA por deporte, el directorio sea una fuente clara y fácil de citar.

El punto de partida

HacerDeporte.es es un directorio con muchas páginas (centros, actividades, zonas). Ese tipo de webs tiene una ventaja y un problema de cara a la IA:

  • Ventaja: mucha información útil y estructurable.
  • Problema: a un modelo de IA le cuesta saber por dónde empezar y qué es lo importante entre cientos de URLs.

Justo para eso sirve el llms.txt: darle a la IA un "índice con contexto" de lo que de verdad importa.

Paso 1: decidir qué quería que la IA entendiera

Antes de escribir nada, me hice tres preguntas, que son las mismas que recomiendo a cualquier cliente:

  1. ¿Qué es el sitio, en una frase que cualquiera entienda?
  2. ¿Cuáles son las 5-8 páginas que resumen su valor?
  3. ¿Qué preguntas de usuario debería poder responder con mi web como fuente?

Este paso es el 80% del trabajo. El archivo en sí es lo fácil; lo difícil es tener claro el mensaje.

Paso 2: redactar el llms.txt

Seguí el estándar (llmstxt.org): un H1 con el nombre, un resumen en cita y secciones con enlaces. Una versión simplificada de la estructura que usé:

# HacerDeporte

> HacerDeporte.es es un directorio nacional de deporte en España: ayuda a
> encontrar centros, actividades y opciones para hacer deporte por zonas.

## Páginas principales
- [Inicio](https://hacerdeporte.es/): qué es y cómo encontrar deporte cerca.
- [Buscar por zona](...): listado de centros y actividades por provincia/ciudad.
- [Categorías de deporte](...): tipos de actividad y disciplinas.

## Información útil
- [Cómo funciona](...): cómo usar el directorio.
- [Contacto](...)

Fíjate en la cita inicial: es la frase que más leerá la IA. La escribí pensando en cómo quiero que me "resuma" un asistente a un usuario.

Paso 3: no quedarse solo en el llms.txt

Aquí está la lección más importante y la más honesta: el llms.txt por sí solo no hace milagros. Es una pieza de un conjunto. Así que en paralelo me aseguré de:

  • Datos estructurados (schema.org): reforcé el marcado para que cada ficha se entienda sola. (Lo explico en esta guía.)
  • Acceso de los rastreadores de IA: revisé el robots.txt para no bloquear a GPTBot, OAI-SearchBot, PerplexityBot, etc.
  • Rendimiento y HTML legible: que el contenido esté disponible sin depender de JavaScript pesado.

Paso 4: subirlo y comprobar que es accesible

El archivo va en la raíz: hacerdeporte.es/llms.txt. Comprobé dos cosas:

  1. Que abre como texto Markdown (no como una página de error 404).
  2. Que empieza por un H1 (# HacerDeporte) — algunos validadores, como el de Google, lo exigen.

Paso 5: cómo verifico si sirve

Seamos honestos: esto no es un interruptor con resultado instantáneo. La forma sensata de medirlo:

  • Prueba conversacional: preguntar a ChatGPT (con navegación) y a Perplexity por "dónde hacer deporte en [ciudad]" y ver si el directorio aparece o se cita como fuente.
  • Repetir la prueba pasadas unas semanas: la mejora en IA es progresiva, según los modelos vuelven a rastrear.
  • Registrar el "antes": guardé capturas del estado inicial para comparar. Recomiendo a todo el mundo hacer esta foto de partida.
No te fíes de quien te prometa "saldrás el primero en ChatGPT en 3 días". Nadie controla eso. Lo que sí controlas es poner todas las señales a tu favor, que es exactamente lo que hace este proceso.

Qué aprendí (y aplico con clientes)

  • El mensaje > el archivo. Un llms.txt claro vale más que uno largo y confuso.
  • Es un conjunto. llms.txt + datos estructurados + acceso de bots + rendimiento. Juntos.
  • Adelantarse compensa. Casi ninguna web española lo tiene aún. Hoy es una ventaja barata; mañana será lo normal.

Si tienes un negocio o un directorio y quieres el mismo tratamiento, el primer paso es ver cómo te encuentra hoy la IA. Es gratis.

¿Quieres esto para tu web?

Analiza gratis tu preparación para la IA y te digo, sin compromiso, qué implementar (incluido tu llms.txt).

Analizar mi web gratis