Un token es la unidad mínima de texto con la que trabaja un modelo de inteligencia artificial. No es ni una letra ni exactamente una palabra: es un fragmento intermedio (a veces una palabra entera, a veces un trozo de ella) que el modelo convierte en números para poder procesarlo. Cuando ChatGPT, Gemini o Claude leen tu pregunta y generan una respuesta, no ven palabras: ven secuencias de tokens. Entender qué es un token explica de golpe tres cosas que confunden a mucha gente: por qué la IA cobra por «tokens» y no por palabras, por qué tiene un límite de cuánto texto puede leer de una vez y por qué a veces parte palabras de forma rara. Esta guía lo aclara con ejemplos.
Si estás trabajando tu visibilidad en motores generativos, este concepto no es trivia técnica: el coste de cada consulta, la cantidad de contexto que el modelo puede manejar y hasta cómo «entiende» tu marca dependen de cómo se tokeniza el texto.
Qué es un token, en una frase
Un token es un fragmento de texto que el modelo trata como una sola pieza. La inteligencia artificial no entiende caracteres ni palabras tal como las leemos nosotros; las máquinas trabajan con números. Para salvar esa distancia, el texto se trocea en tokens y cada token se traduce a un identificador numérico que el modelo sí puede manipular.
Un token puede ser:
- Una palabra completa:
casa,perro,azul. - Un trozo de una palabra:
inteligen+cia. - Un signo de puntuación:
.,,,¿. - Un espacio combinado con la palabra siguiente (muchos sistemas incluyen el espacio dentro del token).
La idea clave: el token es la unidad de procesamiento, no la unidad de significado. No coincide siempre con lo que tú llamarías «una palabra».
Qué es la tokenización
La tokenización es el proceso de convertir un texto en una lista de tokens. Es el primer paso de todo lo que hace un modelo de lenguaje: antes de razonar o generar nada, parte tu frase en piezas.
El método más extendido hoy se llama subword tokenization (tokenización por subpalabras). En lugar de tener un token por cada palabra del idioma —algo imposible, serían millones— el modelo aprende un vocabulario de unos pocos miles o decenas de miles de fragmentos frecuentes. Con ese vocabulario reconstruye cualquier palabra combinando trozos.
Un ejemplo simplificado de cómo se trocea una frase:
| Texto original | Tokens (aprox.) |
|---|---|
La inteligencia artificial | La · intelig · encia · artificial |
tokenización | token · ización |
ChatGPT | Chat · G · PT |
Las palabras comunes («la», «de», «casa») suelen ser un solo token. Las palabras largas, raras, técnicas o en otro idioma se parten en varios tokens. Por eso un nombre de marca poco habitual puede «costar» más tokens que una palabra cotidiana.
Por qué se trocea así
La tokenización por subpalabras resuelve un problema práctico. Si el modelo solo conociera palabras enteras, no sabría qué hacer con un término nuevo, un error tipográfico o una palabra inventada. Al trabajar con fragmentos reutilizables, puede representar cualquier texto —incluso palabras que nunca vio en su entrenamiento— ensamblando piezas conocidas. Es el equilibrio entre tener un vocabulario manejable y poder representarlo todo.
Por qué la IA usa tokens y no palabras
Podría parecer más sencillo que el modelo procesara palabras directamente. Hay tres razones técnicas por las que no lo hace:
-
El concepto de «palabra» no es universal. ¿«Rock and roll» es una palabra o tres? ¿«wifi» o «wi-fi»? ¿Y un emoji, una URL o el código
np.array()? El token es una definición operativa que no depende de las reglas gramaticales de un idioma concreto. -
Los idiomas funcionan distinto. En español separamos con espacios, pero el chino y el japonés apenas los usan, y el alemán encadena palabras larguísimas. Una unidad basada en fragmentos funciona en todos los idiomas; una basada en «palabras separadas por espacios», no.
-
Las máquinas necesitan números. El modelo no opera con letras, sino con vectores numéricos. Necesita un vocabulario finito y fijo donde cada token tenga su identificador. Las subpalabras permiten un vocabulario cerrado que aun así representa texto infinito.
En resumen: el token es una unidad diseñada para máquinas, no heredada del lenguaje humano. Por eso a veces parte palabras de una forma que a nosotros nos parece arbitraria.
Cuántos tokens tiene una palabra
Esta es la pregunta práctica que más se repite. La respuesta corta: depende del idioma y de la palabra, pero hay reglas aproximadas muy útiles.
| Idioma | Equivalencia aproximada | Regla rápida |
|---|---|---|
| Inglés | 1 token ≈ 0,75 palabras | 100 tokens ≈ 75 palabras |
| Inglés (caracteres) | 1 token ≈ 4 caracteres | — |
| Español | algo más de 1 token por palabra de media | 100 palabras ≈ 110-130 tokens |
| Palabras largas/técnicas | 2-4 tokens cada una | nombres propios y tecnicismos cuestan más |
Las cifras del inglés son las que publican los propios proveedores de modelos, porque la mayoría se entrenaron con más texto en inglés. El español es algo menos eficiente: nuestras palabras tienden a ser más largas y a partirse en más fragmentos, así que un mismo texto suele consumir más tokens en español que en inglés. Es un detalle relevante si comparas costes o longitudes entre idiomas.
Algunos ejemplos concretos (aproximados, el recuento exacto varía según el modelo):
casa→ 1 tokenperro→ 1 tokeninteligencia→ 2 tokens (intelig+encia)tokenización→ 2 tokenselectroencefalografista→ 5-6 tokens¿Cómo estás?→ 4-5 tokens (la apertura¿, el espacio, los signos cuentan)
Una regla mental sencilla para el español: un párrafo de 100 palabras ronda los 130 tokens. Y un truco rápido para estimar en inglés: divide los caracteres entre cuatro.
Tokens, coste y contexto: por qué importa
Aquí es donde el concepto deja de ser teórico. Casi todo lo que define el comportamiento y el precio de un modelo de lenguaje se mide en tokens.
El coste se cobra por token
Las APIs de los grandes modelos (OpenAI, Anthropic, Google) no facturan por palabra ni por consulta: facturan por token, y normalmente con dos precios distintos: uno para los tokens que envías (entrada/input) y otro, más caro, para los que el modelo genera (salida/output).
Esto tiene consecuencias prácticas:
- Un prompt largo cuesta más que uno corto, aunque la pregunta sea la misma.
- El español, al gastar más tokens, sale ligeramente más caro que el inglés para el mismo contenido.
- Pedir respuestas concisas no es solo cuestión de estilo: ahorra dinero.
El contexto tiene un límite en tokens
Todo modelo tiene una ventana de contexto (context window): el máximo de tokens que puede tener «en mente» a la vez, sumando tu mensaje y su respuesta. Se mide en tokens, no en palabras.
| Concepto | Qué significa |
|---|---|
| Ventana de contexto | Tokens máximos que el modelo procesa de una vez (entrada + salida) |
| Tokens de entrada | Tu prompt, instrucciones, documentos que pegas |
| Tokens de salida | El texto que el modelo genera como respuesta |
Si superas la ventana, el modelo «olvida» el principio de la conversación o trunca el documento. Por eso, cuando pegas un PDF enorme en un chat, a veces el asistente ignora las primeras páginas: no caben en su ventana de tokens. Los modelos modernos manejan ventanas de cientos de miles de tokens, pero el límite sigue existiendo y se mide siempre en esta unidad.
Por qué esto conecta con tu visibilidad
Si trabajas el posicionamiento en motores de IA (GEO), los tokens te afectan de forma indirecta pero real. Cuando un asistente recupera información sobre tu marca para responder a un usuario, ese contenido entra en su ventana de contexto como tokens. Un texto claro, conciso y bien estructurado se representa con menos tokens y deja más espacio para que el modelo lo cite junto a otras fuentes. La economía de tokens es una razón más para escribir de forma directa y citable. Lo desarrollamos en la guía sobre cómo aparecer en la IA.
Conclusión
Un token es la pieza básica con la que la inteligencia artificial lee y escribe: un fragmento de texto —a veces una palabra, a veces un trozo— que el modelo convierte en números. La tokenización es el proceso de trocear el texto en esas piezas, y se hace por subpalabras para poder representar cualquier idioma y cualquier palabra con un vocabulario finito.
Lo importante no es memorizar el mecanismo, sino entender sus consecuencias. Los tokens explican por qué la IA tiene límites de contexto (la ventana se mide en tokens), por qué cuesta lo que cuesta (se factura por token, no por palabra) y por qué el español gasta algo más que el inglés. Como regla práctica: en español, 100 palabras rondan los 130 tokens; en inglés, 100 tokens equivalen a unas 75 palabras.
Es un concepto pequeño con un alcance enorme: aparece cada vez que usas, pagas o optimizas para un modelo de lenguaje. Y entenderlo es el primer paso para entender cómo funciona la IA por dentro.
Preguntas frecuentes
¿Un token es lo mismo que una palabra? No. Un token es la unidad con la que trabaja el modelo, y no coincide siempre con una palabra. Las palabras comunes suelen ser un solo token, pero las largas, técnicas o poco frecuentes se parten en varios. De media, en inglés 1 token equivale a unas 0,75 palabras; en español, una palabra suele consumir algo más de un token.
¿Cuántos tokens tiene una palabra en español?
Depende de la palabra. Las cortas y frecuentes (casa, de, el) son un token; las largas o técnicas pueden ser dos, tres o más. Como aproximación útil, un texto de 100 palabras en español ronda los 110-130 tokens, algo más que en inglés porque nuestras palabras tienden a ser más largas.
¿Por qué la IA cuenta tokens y no palabras? Porque el token es una unidad pensada para máquinas: funciona igual en cualquier idioma, permite un vocabulario finito y representa incluso palabras que el modelo nunca vio. El concepto de «palabra separada por espacios» no sirve en idiomas como el chino o el alemán, así que los modelos usan fragmentos de texto en su lugar.
¿Por qué importan los tokens para el coste y el contexto? Porque ambos se miden en tokens. Las APIs de IA facturan por token consumido (y la salida suele costar más que la entrada), así que un prompt largo es más caro. Y la ventana de contexto —cuánto texto puede procesar el modelo de una vez— también se cuenta en tokens: si la superas, el modelo olvida o trunca parte de la información.
¿Quieres entender cómo la IA usa todo esto para responder y recomendar marcas? Empieza por la guía sobre cómo funciona la inteligencia artificial y descubre qué es el GEO para posicionar tu negocio en las respuestas de los asistentes.
Última actualización: junio de 2026. Esta guía forma parte de nuestro contenido sobre cómo funciona la IA y se revisa periódicamente conforme evolucionan los modelos de lenguaje.