Définition

Token

Un token est l'unité de texte élémentaire traitée par un modèle d'IA : un mot court, une partie de mot ou un signe de ponctuation. En français, 1 000 tokens représentent environ 750 mots. Les API d'IA facturent au token, en entrée comme en sortie.

Par Équipe LYVIA · Experts IA, SEO & GEO Vérifié le 4 juillet 2026

Pourquoi ça compte pour votre PME

Le token est l'unité de facturation de toute l'IA par API : chaque mot envoyé au modèle (entrée) et chaque mot généré (sortie) se paie. Les tarifs s'expriment en dollars par million de tokens et l'écart entre modèles est large : de 1 $ en entrée pour les modèles rapides à 25 $ en sortie pour les plus puissants (tarifs officiels Anthropic, constatés le 4 juillet 2026). La sortie coûte systématiquement plus cher que l'entrée — un détail qui change les calculs dès qu'on génère du texte long.

Comprendre cette mécanique évite deux erreurs symétriques. Surestimer le coût : une automatisation PME classique — trier et résumer 1 000 emails par mois — consomme quelques millions de tokens, soit quelques dizaines d'euros mensuels ; l'API n'est presque jamais le poste dominant d'un projet. Sous-estimer la dérive : un agent mal conçu qui relit tout l'historique de conversation à chaque appel, ou qui utilise le modèle premium pour des tâches triviales, peut multiplier la facture par 100 sans améliorer le résultat. La discipline coûte trois réflexes : contexte minimal, bon modèle par tâche, suivi de consommation dès le premier jour.

Le token définit aussi la fenêtre de contexte : la quantité maximale de texte que le modèle considère d'un coup. Ordre de grandeur utile : un contrat de 100 pages représente environ 65 000 tokens — vérifiez que le modèle choisi les absorbe avant de promettre l'analyse de dossiers complets. Tous les tarifs à jour sont dans nos chiffres coûts de l'automatisation IA.

Pour estimer un budget avant de lancer un projet, la méthode en trois lignes : volume mensuel de textes à traiter × longueur moyenne en mots ÷ 0,75 = tokens d'entrée ; estimez la sortie (souvent 10 à 30 % de l'entrée pour du tri ou du résumé, davantage pour de la rédaction) ; multipliez par le tarif du modèle pressenti. Ajoutez une marge de 50 % pour les itérations et les reprises. Si le total mensuel dépasse le coût humain de la tâche, le périmètre ou le modèle sont mal choisis.

Concrètement

Ordre de grandeur : 1 000 emails triés et résumés par mois ≈ quelques millions de tokens ≈ quelques dizaines d'euros.
Optimisez les entrées : n'envoyez au modèle que le contexte utile, pas l'historique complet.
Choisissez le modèle par tâche : un modèle économique pour le volume, un modèle puissant pour l'analyse.
Suivez la consommation dès le premier jour : les tableaux de bord API évitent les surprises.

Pour aller plus loin

Vous voulez passer de la définition à l'application dans votre entreprise ? Un expert LYVIA identifie vos opportunités concrètes en 30 minutes.

Prendre rendez-vous gratuitement →

Termes connexes

Workflow (automatisation)Voir la définition →Agent IAVoir la définition →AI OverviewsVoir la définition →

← Tout le glossaire IA & GEO