Définition

Token

Un token est l'unité de texte élémentaire traitée par un modèle d'IA : un mot court, une partie de mot ou un signe de ponctuation. En français, 1 000 tokens représentent environ 750 mots. Les API d'IA facturent au token, en entrée comme en sortie.

Pourquoi ça compte pour votre PME

Le token est l'unité de facturation de toute l'IA par API : chaque mot envoyé au modèle (entrée) et chaque mot généré (sortie) se paie. Les tarifs s'expriment en dollars par million de tokens et l'écart entre modèles est large : de 1 $ en entrée pour les modèles rapides à 25 $ en sortie pour les plus puissants (tarifs officiels Anthropic, constatés le 4 juillet 2026). La sortie coûte systématiquement plus cher que l'entrée — un détail qui change les calculs dès qu'on génère du texte long.

Comprendre cette mécanique évite deux erreurs symétriques. Surestimer le coût : une automatisation PME classique — trier et résumer 1 000 emails par mois — consomme quelques millions de tokens, soit quelques dizaines d'euros mensuels ; l'API n'est presque jamais le poste dominant d'un projet. Sous-estimer la dérive : un agent mal conçu qui relit tout l'historique de conversation à chaque appel, ou qui utilise le modèle premium pour des tâches triviales, peut multiplier la facture par 100 sans améliorer le résultat. La discipline coûte trois réflexes : contexte minimal, bon modèle par tâche, suivi de consommation dès le premier jour.

Le token définit aussi la fenêtre de contexte : la quantité maximale de texte que le modèle considère d'un coup. Ordre de grandeur utile : un contrat de 100 pages représente environ 65 000 tokens — vérifiez que le modèle choisi les absorbe avant de promettre l'analyse de dossiers complets. Tous les tarifs à jour sont dans nos chiffres coûts de l'automatisation IA.

Pour estimer un budget avant de lancer un projet, la méthode en trois lignes : volume mensuel de textes à traiter × longueur moyenne en mots ÷ 0,75 = tokens d'entrée ; estimez la sortie (souvent 10 à 30 % de l'entrée pour du tri ou du résumé, davantage pour de la rédaction) ; multipliez par le tarif du modèle pressenti. Ajoutez une marge de 50 % pour les itérations et les reprises. Si le total mensuel dépasse le coût humain de la tâche, le périmètre ou le modèle sont mal choisis.

Concrètement

  • Ordre de grandeur : 1 000 emails triés et résumés par mois ≈ quelques millions de tokens ≈ quelques dizaines d'euros.
  • Optimisez les entrées : n'envoyez au modèle que le contexte utile, pas l'historique complet.
  • Choisissez le modèle par tâche : un modèle économique pour le volume, un modèle puissant pour l'analyse.
  • Suivez la consommation dès le premier jour : les tableaux de bord API évitent les surprises.

Pour aller plus loin

Vous voulez passer de la définition à l'application dans votre entreprise ? Un expert LYVIA identifie vos opportunités concrètes en 30 minutes.

Prendre rendez-vous gratuitement →