Définition

LLM (Large Language Model)

Un LLM (grand modèle de langage) est un modèle d'IA entraîné sur d'immenses volumes de texte pour comprendre et générer du langage naturel. GPT, Claude ou Gemini sont des LLM : ils alimentent les chatbots, agents IA et outils de génération de contenu.

Par Équipe LYVIA · Experts IA, SEO & GEO Vérifié le 4 juillet 2026

Pourquoi ça compte pour votre PME

Le LLM est le moteur sous le capot de presque tous les outils IA que votre entreprise utilise : ChatGPT et Claude bien sûr, mais aussi les assistants intégrés à votre CRM, les chatbots de support et les agents qui automatisent vos processus. Comprendre ses trois caractéristiques structurantes évite les mauvaises décisions d'achat — et les mauvaises surprises de facturation.

Un : il raisonne en tokens (fragments de mots) facturés à l'usage via API — de 1 $ à 25 $ par million de tokens selon le modèle (tarifs officiels Anthropic, constatés le 4 juillet 2026). Deux : il a une fenêtre de contexte limitée, la quantité de texte qu'il peut considérer d'un coup — de 200 000 tokens à 1 million selon les offres, soit la différence entre analyser un contrat et analyser tout un dossier. Trois : il ne connaît que ses données d'entraînement — vos procédures, tarifs et clients lui sont invisibles, sauf à les lui fournir (RAG) ou à spécialiser le modèle (fine-tuning).

La conséquence pratique : le « meilleur » LLM n'existe pas dans l'absolu, il existe par tâche et par budget. Un modèle rapide et économique trie vos emails aussi bien qu'un modèle premium dix fois plus cher ; l'analyse d'un dossier juridique justifie l'inverse. Router chaque usage vers le bon modèle change la facture d'un facteur 10 à service égal. Notre comparatif ChatGPT vs Claude et nos chiffres de coûts API donnent les ordres de grandeur.

Trois questions suffisent pour cadrer un choix de LLM en PME : quelles données vont transiter (si des données clients circulent, offre business obligatoire, avec garantie contractuelle de non-entraînement) ; quel volume et quel budget (chat par siège pour l'usage humain, API au token pour les automatisations) ; quelle taille de documents à traiter (la fenêtre de contexte doit absorber vos cas réels). Le nom du modèle vient en dernier — et il changera de toute façon dans dix-huit mois.

Concrètement

Accès par chat (abonnement par siège) pour la productivité individuelle ; accès par API (au token) pour les automatisations.
Adaptez le modèle à la tâche : inutile de payer le modèle le plus puissant pour trier des emails.
Offres business obligatoires dès que des données clients circulent (garanties de non-entraînement).
La fenêtre de contexte détermine ce que le modèle peut analyser d'un coup : vérifiez-la pour vos gros documents.

Pour aller plus loin

Vous voulez passer de la définition à l'application dans votre entreprise ? Un expert LYVIA identifie vos opportunités concrètes en 30 minutes.

Prendre rendez-vous gratuitement →

Termes connexes

Machine learningVoir la définition →MCP (Model Context Protocol)Voir la définition →Prompt engineeringVoir la définition →

← Tout le glossaire IA & GEO