Les termes essentiels de l'IA de LA BIBLE DE L'IA – classés alphabétiquement et expliqués de manière concise. Explications approfondies, exemples pratiques et listes de contrôle dans le livre.
Standard ouvert de communication développé par Google en collaboration avec la Linux Foundation et présenté lors de Google Cloud Next en 2025. Il permet à des agents d'IA de différents fournisseurs d'interagir entre eux et de déléguer des tâches sans interfaces propriétaires. Complémentaire au MCP.
Réentraînement d'un modèle de base préentraîné sur un jeu de données plus petit et spécifique à un domaine afin d'améliorer sa performance pour une tâche donnée. Plus économe en ressources que le préentraînement à partir de zéro.
Système d'IA qui perçoit, planifie et agit de façon autonome en utilisant des outils pour atteindre par lui-même un objectif fixé, souvent sans guidage humain continu.
Forme hypothétique d'IA dotée de capacités intellectuelles égales ou supérieures à celles de l'humain dans tous les domaines. Non réalisée à ce jour. Les principaux chercheurs en IA sont profondément divisés sur le moment où elle pourrait être atteinte.
Règlement (UE) 2024/1689 : la première loi complète au monde régulant les systèmes d'IA. Entré en vigueur le 1er août 2024. Son instrument central : l'approche fondée sur le risque avec quatre niveaux de risque.
Résumés de réponse directe générés par l'IA que les moteurs de recherche (comme Google) affichent au-dessus des classiques liens bleus. Aspect central de la nouvelle réalité de la recherche dans le domaine du GEO.
Proposition de directive de l'UE sur la responsabilité spécifique à l'IA, avec des allégements de la charge de la preuve. La Commission européenne a retiré la proposition de son programme de travail le 11 février 2025 ; la responsabilité en matière d'IA est depuis couverte principalement par la nouvelle directive sur la responsabilité du fait des produits (PLD 2024/2853).
Analyse de risque obligatoire au titre de l'art. 35 du RGPD pour les systèmes d'IA susceptibles de présenter un risque élevé pour les droits et libertés des personnes concernées. Étroitement liée à la gestion des risques du Règlement européen sur l'IA.
L'alignement d'un système d'IA sur les valeurs, les intentions et les objectifs humains. Le problème de l'alignement — comment garantir qu'un système d'IA fasse ce que les humains veulent vraiment ? — est le défi ouvert central de la recherche sur la sécurité de l'IA.
IA faible ou étroite : des systèmes spécialisés dans des tâches spécifiques. Tous les systèmes d'IA existant aujourd'hui, y compris ChatGPT, Claude et Gemini, relèvent de cette catégorie.
Interface de programmation par laquelle les développeurs peuvent intégrer des modèles d'IA dans leurs propres applications. Tous les grands fournisseurs d'IA mettent leurs modèles à disposition via des API (p. ex. l'API OpenAI, l'API Anthropic).
Capacité des LLM à apprendre à partir d'exemples figurant dans le prompt sans ajuster les poids du modèle. Permet le prompting few-shot et zero-shot.
Approche dans laquelle un modèle préentraîné sur une grande quantité de données générales est réentraîné sur une quantité de données plus petite et spécifique à un domaine (affinage). Fondement de pratiquement tous les LLM modernes.
Sous-domaine de l'apprentissage automatique reposant sur des réseaux de neurones profonds à nombreuses couches. Fondement de la plupart des systèmes d'IA modernes, rendu possible par les lois d'échelle.
Technique de prompting avancée dans laquelle le modèle suit en parallèle plusieurs approches de solution différentes, les évalue et sélectionne la meilleure.
Principe de sécurité qui ne suppose aucune confiance implicite pour les systèmes ou agents d'IA. Chaque action d'un agent d'IA doit être explicitement autorisée.
Stade hypothétique de l'IA qui dépasse de loin l'intelligence humaine dans presque tous les domaines. Actuellement de la science-fiction.
Manipulation ciblée des entrées d'un système d'IA afin de provoquer des résultats erronés. Exemple : des modifications minimes, invisibles pour l'humain, apportées à une image amènent un système de reconnaissance d'images à classer un panneau stop comme une limitation de vitesse.
Le mécanisme central de l'architecture Transformer. Il calcule l'intensité avec laquelle chaque élément d'une entrée doit « prêter attention » à chaque autre. Il permet de comprendre les relations de contexte sur de grandes quantités de texte.
Réseau de neurones entraîné à transformer son entrée en une représentation compressée et à reconstruire l'entrée à partir de celle-ci. Ses variantes (VAE, autoencodeur variationnel) servent à l'IA générative.
Base de données spécialisée dans le stockage et l'interrogation efficaces d'embeddings (vecteurs). Composant central des systèmes RAG. Exemples connus : Pinecone, Weaviate, Chroma.
Test standardisé permettant de mesurer la performance des modèles d'IA dans des conditions définies. Benchmarks connus : MMLU (connaissances générales), HumanEval (code), GPQA (connaissances d'expert au niveau doctorat).
Distorsion systématique dans les résultats d'un système d'IA qui désavantage certains groupes. Il peut provenir des données (biais de données), des annotations (biais d'étiquetage), de la sous-représentation (biais de représentation) ou de boucles de rétroaction qui s'auto-renforcent (biais de boucle de rétroaction).
Collection structurée de prompts éprouvés et réutilisables pour diverses tâches. Élément fixe d'une utilisation professionnelle de l'IA en entreprise.
Désignation des systèmes d'IA dont les processus de décision internes ne sont pas compréhensibles pour l'humain. Les réseaux de neurones profonds sont des systèmes en boîte noire typiques. À l'opposé : l'IA explicable (XAI).
L'utilisation d'outils et de comptes d'IA privés à des fins professionnelles. L'une des principales sources d'IA fantôme et de violations de la protection des données dans les entreprises.
Standard pour le marquage cryptographique des contenus numériques avec des informations de provenance. Il permet de retracer si un contenu a été créé par des humains ou par une IA. Développé par Adobe, Microsoft, Intel et d'autres.
Modèle systématique pour la création de prompts de grande qualité. L'acronyme anglais signifie : Context (contexte), Role (rôle), Action (action), Format, Tone (ton).
Capacités non observables dans les petits modèles, mais qui apparaissent soudainement à partir d'une certaine taille de modèle ou profondeur d'entraînement. Exemples : multilinguisme, raisonnement logique, apprentissage en contexte.
Technique de prompting dans laquelle on demande au modèle d'exposer son raisonnement étape par étape avant de donner une réponse. Elle améliore considérablement la qualité des résultats sur les tâches complexes.
Famille de modèles de langage d'IA de l'entreprise Anthropic. Au Q1/2026, elle comprend Claude Opus (axé sur le raisonnement) et Claude Sonnet (équilibré). Réputée pour sa grande fenêtre de contexte (jusqu'à 1 million de tokens) et pour l'IA constitutionnelle comme approche de sécurité.
Réseau de neurones spécialisé dans le traitement de données structurées spatialement, en particulier les images. Le regard filtré sur des sous-régions (l'opération de convolution) rend les CNN particulièrement efficaces pour la reconnaissance d'images.
Capacité d'un agent d'IA à utiliser de façon autonome un bureau d'ordinateur : déplacer la souris, cliquer, taper, faire défiler. Introduite par Anthropic pour Claude, elle permet des flux de travail de bureau entièrement automatiques.
La capacité à comprendre les systèmes d'IA, à les évaluer de manière critique et à les utiliser de façon responsable. Obligation légale pour les entreprises selon l'art. 4 du Règlement européen sur l'IA depuis février 2025.
Concept exigeant qu'un humain conserve à tout moment le contrôle effectif sur les décisions critiques de l'IA, particulièrement pertinent pour les systèmes d'armes autonomes et l'IA à haut risque.
Image, audio ou vidéo généré ou manipulé par l'IA montrant une personne dans une situation qui n'a jamais eu lieu. Né de la contraction de « deep learning » et de « fake ». Soumis à des obligations de marquage dans le Règlement européen sur l'IA.
Entreprise chinoise d'IA (DeepSeek-V3, publié le 26 décembre 2024 ; DeepSeek-R1, publié le 20 janvier 2025) qui, avec le modèle de raisonnement R1, a atteint une performance de pointe pour une fraction des coûts d'entraînement de ses concurrents occidentaux. Elle a déclenché un débat international sur l'efficience des coûts dans l'entraînement de l'IA.
Paquet législatif de l'UE proposé par la Commission européenne le 19 novembre 2025 ; il vise notamment à reporter à décembre 2027 les délais pour les systèmes d'IA à haut risque (annexe III) et à instaurer un point de signalement unique pour les entreprises (négociations en trilogue en cours depuis mars 2026).
Technologies qui empêchent les données confidentielles de quitter le réseau de l'entreprise. Dans le contexte de l'IA, utilisées pour empêcher la saisie de données sensibles dans des outils d'IA publics.
Procédé d'entraînement introduit en 2023 par Rafailov et al. (Stanford) comme alternative plus simple au RLHF. Au lieu d'entraîner un modèle de récompense séparé, le DPO optimise le modèle de langage directement à partir de paires de préférences (sorties préférées vs rejetées). Il réduit considérablement la complexité et l'instabilité du processus de RLHF.
La mise à disposition d'un modèle d'IA entraîné dans un environnement de production où il peut être utilisé par les utilisateurs finaux. Les décisions de déploiement sont très pertinentes pour le Règlement européen sur l'IA.
Évolution des propriétés statistiques des données d'entrée au fil du temps, qui peut entraîner une perte de précision d'un modèle d'IA. Elle nécessite une surveillance continue dans les systèmes en production.
Exécution de modèles d'IA directement sur les appareils finaux (smartphones, capteurs IoT, machines industrielles) plutôt que dans le cloud. Avantages : latence réduite, meilleure protection des données, capacité hors ligne.
Représentation numérique de texte, d'images ou d'autres données sous forme de vecteurs dans un espace à grandes dimensions. Les contenus sémantiquement similaires sont proches les uns des autres. Fondement des bases de données vectorielles et de la recherche sémantique.
Attaque contre les systèmes d'IA dans laquelle les données d'entraînement sont manipulées délibérément afin d'orienter le modèle dans une direction souhaitée ou de le corrompre entièrement.
La lisibilité par machine des contenus pour les robots d'exploration et les analyseurs d'IA. Une métrique centrale du GEO qui mesure la facilité avec laquelle un modèle peut extraire d'une page web des faits structurés, des entités et des relations (p. ex. grâce au rendu côté serveur et à une structure HTML claire).
Composante stratégique du GEO. La construction ciblée de la visibilité IA et de l'« AI availability » en plaçant des marques ou des produits dans les sources tierces primaires (Reddit, Wikipédia, médias spécialisés) que les modèles pondèrent le plus lors de l'entraînement sur données ou de la récupération.
La quantité maximale de texte (en tokens) qu'un modèle de langage peut traiter à la fois. Les modèles de pointe actuels ont des fenêtres de contexte de 128 000 à 2 000 000 de tokens.
Technique de prompting dans laquelle on fournit au modèle un ou plusieurs exemples de la sortie souhaitée avant de poser la tâche proprement dite.
Marquage invisible ou visible dans les contenus générés par l'IA (texte, image, audio) qui rend démontrable une origine automatique. Techniquement apparenté au C2PA. Prévu dans le Règlement européen sur l'IA comme mesure de transparence pour les contenus synthétiques.
Mécanisme par lequel un modèle de langage appelle des outils, des API et des bases de données externes. Condition centrale du fonctionnement des agents d'IA.
Modèle génératif composé de deux réseaux de neurones concurrents : le générateur (crée des données synthétiques) et le discriminateur (distingue les données réelles des données générées). Introduit en 2014 par Ian Goodfellow.
Famille de modèles d'IA de Google DeepMind. Au Q1/2026, elle comprend Gemini Pro (pointe), Gemini Flash (rapide et économique) et Gemma 4 (variante open source). Multimodale nativement.
Discipline stratégique d'optimisation des contenus afin qu'ils soient cités comme source préférée et reproduits plus en détail par les applications d'IA générative, les moteurs de recherche (AI Overviews) et les chatbots. Elle associe le SEO à l'extractabilité, au fame engineering et à l'optimisation des entités.
Principe fondamental : la qualité de la sortie d'un système d'IA dépend directement de la qualité de ses entrées (données d'entraînement et prompts). Vaut à la fois pour l'entraînement des modèles et pour le prompting quotidien.
Modèle d'IA à usage général pouvant être employé pour un large éventail de tâches. Les modèles GPT actuels, Claude Sonnet, Gemini Pro et Llama relèvent de cette catégorie. Soumis à des règles propres dans le Règlement sur l'IA (art. 51–56).
Processeur spécialisé, développé à l'origine pour les graphismes informatiques, qui, grâce à son architecture de calcul massivement parallèle, est particulièrement efficace pour l'entraînement et l'inférence des réseaux de neurones. Les H100 et H200 de NVIDIA sont les standards de l'industrie en 2026.
Base de connaissances structurée qui représente des entités (personnes, lieux, concepts) et leurs relations sous forme de graphe. Peut être combinée à des systèmes RAG pour améliorer les réponses de l'IA.
Mise en relation des sorties d'un modèle d'IA avec des sources de données vérifiées et à jour. Réduit les hallucinations en fondant les réponses du modèle sur des documents de référence concrets.
Situation dans laquelle un modèle de langage produit des sorties qui semblent plausibles mais sont factuellement fausses. Elle survient parce que les modèles sont optimisés pour la plausibilité statistique, et non pour la vérité. Les modèles de pointe actuels hallucinent sur 5 à 15 % des questions factuelles selon le domaine.
Conception de système dans laquelle un humain est intégré au processus de décision et conserve le contrôle final. Obligatoire pour les systèmes d'IA à haut risque selon l'art. 14 du Règlement européen sur l'IA.
Conception de système dans laquelle l'IA décide de façon autonome, mais un superviseur humain peut intervenir et l'arrêter à tout moment. Position intermédiaire entre l'IA entièrement autonome et le human-in-the-loop.
Paramètre de configuration d'un modèle d'IA fixé avant l'entraînement (p. ex. taux d'apprentissage, nombre de couches, taille de lot). Ajusté non pas par le processus d'apprentissage lui-même, mais par le développeur.
Approche développée par Anthropic visant à aligner les modèles d'IA au moyen de principes explicitement définis (une « constitution »). Au lieu d'utiliser uniquement le retour humain, le modèle évalue ses propres sorties à l'aune de ces principes.
L'utilisation non autorisée d'outils d'IA par les employés en dehors de l'infrastructure de l'entreprise contrôlée par le service informatique. Elle présente des risques considérables en matière de protection des données et de conformité. Selon une étude de Microsoft de 2024, 78 % des utilisateurs d'IA en entreprise emploient des comptes d'IA privés pour des tâches professionnelles.
Systèmes d'IA exploités dans son propre centre de données ou sur ses propres serveurs, plutôt que sur une infrastructure cloud. Offre un contrôle maximal des données, mais nécessite sa propre infrastructure informatique.
Densité factuelle ; la mesure des entités ou concepts nouveaux, denses et vérifiables qui apparaissent dans un document par rapport à la norme contextuelle. Considéré comme un facteur décisif de classement ou de sélection pour les systèmes qui synthétisent des sources.
Le processus par lequel un modèle d'IA entraîné est appliqué à de nouvelles entrées et produit des sorties. Contrairement à l'entraînement, l'inférence est requise à chaque utilisation du modèle.
Processus de sélection, de transformation et de création manuelles de caractéristiques (features) à partir de données brutes afin d'améliorer la performance des modèles de ML. Avec les modèles modernes d'apprentissage profond, il est largement remplacé par l'apprentissage automatique.
Attaque de sécurité dans laquelle des instructions cachées sont insérées dans une entrée utilisateur ou un document externe afin de manipuler le comportement d'un système d'IA. Particulièrement dangereuse avec les agents d'IA.
Concept dans lequel l'IA n'est pas comprise comme un remplacement de l'humain, mais comme un amplificateur des capacités humaines. Il met l'accent sur la collaboration entre l'humain et la machine.
Norme internationale pour les systèmes de management de l'IA (AIMS), adoptée fin 2023. Elle définit les exigences pour le développement, le déploiement et la surveillance responsables des systèmes d'IA dans les organisations. Elle s'harmonise avec le Règlement européen sur l'IA.
Loi nationale allemande d'application du Règlement européen sur l'IA, par laquelle l'Allemagne fixe les compétences des autorités nationales de surveillance du marché (principalement l'Agence fédérale des réseaux) pour le Règlement sur l'IA. En préparation au Q1/2026.
Système central de stockage de données qui conserve de grandes quantités de données brutes structurées et non structurées sous leur forme d'origine. Point de départ de nombreux jeux de données d'entraînement d'IA.
Systèmes d'armes pilotés par IA capables d'identifier, de sélectionner et d'attaquer des cibles de façon autonome, sans qu'un humain prenne la décision finale. Objet de débats internationaux intenses ; aucune interdiction contraignante n'existe en 2026.
Compétence pour comprendre l'IA et travailler avec elle. Inscrite comme obligation légale pour les entreprises dans le Règlement européen sur l'IA (art. 4) : elles doivent garantir que leur personnel dispose d'une compétence suffisante en IA.
Famille de modèles d'IA open source de Meta AI. Au Q1/2026, Llama est disponible. Il permet l'exécution locale et l'affinage sans dépendre d'API propriétaires dans le cloud.
Grand modèle de langage comptant des milliards à des billions de paramètres, entraîné sur d'immenses corpus de texte. Exemples : les modèles GPT actuels, Claude Sonnet, Gemini Pro, Llama.
Application de bureau conviviale pour Windows, Mac et Linux qui permet de télécharger facilement et d'exécuter localement des modèles d'IA open source sans connaissances en programmation.
Régularités démontrées empiriquement selon lesquelles la performance des LLM évolue de façon prévisible et continue avec la taille du modèle, la quantité de données et la puissance de calcul. Fondement des décisions d'investissement des grandes entreprises d'IA.
Variante spéciale de RNN dotée de portes pour la mémorisation et l'oubli sélectifs d'informations. Elle a dominé le traitement du langage avant l'ère des Transformer ; largement remplacée dans les LLM modernes.
Protocole publié par Anthropic en 2024 comme standard ouvert pour la connexion standardisée des modèles d'IA à des outils, sources de données et services externes. Comparable à un standard USB pour les intégrations d'IA.
Entreprise française d'IA qui développe de puissants modèles open source (Mistral 7B, Mixtral) et l'assistant d'IA « Le Chat ». Pionnière du développement européen de l'IA, axée sur la protection des données selon les standards de l'UE.
Architecture de modèle dotée de nombreux sous-réseaux spécialisés (experts), dont seule une fraction est activée par entrée. Elle permet des modèles globaux très grands avec une inférence efficace. GPT-4 et Mixtral reposent sur ce principe.
Ensemble de pratiques, de processus et d'outils pour l'opérationnalisation des modèles d'apprentissage automatique en entreprise. Couvre toute la chaîne, du développement du modèle à l'entraînement et aux tests, jusqu'au déploiement, à la surveillance et au réentraînement en environnement de production. Analogue au DevOps dans le développement logiciel classique.
Benchmark important pour mesurer les connaissances générales des modèles d'IA sur 57 domaines, des mathématiques au droit.
Modèle génératif qui apprend à « débruiter » progressivement une image bruitée et à générer ainsi de nouvelles images de grande qualité à partir du bruit. Fondement de Midjourney, Stable Diffusion et de la série GPT-Image (anciennement DALL-E 3).
Synonyme de modèle de base : un grand modèle d'IA préentraîné qui sert de fondement à de nombreuses applications en aval différentes. Les modèles GPT actuels, Claude Sonnet et Gemini Pro sont des modèles de fondation.
Modèle d'IA qui, avant de répondre, suit un processus de raisonnement interne en plusieurs étapes (Système 2). Exemples : les modèles de raisonnement (Thinking) d'OpenAI, Claude Opus. Particulièrement efficace en mathématiques, en logique et dans les analyses complexes.
Cadre de classification du développement de l'IA selon le degré d'autonomie. Niveau 0 : logiciel à base de règles (pas d'apprentissage, pas de Règlement sur l'IA). Niveau 1 : chatbots (systèmes passifs de questions-réponses). Niveau 2 : modèles de raisonnement (IA qui pense et planifie). Niveau 3 : agents autonomes (IA agissant d'elle-même). Niveau 4 : IA innovatrice/AGI (IA chercheuse qui crée du nouveau). Niveau 5 : IA organisationnelle/ASI (superintelligence dirigeant des organisations, hypothétique).
Systèmes d'IA capables de traiter et de générer simultanément différents types de données (texte, image, audio, vidéo, code). Gemini Pro et les modèles GPT actuels sont multimodaux nativement.
Technique dans laquelle le modèle d'IA est utilisé pour générer de meilleurs prompts. Le modèle aide à améliorer la qualité de sa propre entrée.
L'évaluation des personnes en fonction de leur comportement social ou de caractéristiques personnelles par des systèmes d'IA. Interdite par le Règlement européen sur l'IA depuis février 2025 (art. 5).
Outil en ligne de commande open source pour la gestion et l'exécution locales de modèles d'IA. Apprécié des développeurs pour l'intégration de modèles locaux dans leurs propres applications.
Désignation collective du système d'agents d'IA d'OpenAI, qui navigue de façon autonome dans les navigateurs web, remplit des formulaires et peut effectuer des réservations. Le service initial « Operator » (janvier 2025) a été arrêté le 31 août 2025 et fusionné dans le « ChatGPT Agent », disponible depuis juillet 2025.
Les poids internes d'un réseau de neurones, ajustés pendant l'entraînement par rétropropagation. Les grands modèles comptent des milliards à des billions de paramètres. Le nombre de paramètres est une approximation (incomplète) de la complexité du modèle.
Mécanisme présent dans Claude Opus et des modèles de raisonnement comparables, où le modèle « réfléchit » explicitement avant de répondre ; le processus de raisonnement interne est en partie visible pour l'utilisateur.
Terme de la linguiste Emily Bender pour les LLM : des systèmes qui imitent de manière très complexe les motifs linguistiques des données d'entraînement sans comprendre les significations sous-jacentes.
Directive européenne révisée sur la responsabilité du fait des produits (2024/2853) qui, depuis octobre 2024, inclut expressément les logiciels et les systèmes d'IA en tant que produits et les soumet ainsi à la responsabilité du fait des produits sans faute.
L'entrée (instruction, question, contexte, exemples) qu'un utilisateur fournit à un système d'IA pour générer une sortie.
La conception systématique de prompts afin de guider les systèmes d'IA vers des résultats optimaux. Comprend des techniques comme CRAFT, la chaîne de pensée, le few-shot et le métaprompting.
Instruction préalable invisible qui définit le comportement de base, la personnalité et les limites d'un système d'IA. Utilisée par les entreprises pour personnaliser les applications d'IA.
Technique de réduction de l'empreinte mémoire d'un modèle par la représentation des poids avec une précision numérique plus faible (p. ex. 4 bits au lieu de 32 bits). Elle permet l'exécution locale de grands modèles sur du matériel grand public.
Architecture dans laquelle, avant de générer une réponse, un modèle de langage récupère des informations pertinentes dans une base de connaissances externe et à jour, puis les intègre à la réponse. Réduit considérablement les hallucinations sur les tâches factuelles.
Simulation d'attaque systématique dans laquelle une équipe tente délibérément de manipuler ou de corrompre un système d'IA. Obligatoire dans le Règlement européen sur l'IA pour les modèles GPAI présentant un risque systémique.
Règlement européen (UE) 2016/679 sur la protection des données à caractère personnel, qui s'applique aussi au traitement par les systèmes d'IA. Le RGPD et le Règlement européen sur l'IA se complètent et se recoupent largement.
Procédé d'entraînement dans lequel les évaluations humaines des réponses de l'IA servent de signal de récompense au modèle afin de l'aligner sur les préférences humaines.
Type de réseau de neurones doté de connexions de rétroaction qui traite des données séquentielles. Largement supplanté par les Transformer.
Modèle de calcul conçu de manière vague comme une analogie du cerveau biologique. Il se compose de couches de nœuds (neurones) et de connexions pondérées. L'apprentissage s'effectue par ajustement des poids.
L'algorithme d'apprentissage fondamental des réseaux de neurones. Il calcule l'erreur de sortie à rebours à travers le réseau et ajuste les poids afin de minimiser l'erreur.
Méthode de l'IA explicable (XAI) qui calcule la contribution de chaque caractéristique d'entrée à la prédiction d'un modèle.
Modèle de langage compact comptant de 1 à 14 milliards de paramètres, optimisé pour des tâches spécifiques et exécutable sur du matériel grand public. Exemples : Phi-4 (Microsoft), Gemma 3 (Google), Llama.
Problème dans lequel un modèle est trop simple et ne saisit pas les motifs sous-jacents des données d'entraînement. L'opposé du surapprentissage.
Problème dans lequel un modèle apprend les données d'entraînement de façon trop précise, y compris leurs erreurs et leurs hasards, et présente de ce fait de mauvaises performances sur des données nouvelles et inconnues.
Distinction empruntée à la psychologie de Daniel Kahneman entre des modèles d'IA rapides et intuitifs (Système 1, p. ex. des modèles GPT plus petits, Claude Sonnet) et des modèles de raisonnement lents et analytiques (Système 2, p. ex. les modèles de raisonnement d'OpenAI, Claude Opus).
Architecture d'IA dans laquelle plusieurs agents d'IA spécialisés coopèrent en parallèle ou de façon séquentielle pour résoudre des tâches complexes qu'un seul agent ne pourrait gérer. Chaque agent assume un rôle clairement défini (p. ex. planificateur, chercheur, codeur, relecteur). Orchestrée par des cadres comme LangGraph, AutoGen ou CrewAI et standardisée par le protocole A2A.
Sous-domaine de l'IA qui s'occupe du traitement et de la compréhension du langage humain. Fondement de tous les modèles de langage.
Analyse automatisée de grandes quantités d'œuvres protégées par le droit d'auteur par des systèmes d'IA. Dans l'UE, elle est régulée par la directive sur le droit d'auteur dans le marché unique numérique (art. 3 et 4) : autorisée tant que le titulaire des droits ne s'y est pas opposé (principe d'opt-out).
Méthode d'évaluation des modèles d'IA ou des prompts dans laquelle deux variantes sont testées simultanément et les résultats comparés. Importante pour l'optimisation systématique des applications d'IA.
Expérience de pensée proposée par Alan Turing en 1950 pour mesurer l'intelligence des machines : dans une conversation écrite, un humain peut-il ne pas distinguer si son interlocuteur est une machine ou un être humain ?
Puissance de calcul supplémentaire utilisée pendant l'inférence (et non pendant l'entraînement) afin d'obtenir de meilleurs résultats. Fondement des modèles de raisonnement.
L'unité de traitement fondamentale du texte dans les modèles de langage. Un token correspond généralement à 3 ou 4 caractères, soit environ trois quarts d'un mot anglais. 1000 tokens correspondent à environ 750 mots.
Algorithme qui découpe le texte en tokens avant qu'il ne soit transmis à un modèle de langage. Différents modèles utilisent différentes stratégies de tokenisation.
Traitement de plusieurs entrées à la fois plutôt qu'une par une. Dans le contexte de l'IA, pertinent pour une inférence efficace et la réduction des coûts lors de l'utilisation d'API.
Architecture de réseau de neurones fondamentale, présentée en 2017 par Vaswani et al. (Google) dans l'article « Attention Is All You Need ». Elle repose sur des mécanismes de self-attention et constitue le fondement de tous les modèles de langage modernes.
Terme désignant le changement de paradigme dans le développement logiciel où les développeurs (ou même les non-programmeurs) décrivent leur intention architecturale en langage naturel au lieu d'écrire le code ligne par ligne. Des outils comme GitHub Copilot Agent Mode, Lovable ou Bolt.new transforment les prompts en applications entièrement déployées. Terme forgé début 2025.
Modèle d'IA capable de traiter simultanément du texte et des images. Permet des tâches comme la description d'images, la réponse visuelle à des questions et l'analyse de documents.
Véhicule autonome selon la classification SAE, avec cinq niveaux d'autonomie. Le niveau 2 (automatisation partielle) est aujourd'hui très répandu ; le niveau 4 (entièrement automatisé sans conducteur) est disponible dans des projets pilotes ; le niveau 5 (entièrement autonome en toutes conditions) reste un objectif de développement.
Méthodes et approches qui rendent les décisions de l'IA compréhensibles et interprétables pour les humains. Méthodes : LIME, SHAP, visualisation de l'attention, chaîne de pensée. Inscrite dans le Règlement européen sur l'IA comme condition pour les systèmes à haut risque.
Technique de prompting dans laquelle aucun exemple n'est fourni au modèle, uniquement la description de la tâche. Le modèle résout la tâche sur la seule base de ses connaissances préalables.
LA BIBLE DE L'IA fournit le contexte complet pour chaque terme : exemples pratiques, listes de contrôle, recommandations et une vue d'ensemble du paysage de l'IA.
Commander