Exploration des capacités de l’IA générative

Objectifs de formation

Une fois cette unité terminée, vous pourrez :

Décrire les qualités des modèles d’IA générative par rapport à celles d’autres modèles
Définir les termes clés associés aux modèles de langage d’IA
Décrire les capacités des IA génératives ayant recours à des modèles de langage

L’intelligence artificielle, objet de toutes les attentions

Vous avez peut-être constaté qu’il y a un nombre presque assommant de discussions sur l’intelligence artificielle (IA) ces derniers temps. Quelles sont les raisons derrière ce vif engouement ? L’IA n’est pas vraiment nouvelle ; de nombreuses entreprises et institutions y ont recours d’une façon ou d’une autre depuis des années. L’attention soudaine portée à l’IA est sans doute due à un outil appelé ChatGPT, un agent conversationnel fondé sur l’IA qui fait ce qu’aucune autre solution ne peut faire.

ChatGPT peut répondre à des questions ou à des demandes formulées en langage courant, et les réponses qu’il donne semblent avoir été écrites par un être humain. Étant donné qu’il a été rendu accessible au grand public, ses utilisateurs ont pu découvrir par eux-mêmes ce que c’était que d’avoir une conversation avec un ordinateur. C’était surprenant. C’était étrange. C’était inspirant. Il n’est donc pas étonnant que de plus en plus de personnes se soient mises à s’intéresser à la question !

Un robot heureux assis sur une chaise devant un bureau. Un ordinateur portable se trouve sur le bureau. L’illustration reprend le style des illustrations vectorielles en 2D.

[Image générée par l’IA à l’aide de DreamStudio sur stability.ai avec la réplique suivante : « Un robot heureux assis sur une chaise devant un bureau. Un ordinateur portable se trouve sur le bureau. L’illustration reprend le style des illustrations vectorielles en 2D. »]

Une IA qui peut tenir une conversation naturelle à la manière d’un être humain se démarque clairement des technologies du passé. Comme vous l’apprenez dans le badge Principes fondamentaux de l’intelligence artificielle, il y a beaucoup de tâches spécifiques pour lesquelles les modèles d’IA sont entraînés. Par exemple, un modèle d’IA peut être entraîné pour utiliser les données du marché immobilier afin de prédire le prix de vente optimal d’une maison comportant trois chambres. Cela est certes impressionnant, mais ce modèle génère « seulement » un chiffre. En revanche, certains modèles d’IA peuvent générer une grande variété de textes, d’images et de sons que nous n’avons jamais lus, vus ou entendus auparavant. Ce type d’IA est connu sous le nom d’IA générative. Il présente un énorme potentiel d’évolution, tant au sein des milieux professionnels qu’en dehors de ceux-ci.

Dans ce badge, vous découvrirez quels types de tâches les modèles d’IA générative sont entraînés à réaliser, ainsi que certaines des technologies employées pour procéder à cet entraînement. Ce badge s’intéresse également à la manière dont les entreprises se regroupent autour de domaines de spécialité dans l’écosystème de l’IA générative. Enfin, nous terminerons en évoquant certaines des préoccupations des entreprises en ce qui concerne l’IA générative.

Possibilités offertes par les modèles de langage

L’IA générative peut sembler être une nouveauté, mais en réalité, les chercheurs entraînent des modèles d’IA générative depuis des décennies. Certains ont même fait parler d’eux ces dernières années. Peut-être vous souvenez-vous d’articles datant de 2018 à propos d’une société nommée Nvidia qui avait dévoilé un modèle d’IA capable de générer des images photoréalistes aléatoires de visages humains. Les clichés présentés étaient étonnamment convaincants. Même s’ils n’étaient pas parfaits, ils ont permis d’ouvrir le débat sur cette thématique. L’IA générative commençait alors lentement à attirer l’attention du public.

Tandis que des chercheurs travaillaient sur une IA capable de créer des types d’images spécifiques, d’autres se concentraient sur des IA liées au langage. Ils entraînaient des modèles d’IA de sorte que ceux-ci puissent effectuer toutes sortes de tâches impliquant l’interprétation de texte. Par exemple, il se peut que vous souhaitiez classer les avis émis au sujet de l’un de vos produits selon qu’ils sont positifs, négatifs ou neutres. Il s’agit d’une tâche qui nécessite de comprendre comment les mots sont combinés dans leur usage quotidien, et c’est un excellent exemple de ce que les experts appellent le traitement en langage naturel (NLP). Étant donné qu’il existe de nombreuses façons de « traiter » le langage, le NLP fait référence à une vaste catégorie d’usages de l’IA. (Pour en savoir plus sur le NLP, reportez-vous au module Concepts de base du traitement en langage naturel.)

Certaines des IA qui exécutent des tâches de NLP sont entraînées avec d’énormes quantités de données, qui sont, en l’occurrence, des échantillons de textes écrits par des personnes réelles. Internet, avec ses milliards de pages Web, est une excellente source d’échantillons de données. Ces modèles d’IA sont entrainés avec des volumes de données si conséquents qu’ils sont connus sous le nom de grands modèles de langage (LLM). Les LLM assimilent de manière extrêmement détaillée les règles linguistiques que les locuteurs humains mettent des années à apprendre. Ces grands modèles de langage permettent d’effectuer des tâches de nature linguistique extrêmement sophistiquées.

Synthèse

si l’on vous présente une phrase et que vous comprenez comment tous ses mots s’articulent pour transmettre une idée, vous pouvez probablement reformuler la phrase de manière à exprimer la même pensée. Étant donné que les modèles d’IA connaissent les règles de syntaxe et qu’ils ont appris quels mots peuvent être remplacés par d’autres, ils peuvent également effectuer ce type de reformulation. Le fait d’analyser un paragraphe entier et de le condenser en une ou deux phrases n’est qu’un autre type de reformulation. De telles capacités de synthèse assistée par l’IA peuvent s’avérer très utiles dans le monde réel. Elles peuvent permettre de générer des notes de réunion à partir d’un enregistrement d’une durée d’une heure, ou encore d’écrire un résumé d’un article scientifique. En outre, il s’agit de l’outil idéal pour élaborer des argumentaires éclair.

Traduction

les LLM sont semblables à un ensemble de règles indiquant la manière dont une langue structure les mots en idées. Chaque langue a ses propres règles. En français, on place généralement les noms avant les adjectifs, mais en anglais, c’est habituellement l’inverse. Les outils de traduction s’appuyant sur l’IA sont entraînés de manière à apprendre ces deux ensembles de règles. Ainsi, lorsqu’il est temps de remanier une phrase, l’IA peut utiliser un deuxième ensemble de règles pour exprimer la même idée. Vous obtenez alors une traduction de qualité. Par ailleurs, les langages de programmation sont, comme leur nom l’indique, eux aussi des langages. Comme ils disposent de leur propre ensemble de règles, l’IA peut traduire un ensemble d’instructions générales en code véritable. Avec un tel programmeur de poche personnel à la disposition de tous, le champ des possibles s’ouvre considérablement.

Correction d’erreurs

même les rédacteurs les plus expérimentés font parfois des fautes de grammaire ou d’orthographe. Désormais, l’IA détectera (et parfois corrigera automatiquement) tout élément problématique. De plus, la correction d’erreurs s’avère également utile dans des contextes où vous écoutez quelqu’un parler. Vous pouvez parfois ne pas bien comprendre un mot ou deux parce que vous êtes dans un environnement bruyant, mais vous vous appuyez sur le contexte pour les deviner. L’IA peut faire de même, ce qui rend les tâches de reconnaissance vocale telles que le sous-titrage encore plus précises.

Formulation de réponses à des questions

il s’agit de la tâche qui a propulsé l’IA générative sous les feux de la rampe. Les IA telles que ChatGPT sont capables d’interpréter l’intention derrière une question ou une demande. Ensuite, elles peuvent générer une grande quantité de texte en fonction de la demande. Par exemple, vous pourriez leur demander un résumé en une phrase des trois œuvres les plus populaires de William Shakespeare, et vous obtiendriez les énoncés suivants :

« Roméo et Juliette » : l’histoire tragique de deux jeunes amants issus de familles rivales dont l’amour conduit finalement à leur mort prématurée.

« Hamlet » : l’histoire d’un prince hanté par le fantôme de son père, aux prises avec la vengeance et les questions existentielles de la vie et de la mort.

« Macbeth » : un drame terrifiant sur l’ambition et la déchéance morale mettant en scène un noble qui, poussé par la convoitise de sa femme, se livre à une série de meurtres sanglants pour accéder au trône.

Ensuite, vous pourriez poursuivre la conversation en demandant plus d’informations sur Hamlet, comme si vous parliez avec votre professeur de littérature. Ce type d’interaction est un excellent exemple de la manière dont il est possible d’obtenir des informations en temps opportun grâce à une simple demande.

Génération d’images guidée

les LLM peuvent être utilisés en tandem avec des modèles de génération d’images afin que vous puissiez décrire l’image que vous souhaitez obtenir et que l’IA tente de la créer pour vous. Voici un exemple de demande effectuée en saisissant la réplique « un dessin au trait en 2D de Juliette debout devant la fenêtre d’un vieux château ». Étant donné qu’il y a tellement de descriptions et d’images de Roméo et Juliette sur Internet, le générateur s’appuyant sur l’IA n’a pas eu besoin d’informations supplémentaires pour faire une tentative de création d’image pertinente.

Un dessin au trait en 2D de Juliette debout devant la fenêtre d’un vieux château.

[Image générée par l’IA à l’aide de DreamStudio sur stability.ai avec la réplique « Un dessin au trait en 2D de Juliette debout devant la fenêtre d’un vieux château. »]

Associés à la génération d’images guidée, certains modèles d’IA peuvent ajouter de nouveaux contenus à des images existantes. Par exemple, vous pourriez élargir les bordures d’une image pour permettre à l’IA de dessiner ce qui serait susceptible d’apparaître en fonction du contexte de l’image d’origine.

Synthèse vocale

tout comme certains modèles d’IA peuvent convertir une chaîne de mots en une image, d’autres sont capables de convertir du texte en parole. Certains modèles peuvent analyser des échantillons audio d’une personne en train de parler. Ils apprennent les schémas de parole uniques de cette personne et peuvent les reproduire dans de nouveaux échantillons audio qu’ils génèrent à partir de textes. Pour un auditeur lambda, il sera difficile de faire la différence avec la personne réelle.

Ce ne sont là que quelques exemples de la façon dont les LLM sont utilisés pour créer des textes, images et sons. Presque toutes les tâches qui reposent sur la compréhension du fonctionnement du langage peuvent être exécutées de manière améliorée grâce à l’IA. Il s’agit d’un outil extrêmement puissant que vous pouvez utiliser aussi bien à des fins professionnelles que de divertissement.

Des prédictions impressionnantes

Maintenant que vous avez une idée de ce dont l’IA générative est capable, il est important de clarifier un aspect en particulier. Le texte produit par une IA générative n’est en réalité qu’une autre forme de prédiction. Toutefois, au lieu de prédire la valeur d’une maison, l’IA prédit une séquence de mots susceptibles d’avoir un sens et une pertinence pour le lecteur.

Les prédictions générées sont impressionnantes, bien entendu, mais elles ne signifient pas que l’ordinateur « réfléchit ». Ce dernier n’a pas d’opinion sur le sujet sur lequel vous lui posez des questions, ni d’intentions ou de désirs qui lui sont propres. Si vous avez l’impression qu’il a une opinion, c’est parce qu’il élabore une prédiction qui se rapproche le plus de ce que vous attendez comme réponse. Par exemple, le fait de demander à quelqu’un « Préférez-vous le café ou le thé ? » suscite un certain type de réponse attendue. Un modèle bien entraîné pourra prédire une réponse à une telle question, même s’il n’est pas logique pour un ordinateur de vouloir déguster une quelconque boisson.

Dans l’unité suivante, vous découvrirez certaines des technologies qui rendent possible le fonctionnement de l’IA générative.

Durée estimée

Thèmes

Besoin d'aide ?

Ressources Einstein