Skip to main content

Exploration des capacités de l’IA générative

Objectifs de formation

Une fois cette unité terminée, vous pourrez :

  • Décrire les qualités des modèles d’IA générative par rapport à celles d’autres modèles
  • Définir les termes clés associés aux modèles de langage d’IA
  • Décrire les capacités des IA génératives ayant recours à des modèles de langage

Trailcast

Pour écouter un enregistrement audio de ce module, utilisez le lecteur ci-dessous. Lorsque vous avez fini d’écouter cet enregistrement, n’oubliez pas de revenir à chaque unité, de consulter les ressources et de réaliser les évaluations associées.

L’intelligence artificielle, objet de toutes les attentions

Ces derniers temps, les médias n’ont de cesse de diffuser des informations concernant l’intelligence artificielle (IA), à un point tel que cela en devient presque assommant. Quelles sont les raisons derrière ce vif engouement ? L’IA n’est pas vraiment nouvelle ; de nombreuses entreprises et institutions y ont recours d’une façon ou d’une autre depuis des années. L’attention soudaine portée à l’IA a sans doute été due à un outil appelé ChatGPT. Il s’agit du premier agent conversationnel fondé sur l’IA à avoir été largement médiatisé : il avait alors la capacité d’effectuer ce qu’aucune autre solution ne pouvait faire.

Dans « ChatGPT », « GPT » signifie Generative Pre-trained Transformer (transformateur génératif pré-entraîné). Les transformateurs génératifs pré-entraînés sont un type de modèle IA appelé réseau neuronal ayant la capacité de répondre à la manière d’un être humain à des questions ou demandes formulées en langage simple. Lorsque ChatGPT et d’autres transformateurs génératifs pré-entraînés lui ressemblant ont été rendus accessibles au grand public, leurs utilisateurs ont pu découvrir par eux-mêmes ce que c’était que d’avoir une conversation avec un ordinateur. C’était surprenant. C’était étrange. C’était inspirant. Il n’est donc pas étonnant que de plus en plus de personnes se soient mises à s’intéresser à la question !

Un robot heureux assis sur une chaise devant un bureau. Un ordinateur portable se trouve sur le bureau. L’illustration reprend le style des illustrations vectorielles en 2D.

[Image générée par l’IA à l’aide de DreamStudio sur stability.ai avec la réplique suivante : « Un robot heureux assis sur une chaise devant un bureau. Un ordinateur portable se trouve sur le bureau. L’illustration reprend le style des illustrations vectorielles en 2D. »] 

Une IA qui peut tenir une conversation naturelle à la manière d’un être humain se démarque clairement des technologies du passé. Comme vous l’apprenez dans le badge Principes fondamentaux de l’intelligence artificielle, il y a beaucoup de tâches spécifiques pour lesquelles les modèles d’IA sont entraînés. Par exemple, un modèle d’IA peut être entraîné pour utiliser les données du marché immobilier afin de prédire le prix de vente optimal d’une maison comportant trois chambres. Cela est certes impressionnant, mais ce modèle génère « seulement » un chiffre. En revanche, certains modèles d’IA peuvent générer une grande variété de textes, d’images et de sons que nous n’avons jamais lus, vus ou entendus auparavant. Ce type d’IA est connu sous le nom d’IA générative. Il présente un énorme potentiel d’évolution, tant au sein des milieux professionnels qu’en dehors de ceux-ci.

Dans ce badge, vous découvrirez quels types de tâches les modèles d’IA générative sont entraînés à réaliser, ainsi que certaines des technologies employées pour procéder à cet entraînement. Ce badge s’intéresse également à la manière dont les entreprises se regroupent autour de domaines de spécialité dans l’écosystème de l’IA générative. Enfin, nous terminerons en évoquant certaines des préoccupations des entreprises en ce qui concerne l’IA générative.

Possibilités offertes par les modèles de langage

L’IA générative peut sembler être une nouveauté, mais en réalité, les chercheurs entraînent des modèles d’IA générative depuis des décennies. Certains ont même fait parler d’eux ces dernières années. Peut-être vous souvenez-vous d’articles datant de 2018 à propos d’une société nommée Nvidia qui avait dévoilé un modèle d’IA capable de générer des images photoréalistes aléatoires de visages humains. Les clichés présentés étaient étonnamment convaincants. Même s’ils n’étaient pas parfaits, ils ont permis d’ouvrir le débat sur cette thématique. L’IA générative commençait alors lentement à attirer l’attention du public.

Tandis que des chercheurs travaillaient sur une IA capable de créer des types d’images spécifiques, d’autres se concentraient sur des IA liées au langage. Ils entraînaient des modèles d’IA de sorte que ceux-ci puissent effectuer toutes sortes de tâches impliquant l’interprétation de texte. Par exemple, il se peut que vous souhaitiez classer les avis émis au sujet de l’un de vos produits selon qu’ils sont positifs, négatifs ou neutres. Il s’agit d’une tâche qui nécessite de comprendre comment les mots sont combinés dans leur usage quotidien, et c’est un excellent exemple de ce que les experts appellent le traitement en langage naturel (NLP). Étant donné qu’il existe de nombreuses façons de « traiter » le langage, le NLP fait référence à une vaste catégorie d’usages de l’IA. (Pour en savoir plus sur le NLP, reportez-vous au badge Concepts de base du traitement en langage naturel.)

Certaines des IA qui exécutent des tâches de NLP sont entraînées avec d’énormes quantités de données, qui sont, en l’occurrence, des échantillons de textes écrits par des personnes réelles. Internet, avec ses milliards de pages Web, est une excellente source d’échantillons de données. Ces modèles d’IA sont entrainés avec des volumes de données si conséquents qu’ils sont connus sous le nom de grands modèles de langage (LLM). Les LLM assimilent de manière extrêmement détaillée les règles linguistiques que les locuteurs humains mettent des années à apprendre. Ces grands modèles de langage permettent d’effectuer des tâches de nature linguistique extrêmement sophistiquées.

Synthèse

si l’on vous présente une phrase et que vous comprenez comment tous ses mots s’articulent pour transmettre une idée, vous pouvez probablement reformuler la phrase de manière à exprimer la même pensée. Étant donné que les modèles d’IA connaissent les règles de syntaxe et qu’ils ont appris quels mots peuvent être remplacés par d’autres, ils peuvent également effectuer ce type de reformulation. Le fait d’analyser un paragraphe entier et de le condenser en une ou deux phrases n’est qu’un autre type de reformulation. De telles capacités de synthèse assistée par l’IA peuvent s’avérer très utiles dans le monde réel. Elles peuvent permettre de générer des notes de réunion à partir d’un enregistrement d’une durée d’une heure, ou encore d’écrire un résumé d’un article scientifique. En outre, il s’agit de l’outil idéal pour élaborer des argumentaires éclair.

Traduction

les LLM sont semblables à un ensemble de règles indiquant la manière dont une langue structure les mots en idées. Chaque langue a ses propres règles. En français, on place généralement les noms avant les adjectifs, mais en anglais, c’est habituellement l’inverse. Les outils de traduction s’appuyant sur l’IA sont entraînés de manière à apprendre ces deux ensembles de règles. Ainsi, lorsqu’il est temps de remanier une phrase, l’IA peut utiliser un deuxième ensemble de règles pour exprimer la même idée. Vous obtenez alors une traduction de qualité. Par ailleurs, les langages de programmation sont, comme leur nom l’indique, eux aussi des langages. Comme ils disposent de leur propre ensemble de règles, l’IA peut traduire un ensemble d’instructions générales en code véritable. Avec un tel programmeur de poche personnel à la disposition de tous, le champ des possibles s’ouvre considérablement.

Correction d’erreurs

même les rédacteurs les plus expérimentés font parfois des fautes de grammaire ou d’orthographe. Désormais, l’IA détectera (et parfois corrigera automatiquement) tout élément problématique. De plus, la correction d’erreurs s’avère également utile dans des contextes où vous écoutez quelqu’un parler. Vous pouvez parfois ne pas bien comprendre un mot ou deux parce que vous êtes dans un environnement bruyant, mais vous vous appuyez sur le contexte pour les deviner. L’IA peut faire de même, ce qui rend les tâches de reconnaissance vocale telles que le sous-titrage encore plus précises.

Formulation de réponses à des questions

il s’agit de la tâche qui a propulsé l’IA générative sous les feux de la rampe. Les IA telles que les transformateurs génératifs pré-entraînés sont capables d’interpréter l’intention derrière une question ou une demande. Ensuite, elles peuvent générer une grande quantité de texte en fonction de la demande. Par exemple, vous pourriez demander à un transformateur génératif pré-entraîné de générer un résumé en une phrase des trois œuvres les plus populaires de William Shakespeare, et vous obtiendriez les énoncés suivants :

« Roméo et Juliette » : l’histoire tragique de deux jeunes amants issus de familles rivales dont l’amour conduit finalement à leur mort prématurée. 

« Hamlet » : l’histoire d’un prince hanté par le fantôme de son père, aux prises avec la vengeance et les questions existentielles de la vie et de la mort. 

« Macbeth » : un drame terrifiant sur l’ambition et la déchéance morale mettant en scène un noble qui, poussé par la convoitise de sa femme, se livre à une série de meurtres sanglants pour accéder au trône. 

Ensuite, vous pourriez poursuivre la conversation en demandant plus d’informations sur Hamlet, comme si vous parliez avec votre professeur de littérature. Ce type d’interaction est un excellent exemple de la manière dont il est possible d’obtenir des informations en temps opportun grâce à une simple demande.

Génération d’images guidée

les LLM peuvent être utilisés en tandem avec des modèles de génération d’images afin que vous puissiez décrire l’image que vous souhaitez obtenir et que l’IA tente de la créer pour vous. Voici un exemple de demande effectuée en saisissant l’invite « un dessin au trait en 2D de Juliette debout devant la fenêtre d’un vieux château ». Étant donné qu’il y a tellement de descriptions et d’images de Roméo et Juliette sur Internet, le générateur s’appuyant sur l’IA n’a pas eu besoin d’informations supplémentaires pour faire une tentative de création d’image pertinente.

Un dessin au trait en 2D de Juliette debout devant la fenêtre d’un vieux château.

[Image générée par l’IA à l’aide de DreamStudio sur stability.ai avec l’invite « Un dessin au trait en 2D de Juliette debout devant la fenêtre d’un vieux château. »] 

Associés à la génération d’images guidée, certains modèles d’IA peuvent ajouter de nouveaux contenus à des images existantes. Par exemple, vous pourriez élargir les bordures d’une image pour permettre à l’IA de dessiner ce qui serait susceptible d’apparaître en fonction du contexte de l’image d’origine.

Synthèse vocale

tout comme certains modèles d’IA peuvent convertir une chaîne de mots en une image, d’autres sont capables de convertir du texte en parole. Certains modèles peuvent analyser des échantillons audio d’une personne en train de parler. Ils apprennent les schémas de parole uniques de cette personne et peuvent les reproduire dans de nouveaux échantillons audio qu’ils génèrent à partir de textes. Pour un auditeur lambda, il sera difficile de faire la différence avec la personne réelle.

Ce ne sont là que quelques exemples de la façon dont les LLM sont utilisés pour créer des textes, images et sons. Presque toutes les tâches qui reposent sur la compréhension du fonctionnement du langage peuvent être exécutées de manière améliorée grâce à l’IA. Il s’agit d’un outil extrêmement puissant que vous pouvez utiliser aussi bien à des fins professionnelles que de divertissement.

Des prédictions impressionnantes

Maintenant que vous avez une idée de ce dont l’IA générative est capable, il est important de clarifier un aspect en particulier. Le texte produit par une IA générative n’est en réalité qu’une autre forme de prédiction. Toutefois, au lieu de prédire la valeur d’une maison, l’IA prédit une séquence de mots susceptibles d’avoir un sens et une pertinence pour le lecteur.

Les prédictions générées sont impressionnantes, bien entendu, mais elles ne signifient pas que l’ordinateur « réfléchit ». Ce dernier n’a pas d’opinion sur le sujet sur lequel vous lui posez des questions, ni d’intentions ou de désirs qui lui sont propres. Si vous avez l’impression qu’il a une opinion, c’est parce qu’il élabore une prédiction qui se rapproche le plus de ce que vous attendez comme réponse. Par exemple, le fait de demander à quelqu’un « Préférez-vous le café ou le thé ? » suscite un certain type de réponse attendue. Un modèle bien entraîné pourra prédire une réponse à une telle question, même s’il n’est pas logique pour un ordinateur de vouloir déguster une quelconque boisson.

Dans l’unité suivante, vous découvrirez certaines des technologies qui rendent possible le fonctionnement de l’IA générative.

Ressources

Partagez vos commentaires sur Trailhead dans l'aide Salesforce.

Nous aimerions connaître votre expérience avec Trailhead. Vous pouvez désormais accéder au nouveau formulaire de commentaires à tout moment depuis le site d'aide Salesforce.

En savoir plus Continuer à partager vos commentaires