Présentation de l’écosystème technologique de l’IA générative

Objectifs de formation

Une fois cette unité terminée, vous pourrez :

Identifier les facteurs clés contribuant au développement rapide de l’IA générative
Décrire les types de technologies qui composent la pile technologique de l’IA générative
Décrire les préoccupations courantes des entreprises au sujet de l’IA générative

Optimisation de l’entraînement de l’IA générative

L’IA générative a acquis de nombreuses capacités en un laps de temps qui semble très court. Le rythme incroyablement rapide de ces améliorations est en grande partie dû à trois grands facteurs. Le premier est la disponibilité d’énormes quantités de données d’entraînement. Comme mentionné dans l’unité précédente, les plus d’un milliard de pages Web existantes sont une excellente source d’échantillons de textes. Cependant, les données ne sont utiles que si vous avez un moyen de les utiliser. C’est là qu’intervient le deuxième grand changement : l’apparition de méthodes d’entraînement plus efficaces.

Comme vous l’apprenez dans le module Principes fondamentaux de l’intelligence artificielle, les chercheurs conçoivent des réseaux neuronaux qui ont recours à des calculs sophistiqués pour entraîner des modèles IA. L’architecture des réseaux neuronaux est un domaine d’étude en constante évolution. En 2017, des chercheurs de Google ont publié un article révolutionnaire sur l’entraînement des grands modèles de langage. Ils ont proposé une nouvelle architecture d’IA appelée transformeur. Comme vous pouvez l’imaginer, leurs travaux de recherche sont assez complexes. Pour faire (très) simple, la nouvelle architecture était capable d’identifier des relations importantes entre certains mots, quelle que soit la distance entre eux au sein d’un bloc de texte. Elle pouvait garder en mémoire cette relation même après avoir traité une grande quantité de mots.

La nouvelle architecture de type Transformeur nous amène au troisième facteur majeur expliquant les progrès rapides de l’IA générative : la puissance de calcul. Une grande puissance de calcul est en effet nécessaire pour mener à bien l’entraînement des modèles d’IA. À l’origine, les modèles d’IA sont conçus d’une manière qui nécessite l’exécution d’une suite de calculs les uns après les autres. L’architecture de type Transformeur est différente : elle repose sur la réalisation simultanée de nombreux calculs distincts.

Ainsi, l’un des processeurs d’un ordinateur peut effectuer de son côté le premier calcul, tandis qu’un autre processeur effectue le deuxième en même temps. C’est ce que l’on appelle le parallélisme : ce processus réduit considérablement le temps nécessaire pour entraîner un transformeur. En plus de cela, les processeurs capables d’exécuter des calculs de manière parallèle ont gagné en puissance et en nombre au cours de ces dernières années.

Ces trois facteurs (abondance de données, apparition d’une architecture adaptée et gain de puissance de calcul) ont convergé d’une façon telle que cela a créé les conditions idéales pour entraîner de grands modèles de langage très performants. L’un des plus grands LLM est le modèle de langage GPT, qui signifie « Generative Pre-trained Transformer », c’est-à-dire transformeur génératif pré-entraîné. En d’autres termes, il s’agit d’un modèle déjà entraîné qui peut être utilisé pour générer du contenu textuel.

Un écosystème émergent

À l’heure actuelle, il existe déjà des centaines de sites sur Internet grâce auxquels vous pouvez vous familiariser avec l’IA générative. Lorsque vous vous rendez sur l’un de ces sites, vous ne voyez qu’un aperçu des technologies en la matière. Par ailleurs, celles-ci peuvent provenir de nombreuses sources différentes. Examinez la pile technologique qui permet d’offrir des expériences d’IA générative époustouflantes au plus grand nombre.

Cet écosystème florissant d’entreprises technologiques s’est développé à une vitesse fulgurante au cours des dernières années. Certaines entreprises se spécialiseront dans un segment particulier. Par exemple, une entreprise axée sur les modèles de fondation pourrait se concentrer sur l’entraînement de nouveaux modèles plus performants pour se différencier. D’autres entreprises créeront des solutions associées à plusieurs couches de la pile technologique, en élaborant leur propre LLM exclusif pour leur application.

De nombreuses entreprises commencent tout juste à se faire une idée de l’utilité de l’IA pour leur activité. Compte tenu de la demande sans précédent en matière de technologies d’IA, les entreprises ont de nombreuses possibilités de se démarquer à plusieurs niveaux de cette pile technologique.

Préoccupations courantes au sujet de l’IA générative

L’IA générative va provoquer de nombreux changements dans la façon dont nous interagissons avec les ordinateurs. Comme avec toute technologie révolutionnaire, il est important de comprendre ses limites et les préoccupations qui lui sont associées. Voici quelques-unes des principales préoccupations concernant l’IA générative.

Hallucinations

n’oubliez pas que l’IA générative constitue en réalité une autre forme d’outil de prédiction, et qu’il arrive que les prédictions soient fausses. Les prédictions de l’IA générative qui divergent d’une réponse attendue tout en s’appuyant sur des faits concrets sont appelées hallucinations. Elles apparaissent pour plusieurs raisons, par exemple si les données d’entraînement étaient incomplètes ou biaisées, ou si le modèle employé n’était pas bien conçu. Ainsi, prenez toujours le temps de vérifier que le contenu d’un texte généré par une IA est exact.

Sécurité des données

les entreprises sont susceptibles de partager des données exclusives à deux occasions au cours du cycle de vie de l’IA générative. Cela peut tout d’abord se produire lors de l’ajustement d’un modèle de fondation. Un tel cas de figure peut également se présenter lors de l’utilisation du modèle pour traiter une demande comportant des données confidentielles. Les entreprises qui proposent des services d’IA doivent démontrer que la confiance est pour elles primordiale et que les données seront toujours protégées.

Plagiat

les LLM et les modèles d’IA employés dans le cadre de la génération d’images sont généralement entraînés avec des données accessibles au public. Il est possible que le modèle apprenne un certain style et reproduise celui-ci. Les entreprises qui développent des modèles de fondation doivent faire en sorte d’ajouter des variations au contenu généré. En outre, elles peuvent être amenées à procéder à un tri des données d’entraînement pour en supprimer certains échantillons à la demande de créateurs de contenu.

Fausses identités

il est plus facile que jamais de créer un profil en ligne crédible arborant une photo générée par l’IA. De tels utilisateurs factices peuvent interagir avec de vrais utilisateurs (et d’autres utilisateurs factices) de manière très réaliste. Il est donc difficile pour les entreprises d’identifier les réseaux de robots qui font la promotion de contenus qu’ils ont eux-mêmes généré.

Développement durable

La puissance de calcul nécessaire pour entraîner et exécuter des modèles IA est immense, et peut avoir divers impacts sur l’environnement, comme générer des émissions de carbone et contribuer à l’épuisement des ressources en eau. Au fur et à mesure que les modèles se développent, leur empreinte carbone augmente également. C’est pourquoi nous nous efforçons de garantir la durabilité de l’IA en développant des modèles IA efficaces, en jouant la carte de la transparence et en décarbonisant le secteur de l’énergie grâce aux énergies renouvelables et à une infrastructure de réseau modernisée.

Récapitulatif

L’IA générative est capable d’aider les entreprises et les particuliers à réaliser toutes sortes de tâches de nature linguistique. La convergence de facteurs spécifiques (abondance de données, apparition d’une architecture d’IA intelligente et gains massifs en matière de puissance de calcul) a fortement amplifié le développement de l’IA générative et la croissance de l’écosystème de l’IA.

Durée estimée

Thèmes

Besoin d'aide ?

Ressources Einstein