Découverte des techniques et applications de l’IA
Objectifs de formation
Une fois cette unité terminée, vous pourrez :
- Identifier des cas d’utilisation pratiques de l’IA
- Identifier les limites de ChatGPT et d’autres modèles d’IA
- Comprendre le cycle de vie des données traitées par l’IA et l’importance de la confidentialité et de la sécurité des données au sein des différentes applications de l’IA
Technologies d’intelligence artificielle
L’intelligence artificielle est un vaste domaine d’activité ayant pour objectif de permettre aux machines d’apprendre et de penser comme les êtres humains. Il existe par ailleurs de nombreuses technologies qui englobent l’IA.
- L’apprentissage automatique emploie divers algorithmes mathématiques pour récupérer des informations à partir de données et émettre des prédictions.
- L’apprentissage profond emploie un type spécifique d’algorithme appelé réseau neuronal pour trouver des associations entre un ensemble d’entrées et de sorties. L’efficacité de l’apprentissage profond s’améliore au fur et à mesure que la quantité de données fournies augmente.
- Le traitement automatisé du langage est une technologie qui permet aux machines de traiter du langage humain en tant qu’entrée et d’effectuer des actions en conséquence.
- La vision par ordinateur est une technologie qui permet aux machines d’interpréter des informations visuelles.
- La robotique est une technologie qui permet aux machines d’effectuer des tâches physiques.
Consultez le module Trailhead Principes fondamentaux de l’intelligence artificielle pour en savoir plus.
L’apprentissage automatique peut être décliné en plusieurs types en fonction de l’approche d’apprentissage et de la nature du problème à résoudre.
-
Apprentissage supervisé : dans cette approche d’apprentissage automatique, un modèle réalise un apprentissage à partir de données étiquetées, puis effectue des prédictions reposant sur les schémas qu’il identifie. Le modèle peut ensuite émettre des prédictions ou classer de nouvelles données inédites en fonction des schémas appris au cours de l’entraînement.
-
Apprentissage non supervisé : dans cette approche, le modèle apprend à partir de données non étiquetées en identifiant des schémas et des relations sans sorties prédéfinies. Le modèle apprend à identifier des similitudes, à regrouper des points de données similaires ou à trouver des modèles cachés sous-jacents au sein du jeu de données.
-
Apprentissage par renforcement : ce type d’apprentissage implique qu’un agent apprenne par tâtonnement, en agissant de manière à optimiser les retombées positives associées à un environnement. L’apprentissage par renforcement est souvent utilisé dans des situations où une stratégie de prise de décision optimale doit être apprise par tâtonnement, comme dans les domaines de la robotique, des jeux et des systèmes autonomes. L’agent explore différentes actions et apprend des conséquences de ses actions pour optimiser son processus de prise de décision.
Des outils d’IA de type AutoML et sans code, comme OneNine AI et Salesforce Einstein, ont fait leur apparition ces dernières années. Ils permettent d’automatiser le processus de création d’un pipeline complet d’apprentissage automatique, avec une intervention humaine minimale.
Le rôle de l’apprentissage automatique
L’apprentissage automatique est une sous-catégorie de l’intelligence artificielle qui utilise des algorithmes statistiques pour permettre aux ordinateurs d’apprendre à partir de données, sans être explicitement programmés à cette fin. Il utilise des algorithmes pour créer des modèles capables d’émettre des prédictions ou de prendre des décisions en fonction d’entrées.
Comparaison entre apprentissage automatique et programmation
Dans la programmation traditionnelle, le programmeur doit avoir une compréhension claire du problème et de la solution qu’il tente d’obtenir. Dans l’apprentissage automatique, l’algorithme apprend à partir des données et génère ses propres règles ou modèles pour résoudre le problème.
Importance des données dans l’apprentissage automatique
Les données constituent l’élément moteur de l’apprentissage automatique. La qualité et la quantité des données utilisées dans le cadre de l’entraînement d’un modèle d’apprentissage automatique peuvent avoir un impact significatif sur la précision et l’efficacité de celui-ci. Il est essentiel de s’assurer que les données utilisées sont pertinentes, exactes, complètes et impartiales.
Qualité des données et limites de l’apprentissage automatique
Pour garantir la qualité des données, il est nécessaire de les nettoyer et de les prétraiter en supprimant les éléments superflus (informations indésirables ou dénuées de sens), les valeurs manquantes ou les valeurs aberrantes.
Bien que l’apprentissage automatique soit un outil puissant qui permette de résoudre un large éventail de problèmes, son efficacité présente également des limites, notamment le surapprentissage, le sous-apprentissage et les biais.
- Un surapprentissage se produit lorsque le modèle est trop complexe et correspond trop étroitement aux données d’entraînement, ce qui entraîne une mauvaise généralisation.
- Un sous-apprentissage se produit lorsque le modèle est trop simple et ne parvient pas à identifier les schémas sous-jacents au sein des données.
- Un biais apparaît lorsque le modèle est entraîné avec des données qui ne sont pas représentatives de la population réelle.
L’apprentissage automatique est limité par la qualité et la quantité des données utilisées, le manque de transparence des modèles complexes, la difficulté à généraliser les apprentissages à de nouvelles situations, les défis liés à la gestion des données manquantes et le risque que certaines prédictions soient biaisées.
Bien que l’apprentissage automatique soit un outil puissant, il est important de connaître ces limites et d’en tenir compte lors de la conception et de l’utilisation de modèles employant cette technologie.
Comparaison entre l’IA prédictive et générative
L’IA prédictive consiste en l’utilisation d’algorithmes d’apprentissage automatique pour effectuer des prédictions ou prendre des décisions en fonction d’entrées de données. Elle peut être utilisée à de nombreuses fins, notamment pour détecter les fraudes, poser des diagnostics médicaux et prédire des pertes de clients.
Approches distinctes, objectifs différents
L’IA prédictive est un type d’apprentissage automatique qui entraîne un modèle à émettre des prédictions ou à prendre des décisions en fonction de données. Le modèle reçoit un ensemble de données d’entrée et apprend à reconnaître des schémas dans les données qui lui permettent d’émettre des prédictions précises relatives à de nouvelles entrées. L’IA prédictive est largement employée à des fins telles que la reconnaissance d’images, la reconnaissance vocale et le traitement automatisé du langage.
L’IA générative, quant à elle, crée des contenus inédits, tels que des images, des vidéos ou du texte, en fonction d’une entrée donnée. Plutôt que d’émettre des prédictions en fonction de données existantes, l’IA générative crée des données semblables aux données d’entrée. Elle peut être utilisée dans de nombreux domaines, notamment l’art, la musique et l’écriture créative. Un exemple courant des capacités de l’IA générative est l’utilisation de réseaux neuronaux pour générer de nouvelles images en fonction d’un ensemble donné d’entrées.
Bien que l’IA prédictive et l’IA générative représentent des approches différentes de l’intelligence artificielle, elles ne sont pas mutuellement exclusives. Au contraire, de nombreuses méthodes d’utilisation de l’IA ont recours à la fois à des techniques prédictives et génératives pour produire les résultats qu’on attend d’elles. Par exemple, un agent conversationnel peut utiliser l’IA prédictive pour comprendre les saisies d’un utilisateur et l’IA générative pour générer une réponse donnant l’impression d’avoir été rédigée par un être humain. De manière générale, le choix entre le recours à une IA prédictive ou à une IA générative dépend de l’utilisation spécifique et des objectifs du projet.
Vous en savez maintenant un peu plus sur l’IA prédictive et l’IA générative, ainsi que sur leurs différences. À titre informatif, voici un aperçu de leurs capacités respectives.
IA prédictive |
IA générative |
---|---|
Peut émettre des prédictions précises en fonction de données étiquetées |
Peut générer du contenu à la fois nouveau et créatif |
Peut être utilisée pour résoudre de nombreux problèmes, notamment détecter des fraudes, poser des diagnostics médicaux et prédire des pertes de clients |
Peut être utilisée dans de nombreux domaines créatifs, notamment l’art, la musique et l’écriture |
Limitée par la qualité et la quantité des données étiquetées disponibles |
Peut générer du contenu biaisé ou inapproprié en fonction des données d’entrée |
Peut avoir du mal à émettre des prédictions en dehors du champ des données étiquetées avec lesquelles elle a été entraînée |
Peut avoir du mal à comprendre des contextes ou à générer du contenu cohérent |
Peut nécessiter des ressources informatiques importantes pour son entraînement et son déploiement |
Peut ne pas convenir à toutes les utilisations, telles que celles qui nécessitent exactitude et précision |
Limites de l’IA générative
L’IA générative crée des contenus inédits, tels que des images, des vidéos ou du texte, en fonction d’une entrée donnée. ChatGPT, par exemple, est un modèle d’IA génératif qui peut répondre aux saisies de texte à la manière d’un individu. Il fonctionne en étant entraîné avec de grandes quantités de données textuelles et en apprenant à prédire le mot suivant dans une séquence en fonction des mots précédents.
Bien que ChatGPT puisse générer des réponses donnant l’impression d’avoir été rédigées par un être humain, il présente également des limites : il peut générer des réponses biaisées ou inappropriées selon les données avec lesquelles il a été entraîné. Il s’agit d’un problème courant avec les modèles d’apprentissage automatique, car ils peuvent faire ressortir les biais et les limites des données d’entraînement. Par exemple, si les données d’entraînement contiennent un langage majoritairement négatif ou offensant, ChatGPT risque de générer des réponses tout aussi négatives ou offensantes.
ChatGPT peut également avoir du mal à comprendre le contexte des saisies utilisateur ou à générer des réponses cohérentes. L’efficacité de ChatGPT dépend de la qualité des données avec lesquelles il est entraîné. Si les données d’entraînement sont incomplètes, biaisées ou erronées, le modèle risque de ne pas être en mesure de générer des réponses précises ou utiles. Cela peut constituer une limite de taille dans le cadre d’utilisations où la précision et la pertinence sont importantes. Comme pour d’autres modèles d’apprentissage automatique, les données jouent ici un rôle essentiel. Si les données avec lesquelles il est entraîné sont de mauvaise qualité, alors ChatGPT ne sera pas très utile.
L’exemple de ChatGPT démontre que les données jouent un rôle crucial pour permettre une utilisation efficace de l’IA.
Cycle de vie des données traitées par l’IA
Le cycle de vie des données représente les étapes par lesquelles passent les données, depuis leur collecte initiale jusqu’à leur suppression éventuelle. Le cycle de vie des données traitées par l’IA consiste en plusieurs étapes, dont la collecte, le prétraitement, l’entraînement, l’évaluation et le déploiement des données. Il est important de s’assurer que les données utilisées sont pertinentes, exactes, complètes et non biaisées, et que les modèles générés sont efficaces et éthiques.
Le cycle de vie des données traitées par l’IA est en évolution permanente, car les modèles doivent être continuellement mis à jour et affinés en fonction des nouvelles données et des commentaires reçus. Il s’agit d’un processus itératif qui nécessite de porter une attention particulière aux détails et de s’engager en faveur du développement d’une IA éthique et efficace. Les développeurs et les utilisateurs de modèles d’apprentissage automatique doivent s’assurer que leurs modèles sont efficaces, précis et éthiques, et qu’ils ont un impact positif sur le monde. Le cycle de vie des données joue un rôle crucial pour garantir que les données sont collectées, stockées et utilisées de manière responsable et éthique.
Voici les étapes du cycle de vie des données.
-
Collecte des données : lors de cette étape, les données sont collectées à partir de diverses sources, telles que des capteurs, des sondages et des dispositifs en ligne.
-
Stockage des données : une fois les données collectées, elles doivent être stockées en toute sécurité.
-
Traitement des données : au cours de cette étape, les données sont traitées afin d’en extraire des connaissances et des schémas. Cela peut notamment impliquer l’utilisation d’algorithmes d’apprentissage automatique ou d’autres techniques d’analyse de données.
-
Utilisations des données : une fois les données traitées, elles peuvent être utilisées aux fins prévues, par exemple pour permettre la prise de décisions ou l’élaboration d’une politique.
-
Partage des données : il est parfois nécessaire de partager des données avec d’autres organisations ou individus.
-
Rétention des données : la rétention des données désigne la durée pendant laquelle les données sont conservées.
-
Suppression des données : une fois que les données ne sont plus nécessaires, elles doivent être supprimées de façon sécurisée. Cela peut consister en la suppression de données numériques de manière sécurisée ou en la destruction de supports physiques.
Même si l’IA et l’apprentissage automatique ont le potentiel de révolutionner de nombreux secteurs et de résoudre des problèmes complexes, il est important de connaître les limites et les considérations éthiques qui leur sont associées. Passez à l’unité suivante pour en savoir plus sur l’importance de l’éthique et de la confidentialité des données.
Ressources
-
Site externe : OneNine AI : cas d’utilisation de l’IA par secteur d’activité
-
GitHub : Types de modèles d’apprentissage automatique et d’apprentissage profond
-
Trailhead : Principes fondamentaux de l’intelligence artificielle
-
Publication sur le blog : Quelles sont les limites de ChatGPT ?