Utilisation de l’ajustement pour améliorer les performances
Objectifs de formation
Une fois cette unité terminée, vous pourrez :
- Répertorier les avantages de l’ajustement
- Expliquer les défis de l’ajustement
- Expliquer quand utiliser l’ajustement
Pourquoi utiliser l’ajustement ?
Les modèles plus petits et ajustés peuvent parfois être plus performants dans la réalisation des tâches spécifiques pour lesquelles ils sont conçus que des modèles plus volumineux et plus gourmands en ressources. Ils peuvent également améliorer les performances du modèle original. Voici quelques-uns des avantages que présente l’utilisation de l’ajustement.
Expertise propre à une tâche
Utilisation d’un vocabulaire spécialisé
La préformation des LLM leur a permis d’acquérir un large vocabulaire. Toutefois, les tâches spécialisées comportent souvent des termes et un jargon uniques. L’ajustement introduit et renforce ce vocabulaire, garantissant que le modèle le comprend et l’utilise de manière appropriée.
Prenons l’exemple d’un LLM utilisé pour diagnostiquer des maladies sur la base de comptes-rendus médicaux. Ajusté avec des données médicales, ce LLM offrira des performances bien supérieures à celles du modèle de base, qui ne dispose pas des connaissances médicales requises. Par conséquent, l’ajustement devient indispensable lorsqu’il s’agit de domaines spécialisés, de données sensibles ou d’informations uniques qui ne sont pas bien représentées dans les données d’entraînement générales.
Exploitation de la compréhension contextuelle
Les modèles généraux peuvent manquer de connaissances sur des sujets spécifiques. En effectuant l’ajustement sur du contenu propre à une tâche, le modèle acquiert une compréhension plus approfondie et plus nuancée du sujet, permettant de générer des réponses plus précises et plus pertinentes.
Rentabilité
Économies de calcul
L’entraînement d’un modèle à partir de zéro avec GPT-4 nécessite du temps et des ressources de calcul considérables. En exploitant un modèle préentraîné et en l’ajustant, vous réutilisez efficacement la plupart des calculs effectués pendant la phase de préentraînement, économisant ainsi du temps et des ressources.
Amélioration de l’efficacité des données
L’ajustement nécessite généralement un jeu de données plus petit que l’entraînement à partir de zéro. Ceci est important, en particulier pour les tâches uniques où la collecte de grandes quantités de données est difficile ou coûteuse.
Personnalisation et flexibilité
Personnalisation pour des applications spécifiques
Chaque entreprise ou application peut avoir des exigences uniques. L’ajustement permet de personnaliser le modèle et de s’assurer qu’il correspond bien aux cas d’utilisation spécifiques, tels que la génération de contenu marketing personnalisé ou la compréhension du contenu généré par les utilisateurs sur leur plate-forme.
Promotion de la sensibilité et de la conformité des données
Les entreprises qui traitent des données sensibles ou qui opèrent dans des environnements réglementaires stricts peuvent avoir besoin d’ajuster un modèle pour s’assurer qu’il respecte les exigences en matière de confidentialité, qu’il adhère aux directives relatives au contenu et qu’il génère des réponses appropriées conformes aux réglementations du secteur.
Adaptation à un ton et à un style
Si une entreprise souhaite qu’un modèle communique sur un ton spécifique (formel, ludique ou emphatique, par exemple), elle peut ajuster les données avec le ton souhaité.
Amélioration de l’expérience utilisateur
Un modèle ajusté peut offrir une meilleure expérience utilisateur en générant des réponses plus précises, pertinentes et contextuelles, conduisant à une plus grande satisfaction client, dans des systèmes tels que :
- Les agents conversationnels
- Les assistants virtuels
- Les systèmes de support client
Considérations relatives à l’éthique et à la sécurité
Atténuation des biais
Lorsque le comportement général ou les sorties d’un modèle s’avèrent biaisés ou problématiques, l’ajustement sur des jeux de données sélectionnés peut aider à réduire ces biais.
Filtrage des sorties non désirées
Pour les applications où certaines sorties ne sont pas souhaitables, telles que les applications destinées aux enfants, l’ajustement peut aider à affiner les sorties du modèle afin de rester dans un cadre sécurisé.
Exclusion des données sensibles
Lors de la création de votre jeu de données, soyez particulièrement attentif à n’inclure aucune donnée sensible. Bien que cela puisse donner de meilleurs résultats, les données risquent d’être utilisées de manière erronée ou dans des situations non appropriées.
Amélioration continue
Réitération du processus de retour d’informations
Après le déploiement, les interactions des utilisateurs avec le modèle peuvent être collectées (tout en respectant les normes de confidentialité) et utilisées comme retours d’informations. L’ajustement régulier à partir de ces retours garantit que le modèle reste aligné sur les besoins des utilisateurs et s’améliore continuellement.
Avantage compétitif
Différenciation
Sur un marché où plusieurs entités peuvent utiliser des modèles de base similaires, l’ajustement offre un moyen de se démarquer, en créant une variante de modèle unique et éventuellement mieux adaptée à une clientèle ou à une tâche spécifique.
Quand utiliser l’ajustement ?
La décision d’ajuster un LLM repose sur plusieurs facteurs, notamment votre cas d’utilisation spécifique, les coûts associés et le niveau souhaité de spécificité du domaine.
Pour les tâches générales telles que répondre à des questions ou résumer des documents, des modèles préentraînés comme GPT-3.5, facilement disponibles via des API, génèrent des résultats satisfaisants. De plus, l’exploitation de ces API constitue une solution rentable.
Toutefois, pour les tâches impliquant un traitement intensif des données ou nécessitant un niveau d’expertise spécifique, l’ajustement peut être la solution adéquate. En effet, il permet au modèle de comprendre et générer du texte en fonction de connaissances spécialisées dans un domaine spécifique, améliorant ainsi considérablement la qualité des sorties.
Défis et considérations
Si l’ajustement est si avantageux, pourquoi tous les LLM ne sont-ils pas ajustés pour toutes les spécialisations possibles ? Le processus et les critères d’ajustement sont très complexes. Voici quelques-uns des inconvénients à prendre en compte.
Surapprentissage
L’un des principaux problèmes liés à l’ajustement concerne l’entraînement trop ciblé d’un modèle sur un petit jeu de données. Le modèle fonctionne très bien sur ce jeu de données, mais mal sur des données inédites.
Oubli important
Un ajustement incorrect peut amener le modèle à « oublier » certaines de ses connaissances générales antérieures, le rendant moins efficace en dehors du domaine spécialisé.
Biais du jeu de données
Si le jeu de données utilisé pour l’ajustement contient des biais, ceux-ci peuvent être transmis au modèle. Le modèle apprend donc les mêmes inexactitudes et biais. Les biais peuvent provenir de différentes sources, telles que les biais de sélection, d’échantillonnage, d’étiquetage ou historiques.
- Biais de sélection : les données sélectionnées pour l’ajustement ne représentent pas toute la diversité de l’espace de problème.
- Biais d’échantillonnage : les données sont collectées de telle sorte que certains membres de la population visée sont moins susceptibles d’être inclus que d’autres.
- Biais d’étiquetage : les annotations ou étiquettes fournies dans le jeu de données d’ajustement sont influencées par des opinions subjectives ou des stéréotypes.
- Biais historiques : les données reflètent des inégalités historiques ou sociétales qui sont intrinsèquement injustes ou problématiques.
Choix des hyperparamètres
Lors de l’ajustement, l’utilisation d’hyperparamètres inadaptés peut nuire aux performances du modèle, voire le rendre impossible à entraîner.
Conclusion
L’ajustement ne consiste pas seulement à faire en sorte qu’un modèle « fonctionne » pour une tâche spécifique, il s’agit d’optimiser les performances, de garantir la pertinence, de réaliser des économies et d’adapter les sorties pour des raisons à la fois fonctionnelles et éthiques. Voici les principaux facteurs à prendre en compte lorsqu’on envisage d’utiliser l’ajustement.
- Votre tâche nécessite-t-elle une expertise spécialisée ?
- Disposez-vous du jeu de données spécialisé pour l’ajustement ?
- Disposez-vous des ressources, du temps et de la puissance de calcul ?
Ressources