Usar el ajuste para mejorar el desempeño
Objetivos de aprendizaje
Después de completar esta unidad, podrá:
- Enumerar los beneficios del ajuste.
- Explicar los retos del ajuste.
- Describir el momento en que se usa el ajuste.
¿Por qué usar el ajuste?
Los modelos más pequeños y ajustados a veces pueden tener un mejor desempeño que los modelos más grandes y costosos en ciertas tareas para los que están entrenados. También pueden mejorar el desempeño del modelo original. Estas son algunas ventajas del ajuste.
Experiencia en tareas específicas
Uso de vocabulario especializado
Los LLM vienen con un amplio vocabulario de su entrenamiento previo. Sin embargo, las tareas especializadas a menudo usan jerga y términos exclusivos. El ajuste introduce y refuerza ese vocabulario para garantizar que el modelo lo entienda y lo use de forma adecuada.
Considere un LLM que se usa para diagnosticar enfermedades según la historia clínica del paciente. Este LLM, ajustado con datos médicos, ofrecerá un desempeño mucho mejor que el modelo de base, que carece del conocimiento médico requerido. Por lo tanto, el ajuste se vuelve indispensable para abordar campos especializados, datos confidenciales o información exclusiva que no está bien representada por los datos del entrenamiento general.
Usar comprensión contextual
Es posible que los modelos generales carezcan de profundidad para determinados temas. Al ajustarse a contenido de tareas específicas, el modelo obtiene una comprensión con más matices sobre el tema y facilita respuestas más precisas e informadas.
Eficiencia de costos
Promover el ahorro informático
Entrenar un modelo en la escala de GPT-4 desde cero requiere mucho tiempo y muchos recursos informáticos. Al aprovechar un modelo ya entrenado y ajustarlo, está reutilizando eficazmente la mayor cantidad de trabajo informático realizado durante la fase de entrenamiento previo y está ahorrando tiempo y recursos.
Aumentar la eficiencia de los datos
En general, el ajuste requiere un conjunto de datos más pequeño que el entrenamiento desde cero. Esto es crucial, en especial para las tareas exclusivas donde recopilar grandes cantidades de datos es costoso o desafiante.
Personalización y flexibilidad
Adaptarse a aplicaciones específicas
Puede que cada negocio o aplicación tenga requisitos exclusivos. El ajuste admite la personalización y garantiza que el modelo se alinee correctamente a los casos de uso específicos, como generar contenido de marketing personalizado o entender el contenido generado por usuarios en su plataforma.
Promocionar la confidencialidad y el cumplimiento de datos
Puede que los negocios que gestionan datos confidenciales u operan en entornos reglamentarios estrictos necesiten ajustar un modelo para asegurarse de que cumpla con los requisitos de privacidad, adhiera a las directrices de contenido y genere respuestas adecuadas que cumplan con los reglamentos del sector.
Adaptarse a un tono y estilo
Si una compañía quiere un modelo para comunicarse en un tono específico (por ejemplo, formal, agradable o empático), puede lograrlo ajustando datos con ese tono.
Mejorar la experiencia del usuario
Un modelo con ajuste ofrece una mejor experiencia de usuario al generar respuestas más precisas, relevantes y adaptadas al contexto, lo que lleva a un aumento en la satisfacción de los clientes en aplicaciones como estas:
- Chatbots
- Asistentes virtuales
- Sistemas de asistencia al cliente
Consideraciones éticas y de seguridad
Mitigar sesgos
Cuando el comportamiento general o las respuestas de un modelo resultan sesgadas o problemáticas, ajustar los conjuntos de datos depurados ayuda a reducir los sesgos.
Filtrar respuestas no deseadas
En los casos de aplicaciones con determinadas respuestas no deseadas, por ejemplo, aplicaciones aptas para niños, el ajuste ayuda a refinar las respuestas del modelo para que se mantengan dentro de los límites de seguridad.
Excluir datos confidenciales
Asegúrese de no incluir datos confidenciales cuando crea su conjunto de datos. Si bien puede generar mejores resultados, expone los datos para que se usen de forma incorrecta o en situaciones inadecuadas.
Mejora continua
Iterar bucles de comentarios
Después de la implementación, se pueden recopilar las interacciones de los usuarios con el modelo (respetando las reglas de privacidad) y usarlas como comentarios. El ajuste periódico según estos comentarios garantiza que el modelo siga alineado con las necesidades del usuario y mejore continuamente.
Ventaja competitiva
Habilitar la diferenciación
En un mercado donde varias entidades podrían usar modelos de base parecidos, el ajuste ofrece una forma de destacarse al crear una variante de modelo que es exclusiva y posiblemente más apta para una tarea o clientela específicas.
¿Cuándo se usa el ajuste?
La decisión de ajustar un LLM depende de varios factores, incluido su caso de uso específico, los costos asociados y el nivel de particularidad de dominio deseado.
Para tareas generales, como responder preguntas o resumir documentos, los modelos con entrenamiento previo como GPT-3.5, que ya están disponibles a través de las API, generan resultados satisfactorios. Además, aprovechar estas API es una solución rentable.
Sin embargo, el ajuste es la solución para las tareas que implican mucho procesamiento de datos o requieren un nivel de experiencia específico. Permite que el modelo comprenda y genere textos que se alinean con el conocimiento experto de un campo específico, lo cual mejora la calidad de las respuestas de forma significativa.
Desafíos y consideraciones
Si el ajuste es tan genial, ¿por qué no se ajustan todos los LLM para todas las especializaciones que se le ocurran? La respuesta es que los criterios y el proceso para el ajuste implican mucho trabajo. Estos son algunos de los inconvenientes que debería tener en cuenta.
Exceso de adecuación
Una preocupación principal en el ajuste es cuando un modelo está demasiado entrenado para un conjunto de datos pequeño. Es posible que trabaje muy bien con ese conjunto de datos, pero muy mal con los datos no vistos.
Olvidos catastróficos
Un ajuste incorrecto puede causar que el modelo se “olvide” algunos de sus conocimientos generales previos y pierda efectividad fuera del dominio especializado.
Sesgo del conjunto de datos
Si el conjunto de datos con ajuste contiene sesgos, estos se pueden pasar al modelo. Esto causa que el modelo aprenda las mismas inexactitudes y sesgos. Los sesgos pueden venir de diferentes fuentes, como selecciones, muestras, etiquetas o sesgos históricos.
- Sesgo de selección: los datos seleccionados para el ajuste no representan toda la diversidad del espacio de problema.
- Sesgo de muestra: los datos se recopilan de forma tal que es menos probable que se incluyan algunos miembros de la población prevista.
- Sesgo de etiqueta: las anotaciones o etiquetas proporcionadas en el conjunto de datos con ajuste se ven influidas por estereotipos u opiniones subjetivas.
- Sesgo histórico: los datos reflejan las inquietudes históricas y de la sociedad que son problemáticas o inherentemente injustas.
Selección de hiperparámetros
Usar de forma incorrecta la configuración de hiperparámetros en el ajuste puede obstaculizar el desempeño del modelo o impedir su entrenamiento.
Resumen
El ajuste no se trata solo de hacer que funcione un modelo para una tarea específica; implica optimizar el desempeño, garantizar la relevancia, lograr la eficiencia de costos y adaptar los resultados por motivos éticos y funcionales. Estos son los principales factores que se deben tener en cuenta para el ajuste.
- ¿Su tarea requiere experiencia especializada?
- ¿Tiene el conjunto de datos especializado para el ajuste?
- ¿Tiene los recursos, el tiempo y la potencia informática?
Recursos