Usar el ajuste para mejorar el desempeño

Objetivos de aprendizaje

Después de completar esta unidad, podrá:

Enumerar los beneficios del ajuste.
Explicar los retos del ajuste.
Describir el momento en que se usa el ajuste.

¿Por qué usar el ajuste?

Los modelos más pequeños y ajustados a veces pueden tener un mejor desempeño que los modelos más grandes y costosos en ciertas tareas para los que están entrenados. También pueden mejorar el desempeño del modelo original. Estas son algunas ventajas del ajuste.

Experiencia en tareas específicas

Uso de vocabulario especializado

Los LLM vienen con un amplio vocabulario de su entrenamiento previo. Sin embargo, las tareas especializadas a menudo usan jerga y términos exclusivos. El ajuste introduce y refuerza ese vocabulario para garantizar que el modelo lo entienda y lo use de forma adecuada.

Considere un LLM que se usa para diagnosticar enfermedades según la historia clínica del paciente. Este LLM, ajustado con datos médicos, ofrecerá un desempeño mucho mejor que el modelo de base, que carece del conocimiento médico requerido. Por lo tanto, el ajuste se vuelve indispensable para abordar campos especializados, datos confidenciales o información exclusiva que no está bien representada por los datos del entrenamiento general.

Usar comprensión contextual

Es posible que los modelos generales carezcan de profundidad para determinados temas. Al ajustarse a contenido de tareas específicas, el modelo obtiene una comprensión con más matices sobre el tema y facilita respuestas más precisas e informadas.

Eficiencia de costos

Promover el ahorro informático

Entrenar un modelo en la escala de GPT-4 desde cero requiere mucho tiempo y muchos recursos informáticos. Al aprovechar un modelo ya entrenado y ajustarlo, está reutilizando eficazmente la mayor cantidad de trabajo informático realizado durante la fase de entrenamiento previo y está ahorrando tiempo y recursos.

Aumentar la eficiencia de los datos

En general, el ajuste requiere un conjunto de datos más pequeño que el entrenamiento desde cero. Esto es crucial, en especial para las tareas exclusivas donde recopilar grandes cantidades de datos es costoso o desafiante.

Personalización y flexibilidad

Adaptarse a aplicaciones específicas

Puede que cada negocio o aplicación tenga requisitos exclusivos. El ajuste admite la personalización y garantiza que el modelo se alinee correctamente a los casos de uso específicos, como generar contenido de marketing personalizado o entender el contenido generado por usuarios en su plataforma.

Promocionar la confidencialidad y el cumplimiento de datos

Puede que los negocios que gestionan datos confidenciales u operan en entornos reglamentarios estrictos necesiten ajustar un modelo para asegurarse de que cumpla con los requisitos de privacidad, adhiera a las directrices de contenido y genere respuestas adecuadas que cumplan con los reglamentos del sector.

Adaptarse a un tono y estilo

Si una compañía quiere un modelo para comunicarse en un tono específico (por ejemplo, formal, agradable o empático), puede lograrlo ajustando datos con ese tono.

Mejorar la experiencia del usuario

Un modelo con ajuste ofrece una mejor experiencia de usuario al generar respuestas más precisas, relevantes y adaptadas al contexto, lo que lleva a un aumento en la satisfacción de los clientes en aplicaciones como estas:

Chatbots
Asistentes virtuales
Sistemas de asistencia al cliente

Consideraciones éticas y de seguridad

Mitigar sesgos

Cuando el comportamiento general o las respuestas de un modelo resultan sesgadas o problemáticas, ajustar los conjuntos de datos depurados ayuda a reducir los sesgos.

Filtrar respuestas no deseadas

En los casos de aplicaciones con determinadas respuestas no deseadas, por ejemplo, aplicaciones aptas para niños, el ajuste ayuda a refinar las respuestas del modelo para que se mantengan dentro de los límites de seguridad.

Excluir datos confidenciales

Asegúrese de no incluir datos confidenciales cuando crea su conjunto de datos. Si bien puede generar mejores resultados, expone los datos para que se usen de forma incorrecta o en situaciones inadecuadas.

Mejora continua

Iterar bucles de comentarios

Después de la implementación, se pueden recopilar las interacciones de los usuarios con el modelo (respetando las reglas de privacidad) y usarlas como comentarios. El ajuste periódico según estos comentarios garantiza que el modelo siga alineado con las necesidades del usuario y mejore continuamente.

Ventaja competitiva

Habilitar la diferenciación

En un mercado donde varias entidades podrían usar modelos de base parecidos, el ajuste ofrece una forma de destacarse al crear una variante de modelo que es exclusiva y posiblemente más apta para una tarea o clientela específicas.

¿Cuándo se usa el ajuste?

La decisión de ajustar un LLM depende de varios factores, incluido su caso de uso específico, los costos asociados y el nivel de particularidad de dominio deseado.

Para tareas generales, como responder preguntas o resumir documentos, los modelos con entrenamiento previo como GPT-3.5, que ya están disponibles a través de las API, generan resultados satisfactorios. Además, aprovechar estas API es una solución rentable.

Sin embargo, el ajuste es la solución para las tareas que implican mucho procesamiento de datos o requieren un nivel de experiencia específico. Permite que el modelo comprenda y genere textos que se alinean con el conocimiento experto de un campo específico, lo cual mejora la calidad de las respuestas de forma significativa.

Desafíos y consideraciones

Si el ajuste es tan genial, ¿por qué no se ajustan todos los LLM para todas las especializaciones que se le ocurran? La respuesta es que los criterios y el proceso para el ajuste implican mucho trabajo. Estos son algunos de los inconvenientes que debería tener en cuenta.

Exceso de adecuación

Una preocupación principal en el ajuste es cuando un modelo está demasiado entrenado para un conjunto de datos pequeño. Es posible que trabaje muy bien con ese conjunto de datos, pero muy mal con los datos no vistos.

Olvidos catastróficos

Un ajuste incorrecto puede causar que el modelo se “olvide” algunos de sus conocimientos generales previos y pierda efectividad fuera del dominio especializado.

Sesgo del conjunto de datos

Si el conjunto de datos con ajuste contiene sesgos, estos se pueden pasar al modelo. Esto causa que el modelo aprenda las mismas inexactitudes y sesgos. Los sesgos pueden venir de diferentes fuentes, como selecciones, muestras, etiquetas o sesgos históricos.

Sesgo de selección: los datos seleccionados para el ajuste no representan toda la diversidad del espacio de problema.
Sesgo de muestra: los datos se recopilan de forma tal que es menos probable que se incluyan algunos miembros de la población prevista.
Sesgo de etiqueta: las anotaciones o etiquetas proporcionadas en el conjunto de datos con ajuste se ven influidas por estereotipos u opiniones subjetivas.
Sesgo histórico: los datos reflejan las inquietudes históricas y de la sociedad que son problemáticas o inherentemente injustas.

Selección de hiperparámetros

Usar de forma incorrecta la configuración de hiperparámetros en el ajuste puede obstaculizar el desempeño del modelo o impedir su entrenamiento.

Resumen

El ajuste no se trata solo de hacer que funcione un modelo para una tarea específica; implica optimizar el desempeño, garantizar la relevancia, lograr la eficiencia de costos y adaptar los resultados por motivos éticos y funcionales. Estos son los principales factores que se deben tener en cuenta para el ajuste.

¿Su tarea requiere experiencia especializada?
¿Tiene el conjunto de datos especializado para el ajuste?
¿Tiene los recursos, el tiempo y la potencia informática?

Recursos

Documentación de OpenAI: Ajuste

Estimación de tiempo

Temas

¿Necesita ayuda?