Usar ajuste para melhorar o desempenho

Objetivos de aprendizagem

Após concluir esta unidade, você estará apto a:

Listar os benefícios do ajuste.
Explicar os desafios do ajuste.
Descrever quando o ajuste deve ser usado.

Por que ajustar?

Os modelos menores e ajustados muitas vezes podem ter melhor desempenho do que os modelos maiores e mais caros no conjunto de tarefas para o qual foram treinados. Eles também podem melhorar o desempenho do modelo original. Veja algumas vantagens no uso do ajuste.

Especialização na tarefa

Uso de vocabulário especializado

Os LLMs vêm com um amplo vocabulário do seu pré-treinamento. No entanto, as tarefas especializadas muitas vezes têm termos e jargões únicos. O ajuste apresenta e reforça esse vocabulário para garantir que o modelo compreende e o utiliza adequadamente.

Considere um LLM usado para diagnosticar doenças com base em transcrições médicas. Esse LLM ajustado com dados médicos vai ter um desempenho muito superior ao do modelo base que não tem o conhecimento médico necessário. Assim, o ajuste se torna indispensável quando lidamos com áreas especializadas, dados confidenciais ou informações exclusivas que não estão bem representadas nos dados de treinamento gerais.

Uso de compreensão contextual

Os modelos gerais podem não ter profundidade em assuntos específicos. Com o ajuste de conteúdo específico para uma tarefa, o modelo ganha uma compreensão mais profunda e com mais nuance do assunto, o que permite respostas mais precisas e perspicazes.

Economia de custo

Promoção de economia computacional

O treinamento de um modelo da escala do GPT-4 do zero exige recursos computacionais e tempo significativos. Quando você usa um modelo pré-treinado e o ajusta, está, na verdade, reutilizando a maior parte da computação feita durante a fase de pré-treinamento, o que poupa tempo e recursos.

Aumento da eficiência dos dados

O ajuste normalmente exige um conjunto de dados menor do que o treinamento do zero. Isso é essencial, especialmente em tarefas exclusivas em que a coleta de grandes quantidades de dados é difícil ou cara.

Personalização e flexibilidade

Personalização para usos específicos

Toda empresa ou uso pode ter requisitos exclusivos. O ajuste permite a personalização, garantindo que o modelo se alinhe com os casos de uso específicos, como a geração de conteúdo de marketing personalizado ou a compreensão de conteúdo gerado pelos usuários na sua plataforma.

Promoção de confidencialidade e conformidade de dados

As empresas que lidam com dados confidenciais ou operam em ambientes extremamente regulados podem precisar ajustar um modelo para garantir que ele respeitará os requisitos de privacidade, cumprirá as diretrizes de conteúdo e gerará respostas adequadas que cumprem a legislação referente ao setor.

Adaptação a um tom e um estilo

Se uma empresa quiser que um modelo se comunique em um tom específico (por exemplo, formal, brincalhão ou empático), o ajuste dos dados com esse tom pode ajudar nisso.

Aprimoramento da experiência do usuário

Um modelo ajustado pode oferecer uma experiência do usuário melhor com a geração de respostas mais precisas, relevantes e com noção do contexto que aumentam a satisfação do cliente em casos de uso como:

Chatbots
Assistentes virtuais
Sistemas de suporte ao cliente

Considerações éticas e de segurança

Redução do viés

Quando o comportamento geral ou as respostas de um modelo são tendenciosas ou problemáticas, o ajuste com conjuntos de dados selecionados pode ajudar na redução desses preconceitos.

Filtragem de respostas indesejadas

Em casos de uso em que determinadas respostas sejam indesejáveis, por exemplo, usos para crianças, o ajuste pode ajudar a refinar as respostas do modelo para se manter dentro de limites seguros.

Exclusão de dados confidenciais

Cuidado para não incluir dados confidenciais ao criar seu conjunto de dados. Embora isso possa gerar resultados melhores, os dados podem ficar expostos e ser usados de maneira errada ou em situações inadequadas.

Aprimoramento contínuo

Iteração de loops de feedback

Após a implantação, as interações do usuário com o modelo podem ser coletadas (mas respeitando as regras de privacidade) e usadas como feedback. O ajuste periódico com base nesse feedback faz com que o modelo permaneça alinhado com as necessidades dos usuários e seja aprimorado constantemente.

Vantagem competitiva

Possibilidade de diferenciação

Em um mercado em que várias empresas podem usar modelos base semelhantes, o ajuste oferece uma forma de se diferenciar e cria uma variante do modelo que é única e, possivelmente, mais adequada a uma clientela ou tarefa específica.

Quando usar o ajuste?

A decisão de ajustar um LLM depende de vários fatores, incluindo seu caso de uso específico, os custos associados e o nível desejado de especificidade de um domínio.

Para tarefas gerais, por exemplo, responder perguntas ou resumir documentos, os modelos pré-treinados como o GPT-3.5, que já estão disponíveis por meio de APIs, trazem resultados satisfatórios. Além disso, o uso dessas APIs é uma solução econômica.

No entanto, no caso de tarefas que envolvem grande processamento de dados ou um nível específico de especialização, o ajuste parece ser o ideal. Ele permite que o modelo compreenda e gere texto de acordo com o conhecimento de um especialista em determinada área, o que aumenta bastante a qualidade das respostas.

Desafios e considerações

Se o ajuste é tão bom, por que nem todo LLM é ajustado para todas as especializações possíveis? A resposta é que há muita coisa envolvida no processo e nos critérios de ajuste. Veja alguns dos problemas que devem ser levados em conta.

Ajuste excessivo

Um grande problema do ajuste é um modelo ser treinado com muita especificidade de um conjunto de dados pequeno. Ele pode se sair muito bem nesse conjunto de dados, mas ter um desempenho ruim em dados não vistos.

Esquecimento catastrófico

O ajuste incorreto pode fazer com que o modelo "esqueça" parte do conhecimento geral anterior, o que o torna menos eficaz fora do domínio especializado.

Viés do conjunto de dados

Se o conjunto de dados de ajuste contém vieses, eles podem ser transmitidos para o modelo. Isso faz com que o modelo aprenda as mesmas incorreções e os mesmos vieses. Os vieses podem vir de fontes diferentes, por exemplo, seleção, amostragem, rótulo ou preconceito histórico.

Viés de seleção: os dados selecionados para ajuste não representam toda a diversidade da área do problema.
Viés de amostragem: os dados são coletados de maneira que reduz a probabilidade de parte da população pertinente ser incluída.
Viés de rótulo: as anotações ou os rótulos fornecidos no conjunto de dados de ajuste são influenciados por opiniões subjetivas ou estereótipos.
Viés histórico: os dados refletem desigualdades históricas ou sociais que são inerentemente parciais ou problemáticas.

Escolha de hiperparâmetro

As configurações de hiperparâmetro erradas usadas durante o ajuste podem atrapalhar o desempenho do modelo ou até impedir seu treinamento.

Resumo

O ajuste não é só fazer um modelo "funcionar" em uma tarefa específica; trata-se de otimizar o desempenho, garantindo a relevância, economizando custos e gerando respostas sob medida que sejam éticas e funcionais. Veja os principais fatores a se levar em conta na hora de pensar em fazer ajustes.

Sua tarefa precisa de especialização?
Você tem o conjunto de dados especializado necessário para o ajuste?
Você tem os recursos, o tempo e a potência de computação?

Recursos

Documentação da OpenAI: Ajuste

Procurando ajuda?