Explorar las funcionalidades de la IA generativa
Objetivos de aprendizaje
Después de completar esta unidad, podrá:
- Describir las cualidades de los modelos de IA generativa en comparación con otros modelos.
- Definir el vocabulario clave de los modelos de lenguaje de las IA.
- Describir las capacidades de la IA generativa que utilizan modelos de lenguaje.
La inteligencia artificial en el centro de atención
Puede que haya notado que últimamente se habla mucho sobre la inteligencia artificial (IA). Es casi abrumador. Sin embargo, ¿a qué se debe semejante aumento de interés? La IA no es precisamente nueva. Muchas empresas e instituciones utilizan algunas capacidades de la IA desde hace años. La atención repentina que se le dio a la IA probablemente se debió a una inteligencia llamada ChatGPT, un chatbot con tecnología de IA que puede hacer lo que ninguna otra logró.
ChatGPT puede responder a preguntas o solicitudes en lenguaje simple y proporcionar respuestas que parecen escritas por una persona. Como fue lanzado al público, las personas pudieron probar por sí mismas cómo era platicar con una computadora. Fue sorprendente. Fue inquietante. Fue evocador. Naturalmente, las personas comenzaron a prestar atención.
[Imagen generada mediante IA con DreamStudio en stability.ai a través de la solicitud: “Un robot feliz sentado en una silla ante un escritorio. En el escritorio, hay una computadora portátil. Está ilustrado con el estilo de un dibujo gráfico en vector en 2D”].
Sin duda, nunca antes habíamos visto nada como una IA que puede mantener una plática natural similar a la de una persona. Como aprendió en la insignia Nociones básicas de la inteligencia artificial, existen muchas tareas específicas que los modelos de IA están entrenados para realizar; por ejemplo, se puede entrenar un modelo de IA para que utilice datos de mercado con el fin de predecir el precio de venta óptimo de una vivienda de tres habitaciones. Si bien es impresionante, este modelo produce “solo” un número. En cambio, algunos modelos de IA pueden producir una increíble variedad de texto, imágenes y sonidos que nunca antes leímos, vimos o escuchamos. A este tipo de IA se la conoce como IA generativa. Contiene un gran potencial para el cambio, dentro y fuera del lugar de trabajo.
En esta insignia, aprenderá en qué tipos de tareas están entrenados los modelos de IA generativa y conocerá algunas de las tecnologías que ayudan en el entrenamiento. Esta insignia también explora de qué modo las empresas se agrupan en torno a conocimientos especializados en el ecosistema de la IA generativa. Por último y para finalizar, platicaremos sobre algunas inquietudes que tienen las empresas acerca de la IA generativa.
Posibilidades de los modelos de lenguaje
Podría parecer que la IA generativa es una nueva tendencia, pero en realidad los investigadores entrenan modelos de IA generativa desde hace décadas. Algunos incluso fueron noticia en los últimos años. Tal vez recuerde artículos de 2018 cuando la compañía NVIDIA presentó un modelo de IA que podía producir imágenes realistas de rostros humanos al azar. Las imágenes eran inesperadamente convincentes. Si bien no eran perfectas, sin duda eran tema de plática. De a poco, la IA generativa comenzaba a introducirse en la conciencia pública.
Mientras algunos investigadores trabajaban en IA que pudiera producir tipos específicos de imágenes, otros se enfocaban en IA relacionada con el lenguaje. Entrenaban modelos de IA para que realizaran todo tipo de tareas que involucraban la interpretación de texto. Por ejemplo, puede que desee dividir en categorías reseñas de uno de sus productos como positivas, negativas o neutras. Esta es una tarea que requiere una comprensión de cómo se combinan las palabras en su uso cotidiano, y este es un gran ejemplo de lo que los expertos llaman procesamiento de lenguaje natural (PLN). Debido a que existen muchas formas de “procesar” el lenguaje, el PLN describe una amplia categoría de IA. (Si desea obtener más información sobre el PLN, consulte Aspectos básicos del procesamiento de lenguaje natural).
Algunas IA que trabajan con PLN se entrenan mediante grandes cantidades de datos, lo que en este caso significa muestras de texto escritas por personas reales. Internet, con sus miles de millones de páginas web, es una gran fuente de datos de muestra. Debido a que estos modelos de IA se entrenan mediante cantidades masivas de datos, se los conoce como modelos de lenguaje grande (LLM). Los LLM capturan con un gran nivel de detalle las reglas del lenguaje que las personas tardan años en aprender. Estos modelos de lenguaje grande permiten realizar algunas tareas muy avanzadas en relación con el lenguaje.
Resumen: si comprende cómo todas las palabras de una oración se unen para dar un mensaje, es probable que pueda volver a redactar la oración de modo que exprese la misma idea. Como los modelos de IA conocen las reglas de sintaxis y aprendieron qué palabras se pueden cambiar por otras, también pueden cambiar la redacción. Tomar un párrafo entero y condensarlo en una o dos oraciones es otro tipo de cambio de redacción. Esta clase de resumen con tecnología asistida por IA puede resultar muy útil en el mundo real. Permite crear notas de una reunión a partir de una grabación de una hora. También puede redactar el resumen de un documento científico. Es el generador óptimo de argumentos de venta.
Traducción: los LLM son una suerte de recopilación de reglas sobre el modo en que el lenguaje estructura las palabras en ideas. Cada lenguaje cuenta con sus propias reglas. En inglés, por lo general se colocan los adjetivos antes que los sustantivos, pero en francés suele suceder lo contrario. Se entrena a los traductores de IA para que aprendan ambos conjuntos de reglas. De esta forma, cuando es momento de volver a redactar una oración, la IA puede utilizar un segundo conjunto de reglas para expresar la misma idea. ¡Listo! Ahora cuenta con una buena traducción. Los lenguajes de programación también son lenguajes. Tienen su propio conjunto de reglas, por lo que la IA puede traducir un conjunto poco preciso de instrucciones en código real. Un programador personal de bolsillo puede proporcionarles muchas oportunidades a muchas personas.
Corrección de errores: incluso los escritores con más experiencia cometen errores gramaticales u ortográficos de forma ocasional. Ahora, la IA detectará (y a veces corregirá de forma automática) todos los errores. Además, la corrección de errores es importante cuando simplemente se escucha hablar a una persona. Es posible que no escuche una o dos palabras debido a los ruidos del entorno, pero puede utilizar el contexto para completar lo que falta. La IA también puede hacer esto, lo que permite que tareas de voz a texto como el subtitulado no incrustado sean más precisas.
Respuesta a preguntas: esta es la tarea que llevó a la IA generativa a estar en el centro de atención. Las IA como ChatGPT son capaces de interpretar la intención de una pregunta o solicitud. Luego, puede generar una gran cantidad de texto en función de la solicitud. Por ejemplo, podría pedirle un resumen de una oración de las tres obras más populares de William Shakespeare y obtendría lo siguiente:
“Romeo and Juliet” (Romeo y Julieta): una trágica historia de dos jóvenes amantes de familias en disputa cuyo amor los termina conduciendo a su muerte prematura.
“Hamlet”: la historia de un príncipe atormentado por el fantasma de su padre, que lidia con la venganza y aborda preguntas existenciales como la vida y la muerte.
“Macbeth”: un drama estremecedor que trata sobre la ambición y la decadencia moral a medida que un noble, impulsado por la ambición de su esposa, emprende un sangriento camino de muerte para tomar posesión del trono.
Luego, para continuar con plática, podría solicitar más información sobre Hamlet, como si estuviera hablando con su profesor de Literatura. Este tipo de interacción es un gran ejemplo de cómo obtener información oportuna mediante una solicitud simple.
Generación guiada de imágenes: Los LLM se pueden utilizan en conjunto con modelos de generación de imágenes, de forma que pueda describir la imagen que desea y la IA intentará crearla para usted. El siguiente es un ejemplo de solicitud de “una ilustración de arte de línea de 2D·de Julieta en la ventana de un castillo antiguo”. Debido a que hay muchas descripciones e imágenes de Romeo y Julieta en Internet, el generador de IA no necesitó más información para tratar de generar una imagen adecuada.
[Imagen generada mediante IA con DreamStudio en stability.ai a través de la solicitud “Una ilustración de arte de línea de 2D·de Julieta en la ventana de un castillo antiguo”].
En relación con la generación guiada de imágenes, algunos modelos de IA pueden agregar contenido nuevo a imágenes existentes. Por ejemplo, podría extender los bordes de una imagen si permite que una IA cree lo que probablemente aparecería en la imagen en función del contexto de la imagen original.
Texto a voz: de forma similar al modo en que una IA puede convertir una secuencia de palabras en una imagen, existen modelos de IA que pueden convertir texto en voz. Algunos modelos pueden analizar muestras de audio de una persona hablando. Estos aprenden los patrones de voz únicos de esa persona y pueden reproducirlos cuando convierten texto en audio nuevo. Para los oyentes ocasionales, es difícil notar la diferencia.
Estos son solo algunos ejemplos de cómo se utilizan los LLM para crear texto, imágenes y sonidos nuevos. Una IA puede mejorar casi todas las tareas que dependan de comprender cómo funciona el lenguaje. Es una herramienta muy potente que puede utilizar para trabajar y para divertirse.
Predicciones impresionantes
Ahora que comprende un poco de lo que es capaz la IA generativa, es importante dejar lo siguiente en claro. El texto que produce una IA generativa es en realidad otra forma de predicción. Sin embargo, en lugar de predecir el valor de una vivienda, predice una secuencia de palabras que es probable que tengan sentido y relevancia para el lector.
Sin duda, las predicciones son impresionantes, pero no son “señal” de que una computadora “piensa”. No tiene una opinión del tema sobre el que se le pregunta ni tiene intenciones o deseos propios. Si en algún momento parece que tiene una opinión, es debido a que realiza la mejor predicción de lo que se esperaría como respuesta. Por ejemplo, si se le pregunta a una persona “¿prefiere el café o el té?” se suscita un cierto tipo de respuesta esperada. Un modelo bien entrenado puede predecir una respuesta, incluso si no tiene sentido que una computadora quiera algún tipo de bebida.
En la siguiente unidad, aprenderá sobre algunas de las tecnologías que posibilitan la IA generativa.
Recursos
-
Trailhead: Nociones básicas de la inteligencia artificial
-
Trailhead: Aspectos básicos del procesamiento de lenguaje natural
-
Ayuda: IA generativa de Einstein