Explorar las capacidades de la IA generativa
Objetivos de aprendizaje
Después de completar esta unidad, podrá:
- Describir las cualidades de los modelos de IA generativa comparados con otros modelos.
- Definir el vocabulario principal de los modelos de lenguaje de la IA.
- Describir las capacidades de la IA generativa que utilizan los modelos de lenguaje.
Trailcast
Si desea escuchar una grabación de audio de este módulo, utilice el siguiente reproductor. Cuando termine de escuchar la grabación, recuerde volver a cada unidad, consultar los recursos y completar las tareas asociadas.
La inteligencia artificial en el punto de mira
Últimamente, las redes sociales están repletas de noticias sobre la inteligencia artificial (IA), lo cual resulta abrumador. ¿Pero a qué se debe este aumento de interés? La IA no es exactamente algo nuevo; muchos negocios e instituciones han utilizado la IA de alguna manera durante años. Puede decirse que la repentina atención a la IA ha sido causada por algo llamado ChatGPT, el primer bot de chat impulsado por IA ampliamente difundido que podría hacer lo que nadie más podría.
Las letras GPT significan Generative Pre-trained Transformer (Transformador generativo preentrenado). Los GPT son un tipo de modelo de IA denominados red neural que pueden responder a preguntas o solicitudes en lenguaje sencillo; esas respuestas parecen haber sido escritas por un ser humano. Cuando ChatGPT y otros GPT similares se introdujeron al público, la gente pudo experimentar de primera mano lo que era mantener una conversación con un ordenador. Fue sorprendente. Fue inquietante. Fue evocador. Así que obviamente, las personas empezaron a prestar atención.
[Imágenes generadas con IA utilizando DreamStudio en stability.ai con el mensaje: "Un robot feliz sentado en una silla de escritorio. En el escritorio hay un ordenador. Dibujado con un estilo de vector 2D".]
Una IA que puede mantener una conversación natural como la de los humanos es claramente diferente a lo que hayamos visto en el pasado. Como ya vio en la insignia Aspectos fundamentales de la inteligencia artificial, existen muchas tareas específicas para las que están entrenados los modelos de IA. Por ejemplo, un modelo de IA se puede entrenar para utilizar los datos de mercado con el fin de predecir el precio de venta óptimo de una vivienda de tres habitaciones. Es increíble, pero ese modelo produce "solo" un número. En cambio, algunos modelos de IA pueden producir una increíble variedad de textos, imágenes y sonidos que no hayamos leído, visto o escuchado nunca. Este tipo de IA se conoce como IA generativa. Destaca por su gran potencial para el cambio, tanto dentro como fuera del lugar de trabajo.
En esta insignia, aprenderá sobre los distintos tipos de tareas para los que los modelos de IA generativa están entrenados, y algunas de las tecnologías detrás del entrenamiento. Además, esta insignia explora la manera en la que los negocios se fusionan en torno al ecosistema de la IA. Por último, terminaremos debatiendo sobre algunas de los asuntos que preocupan a los negocios sobre la IA generativa.
Posibilidades de los modelos de lenguaje
Es posible que la IA generativa parezca algo totalmente novedoso, pero lo cierto es que los investigadores han estado entrenando modelos de IA generativa durante años. Algunos incluso han sido noticia en los últimos años. Quizá recuerde los artículos de 2018, cuando una empresa llamada Nvidia descubrió un modelo de IA que podía producir imágenes fotorrealistas aleatorias de rostros humanos. Las imágenes eran increíblemente convincentes. Aunque no eran perfectas, definitivamente daban que hablar. La IA generativa estaba empezando a introducirse poco a poco en la conciencia pública.
Mientras algunos investigadores trabajaban en una IA que podía crear imágenes de un tipo específico, otros se centraban en la IA relacionada con el lenguaje. Entrenaban modelos de IA para realizar todo tipo de tareas que implicaban la interpretación de un texto. Por ejemplo, es posible que quiera clasificar las reseñas de uno de sus productos en positivas, negativas o neutras. Esa es una tarea que requiere una comprensión de la manera en la que las palabras se combinan en el uso cotidiano, y es un gran ejemplo de lo que los expertos llaman procesamiento de lenguaje natural (PLN). Como existen muchas formas de "procesar" el lenguaje, el procesamiento de lenguaje natural describe una categoría amplia de IA. (Para obtener más información sobre PLN, consulte la insignia Aspectos básicos sobre el procesamiento de lenguaje natural).
Algunos sistemas de IA que ejecutan tareas de PLN se entrenan con una gran cantidad de datos, lo que en este caso se traduce en ejemplos de texto escrito por personas reales. Como estos modelos de IA se entrenan con grandes cantidades de datos, reciben el nombre de grandes modelos de lenguaje (LLM). Los LLM capturan con todo detalle las reglas del lenguaje que el ser humano tarda años en aprender. Estos grandes modelos de lenguaje permiten ejecutar tareas increíblemente avanzadas relacionadas con el lenguaje.
Sintetización
Si se encuentra con una oración y entiende cómo se conectan todas las palabras para decir algo, probablemente pueda reescribir la frase para expresar la misma idea. Dado que los modelos de IA conocen las reglas de la sintaxis, y han aprendido las palabras que pueden intercambiarse por otras, también pueden hacer un remix. Partir de un párrafo y condensarlo en una o dos oraciones es otro tipo de remix. Este tipo de sintetización asistida por IA puede resultar muy útil en el mundo real. Puede generar notas de una reunión a partir de una grabación de una hora. O escribir un resumen de un artículo científico. Se trata del generador de elevator pitch definitivo.
Traducción
Los LLM son como una colección de reglas que describen cómo estructura un idioma o lenguaje las palabras para convertirlas en ideas. Cada idioma tiene sus propias reglas. En español solemos poner los adjetivos detrás de los sustantivos, pero en inglés suele ser al revés. Los traductores con IA se entrenan para aprender ambos grupos de reglas. De esta forma, cuando toca crear un remix de frases, la IA puede usar un segundo conjunto de reglas para expresar la misma idea. Listo. Ya tiene una traducción perfecta. Los lenguajes de programación también son idiomas. Tienen su propio conjunto de reglas, de modo que la IA puede convertir un conjunto de instrucciones independientes en código real. Un programador personal de bolsillo puede abrir puertas para mucha gente.
Corrección de errores
Hasta los escritores o redactores más experimentados pueden cometer errores gramaticales u ortotipográficos. La IA detecta (y a veces hasta corrige automáticamente) cualquier despiste. Además, la compensación de errores es importante incluso cuando escuchamos a alguien hablar. Es muy común que no entendamos una palabra o dos porque estamos en un entorno ruidoso, pero utilizamos el contexto para hacernos una idea. La IA también puede hacer lo mismo, por lo que las tareas de texto a voz, como la generación de subtítulos, son ahora más precisas.
Respuesta a preguntas
Esta es la tarea que colocó a la IA generativa en primer plano. Las IA, como los GPT, son capaces de interpretar la intención de una pregunta o solicitud. A continuación, pueden generar una gran cantidad de texto basado en la solicitud. Por ejemplo, podría pedirle a un GPT que realice un resumen de los tres trabajos más famosos de William Shakespeare y obtendría lo siguiente:
"Romeo y Julieta": una trágica historia sobre dos jóvenes amantes de familias enfrentadas cuyo amor desemboca en sus prematuras muertes.
"Hamlet": la historia de un príncipe perseguido por el fantasma de su padre, que lucha contra la venganza y las preguntas existenciales sobre la vida y la muerte.
"Macbeth": un drama espeluznante de ambición y decadencia moral sobre un noble que se deja llevar por la ambición de su mujer y sucumbe a un plan de asesinatos para llegar al trono.
Luego, podría seguir la conversación preguntando más información sobre Hamlet, como si estuviera hablando con su profesor de literatura. Este tipo de interacción es un ejemplo ideal de cómo conseguir información puntual mediante una solicitud sencilla.
Generación guiada de imágenes
Los LLM se pueden usar junto con modelos de generación de imágenes de modo que pueda describir una imagen. La IA tratará de hacerlo por usted. Esto es un ejemplo de lo que ocurre cuando pedimos "un dibujo 2D de Julieta en la ventana de un viejo castillo". Dado que hay numerosas descripciones e imágenes de Romeo y Julieta en internet, el generador de IA no ha necesitado más información para adivinar cuál es la imagen adecuada.
[Imagen generada con IA utilizando DreamStudio en stability.ai. con la solicitud "un dibujo 2D de Julieta en la ventana de un viejo castillo".]
En relación con la generación guiada de imágenes, algunos modelos de IA pueden agregar contenido nuevo a imágenes existentes. Por ejemplo, podría ampliar los bordes de una imagen para que la IA dibuje lo que debería ir ahí en función del contexto de la imagen original.
Texto a voz
De forma similar a la conversión de una cadena de palabras en una imagen mediante IA, hay modelos de IA que pueden convertir texto en voz. Algunos modelos pueden analizar muestras de audio de una persona. Se aprenden los patrones de habla exclusivos de esa persona y pueden reproducirlos al convertir el texto en audio nuevo. Para un oyente de a pie, es difícil distinguirlo.
Estos son solo algunos ejemplos de cómo se utilizan los grandes modelos de lenguaje para crear texto, imágenes y sonidos. Prácticamente todas las tareas que se basan en la comprensión del funcionamiento del lenguaje pueden impulsarse mediante IA. Es una herramienta increíblemente potente que se puede usar tanto para trabajar como para jugar.
Predicciones impresionantes
Ahora que ya tiene una idea de las capacidades de la IA, es importante dejar algo muy claro. El texto que genera una IA generativa es simplemente otra forma de predicción. Sin embargo, en lugar de predecir el valor de una casa, predice una secuencia de palabras que probablemente tenga significado y relevancia para el lector.
Las predicciones son increíbles, está claro, pero no demuestran que el ordenador esté "pensando". Es decir, no tiene una opinión sobre el tema por el que le pregunta, ni tiene intenciones ni deseos. Si alguna vez algo le parece una opinión, es porque el ordenador está realizando la mejor predicción de la respuesta que esperaba. Por ejemplo, si pregunta a alguien "¿Prefieres café o té?", espera una respuesta concreta. Un modelo bien entrenado puede predecir una respuesta, aunque no tenga sentido para un ordenador querer algo de beber.
En la siguiente unidad, aprenderá sobre algunos tipos de tecnología que hacen posible la IA generativa.
Recursos
- Trailhead: Aspectos fundamentales de la inteligencia artificial
- Trailhead: Aspectos básicos sobre el procesamiento de lenguaje natural
- Ayuda de Salesforce: Acerca de la IA generativa de Salesforce Einstein