Explorar las capacidades de la IA generativa

Objetivos de aprendizaje

Después de completar esta unidad, podrá:

Describir las cualidades de los modelos de IA generativa comparados con otros modelos.
Definir el vocabulario principal de los modelos de lenguaje de la IA.
Describir las capacidades de la IA generativa que utilizan los modelos de lenguaje.

La inteligencia artificial en el punto de mira

Es posible que se haya dado cuenta de que últimamente existen muchos debates sobre la inteligencia artificial (IA); resulta casi apabullante. ¿Pero a qué se debe este aumento de interés? La IA no es exactamente algo nuevo; muchos negocios e instituciones han utilizado la IA de alguna manera durante años. Puede decirse que la repentina atención a la IA se debe a algo llamado ChatGPT, un bot de chat propulsado por IA que puede hacer lo que otros no pueden.

ChatGPT puede responder a preguntas o solicitudes que contengan lenguaje sencillo, y esas respuestas parecen elaboradas por el propio ser humano. Además, como se ha puesto a disposición del público general, las personas han podido experimentar de primera mano lo que es tener una conversación con un ordenador. Fue sorprendente. Fue inquietante. Fue evocador. Así que obviamente, las personas empezaron a prestar atención.

Un robot feliz sentado en una silla de escritorio. En el escritorio hay un ordenador. dibujado con un estilo de vector 2D.

[Imágenes generadas con IA utilizando DreamStudio en stability.ai con el mensaje: "Un robot feliz sentado en una silla de escritorio. En el escritorio hay un ordenador. Dibujado con un estilo de vector 2D".]

Una IA que puede mantener una conversación natural como la de los humanos es claramente diferente a lo que hayamos visto en el pasado. Como ya vio en la insignia Aspectos fundamentales de la inteligencia artificial, existen muchas tareas específicas para las que están entrenados los modelos de IA. Por ejemplo, un modelo de IA se puede entrenar para utilizar los datos de mercado con el fin de predecir el precio de venta óptimo de una vivienda de tres habitaciones. Es increíble, pero ese modelo produce "solo" un número. En cambio, algunos modelos de IA pueden producir una increíble variedad de textos, imágenes y sonidos que no hayamos leído, visto o escuchado nunca. Este tipo de IA se conoce como IA generativa. Destaca por su gran potencial para el cambio, tanto dentro como fuera del lugar de trabajo.

En esta insignia, aprenderá sobre los distintos tipos de tareas para los que los modelos de IA generativa están entrenados, y algunas de las tecnologías detrás del entrenamiento. Además, esta insignia explora la manera en la que los negocios se fusionan en torno al ecosistema de la IA. Por último, terminaremos debatiendo sobre algunas de los asuntos que preocupan a los negocios sobre la IA generativa.

Posibilidades de los modelos de lenguaje

Es posible que la IA generativa parezca algo totalmente novedoso, pero lo cierto es que los investigadores han estado entrenando modelos de IA generativa durante años. Algunos incluso han sido noticia en los últimos años. Quizá recuerde los artículos de 2018, cuando una empresa llamada Nvidia descubrió un modelo de IA que podía producir imágenes fotorrealistas aleatorias de rostros humanos. Las imágenes eran increíblemente convincentes. Aunque no eran perfectas, definitivamente daban que hablar. La IA generativa estaba empezando a introducirse poco a poco en la conciencia pública.

Mientras algunos investigadores trabajaban en una IA que podía crear imágenes de un tipo específico, otros se centraban en la IA relacionada con el lenguaje. Entrenaban modelos de IA para realizar todo tipo de tareas que implicaban la interpretación de un texto. Por ejemplo, es posible que quiera clasificar las reseñas de uno de sus productos en positivas, negativas o neutras. Esa es una tarea que requiere una comprensión de la manera en la que las palabras se combinan en el uso cotidiano, y es un gran ejemplo de lo que los expertos llaman procesamiento de lenguaje natural (PLN). Como existen muchas formas de "procesar" el lenguaje, el procesamiento de lenguaje natural describe una categoría amplia de IA. (Para obtener más información sobre el procesamiento de lenguaje natural, consulte Aspectos básicos sobre el procesamiento de lenguaje natural).

Algunos sistemas de IA que ejecutan tareas de PLN se entrenan con una gran cantidad de datos, lo que en este caso se traduce en ejemplos de texto escrito por personas reales. Internet, con sus miles de millones de páginas web, es una gran fuente de datos de ejemplo. Como estos modelos de IA se entrenan con grandes cantidades de datos, reciben el nombre de grandes modelos de lenguaje (LLM). Los LLM capturan con todo detalle las reglas del lenguaje que el ser humano tarda años en aprender. Estos grandes modelos de lenguaje permiten ejecutar tareas increíblemente avanzadas relacionadas con el lenguaje.

Sintetización: Si se encuentra con una oración y entiende cómo se conectan todas las palabras para decir algo, probablemente pueda reescribir la frase para expresar la misma idea. Dado que los modelos de IA conocen las reglas de la sintaxis, y han aprendido las palabras que pueden intercambiarse por otras, también pueden hacer un remix. Partir de un párrafo y condensarlo en una o dos oraciones es otro tipo de remix. Este tipo de sintetización asistida por IA puede resultar muy útil en el mundo real. Puede generar notas de una reunión a partir de una grabación de una hora. O escribir un resumen de un artículo científico. Se trata del generador de elevator pitch definitivo.

Traducción: Los LLM son como una colección de reglas que describen cómo estructura un idioma o lenguaje las palabras para convertirlas en ideas. Cada idioma tiene sus propias reglas. En español solemos poner los adjetivos detrás de los sustantivos, pero en inglés suele ser al revés. Los traductores con IA se entrenan para aprender ambos grupos de reglas. De esta forma, cuando toca crear un remix de frases, la IA puede usar un segundo conjunto de reglas para expresar la misma idea. Listo. Ya tiene una traducción perfecta. Los lenguajes de programación también son idiomas. Tienen su propio conjunto de reglas, de modo que la IA puede convertir un conjunto de instrucciones independientes en código real. Un programador personal de bolsillo puede abrir puertas para mucha gente.

Corrección de errores: Hasta los escritores o redactores más experimentados pueden cometer errores gramaticales u ortotipográficos. La IA detecta (y a veces hasta corrige automáticamente) cualquier despiste. Además, la compensación de errores es importante incluso cuando escuchamos a alguien hablar. Es muy común que no entendamos una palabra o dos porque estamos en un entorno ruidoso, pero utilizamos el contexto para hacernos una idea. La IA también puede hacer lo mismo, por lo que las tareas de texto a voz, como la generación de subtítulos, son ahora más precisas.

Respuesta a preguntas: Esta es la tarea que colocó a la IA generativa en primer plano. Los sistemas de IA como ChatGPT son capaces de interpretar la intención de una pregunta o solicitud. A partir de ahí, pueden generar una gran cantidad de texto basado en la solicitud. Por ejemplo, podría solicitar un resumen de una frase de las tres obras más conocidas de William Shakespeare, y obtendrá lo siguiente:

"Romeo y Julieta": una trágica historia sobre dos jóvenes amantes de familias enfrentadas cuyo amor desemboca en sus prematuras muertes.

"Hamlet": la historia de un príncipe perseguido por el fantasma de su padre, que lucha contra la venganza y las preguntas existenciales sobre la vida y la muerte.

"Macbeth": un drama espeluznante de ambición y decadencia moral sobre un noble que se deja llevar por la ambición de su mujer y sucumbe a un plan de asesinatos para llegar al trono.

Luego, podría seguir la conversación preguntando más información sobre Hamlet, como si estuviera hablando con su profesor de literatura. Este tipo de interacción es un ejemplo ideal de cómo conseguir información puntual mediante una solicitud sencilla.

Generación guiada de imágenes: Los LLM se pueden usar junto con modelos de generación de imágenes de modo que pueda describir una imagen. La IA tratará de hacerlo por usted. Esto es un ejemplo de lo que ocurre cuando pedimos "un dibujo 2D de Julieta en la ventana de un viejo castillo". Dado que hay numerosas descripciones e imágenes de Romeo y Julieta en internet, el generador de IA no ha necesitado más información para adivinar cuál es la imagen adecuada.

Dibujo 2D de Julieta en la ventana de un viejo castillo.

[Imagen generada con IA utilizando DreamStudio en stability.ai. con la solicitud "un dibujo 2D de Julieta en la ventana de un viejo castillo".]

En relación con la generación guiada de imágenes, algunos modelos de IA pueden agregar contenido nuevo a imágenes existentes. Por ejemplo, podría ampliar los bordes de una imagen para que la IA dibuje lo que debería ir ahí en función del contexto de la imagen original.

Texto a voz: De forma similar a la conversión de una cadena de palabras en una imagen mediante IA, hay modelos de IA que pueden convertir texto en voz. Algunos modelos pueden analizar muestras de audio de una persona. Se aprenden los patrones de habla exclusivos de esa persona y pueden reproducirlos al convertir el texto en audio nuevo. Para un oyente de a pie, es difícil distinguirlo.

Estos son solo algunos ejemplos de cómo se utilizan los grandes modelos de lenguaje para crear texto, imágenes y sonidos. Prácticamente todas las tareas que se basan en la comprensión del funcionamiento del lenguaje pueden impulsarse mediante IA. Es una herramienta increíblemente potente que se puede usar tanto para trabajar como para jugar.

Predicciones impresionantes

Ahora que ya tiene una idea de las capacidades de la IA, es importante dejar algo muy claro. El texto que genera una IA generativa es simplemente otra forma de predicción. Sin embargo, en lugar de predecir el valor de una casa, predice una secuencia de palabras que probablemente tenga significado y relevancia para el lector.

Las predicciones son increíbles, está claro, pero no demuestran que el ordenador esté "pensando". Es decir, no tiene una opinión sobre el tema por el que le pregunta, ni tiene intenciones ni deseos. Si alguna vez algo le parece una opinión, es porque el ordenador está realizando la mejor predicción de la respuesta que esperaba. Por ejemplo, si pregunta a alguien "¿Prefieres café o té?", espera una respuesta concreta. Un modelo bien entrenado puede predecir una respuesta, aunque no tenga sentido para un ordenador querer algo de beber.

En la siguiente unidad, aprenderá sobre algunos tipos de tecnología que hacen posible la IA generativa.

Estimación de tiempo

Temas

¿Necesita ayuda?

Recursos de Einstein

Explorar las capacidades de la IA generativa

Objetivos de aprendizaje

La inteligencia artificial en el punto de mira

Posibilidades de los modelos de lenguaje

Predicciones impresionantes

Recursos