Conocer el procesamiento de lenguaje natural
Objetivos de aprendizaje
Después de completar esta unidad, podrá:
- Describir el procesamiento de lenguaje natural.
- Debatir sobre los usos cotidianos del procesamiento de lenguaje natural.
- Explicar su evolución desde la década de 1950.
- Diferenciar entre procesamiento de lenguaje natural, comprensión del lenguaje natural y generación de lenguaje natural.
Antes de empezar
Esta insignia contiene términos como “redes neuronales” y “aprendizaje profundo” que se describen de forma detallada en las insignias Nociones básicas de la inteligencia artificial y Aspectos básicos de la IA generativa. Lo recomendable es que primero obtenga esas insignias.
¿Qué es el procesamiento de lenguaje natural?
El procesamiento de lenguaje natural (PLN) es un campo de la inteligencia artificial (IA) que combina la informática y la lingüística para dotar a las computadoras de la capacidad de comprender, interpretar y generar el lenguaje humano de forma que tenga sentido y sea útil para los humanos.
El PLN ayuda a las computadoras a realizar tareas útiles, como comprender el significado de oraciones, reconocer detalles importantes en un texto, traducir idiomas, responder preguntas, resumir textos y generar respuestas que se parezcan a las humanas.
El PLN ya es tan habitual en nuestra vida cotidiana que ni siquiera solemos pensar en ello cuando interactuamos con él o cuando hace algo por nosotros. Por ejemplo, es posible que su aplicación de email o de creación de documentos le sugiera automáticamente una palabra o frase que podría utilizar a continuación. Puede pedir a un asistente virtual, como Siri, que le recuerde regar las plantas los martes. O puede pedirle a Alexa que le cuente detalles sobre el último gran terremoto de Chile para el proyecto de ciencias de su hija.
Los chatbots con los que interactúa cuando se pone en contacto con el servicio de atención al cliente de una compañía utilizan PLN, al igual que la aplicación de traducción que utiliza para pedir comida en otro país. La detección de spam, sus preferencias de noticias en Internet y muchas otras cuestiones dependen del PLN.
Breve historia del PLN
Vale la pena mencionar que el PLN no es nuevo. De hecho, sus raíces se remontan a la década de 1950, cuando los investigadores empezaron a utilizar computadoras para comprender y generar el lenguaje humano. Una de las primeras contribuciones notables al PLN fue el test de Turing. Desarrollada por Alan Turing, esta prueba mide la capacidad de una máquina para responder a cualquier pregunta de forma indistinguible de un humano. Poco después se desarrollaron los primeros sistemas de traducción automática. Se trataba de experimentos de traducción lingüística basados en frases y oraciones que no llegaron muy lejos porque partían de patrones lingüísticos muy concretos, como frases u oraciones predefinidas.
En la década de 1960, los investigadores ya experimentaban con sistemas basados en reglas que permitían a los usuarios pedir a la computadora que realizara tareas o platicara.
En las décadas de 1970 y 1980 se adoptaron enfoques más sofisticados basados en el conocimiento, que utilizaban reglas lingüísticas, razonamiento basado en reglas y conocimiento del dominio para tareas como la ejecución de comandos y el diagnóstico de afecciones médicas.
Los enfoques estadísticos (es decir, el aprendizaje a partir de datos) del PLN se popularizaron en los años 1990 y principios de los 2000, y dieron lugar a avances en el reconocimiento de voz, la traducción automática y los algoritmos automáticos. Durante este período, la introducción de la red informática mundial (World Wide Web) en 1993 puso a disposición de la investigación en PLN grandes cantidades de datos textuales.
Desde 2009 aproximadamente, las redes neuronales y el aprendizaje profundo dominan la investigación y el desarrollo del PLN. Las áreas de traducción y generación de lenguaje natural del PLN, incluido el recientemente introducido ChatGPT, han mejorado enormemente y siguen evolucionando con rapidez.
El lenguaje humano es el lenguaje “natural”
¿Qué es el lenguaje natural? El lenguaje natural se refiere a la forma en que los seres humanos se comunican entre sí con palabras y frases. Es el lenguaje que utilizamos al platicar, cuando leemos, escribimos o escuchamos. El lenguaje natural es la forma en que transmitimos información, expresamos ideas, hacemos preguntas, contamos historias y nos relacionamos entre nosotros. Aunque se están desarrollando modelos de PLN para muchas lenguas humanas diferentes, este módulo se centra en el PLN en la lengua inglesa.
Si completó la insignia Nociones básicas de la inteligencia artificial, aprendió sobre los datos estructurados y no estructurados. Estos términos también son importantes en el PLN. El lenguaje natural (la forma en que hablamos en realidad) se trata de datos no estructurados; esto significa que, aunque los humanos solemos poder extraer significado de estos datos, no proporcionan a una computadora el tipo de detalles adecuado para encontrarles sentido. El siguiente párrafo sobre un perro en adopción de un refugio es un ejemplo de datos no estructurados.
Tala es una husky siberiana hembra de 5 años, castrada y de 29 kilos (65 libras) a la que le encanta jugar en el parque y hacer largas caminatas. Es muy cariñosa con los niños y se lleva genial con los gatos. Esta dulzura de ojos azules tiene un largo pelaje gris y blanco que necesitará cepillados regulares. Si desea concertar una cita para conocer a Tala, llame al refugio Troutdale.
Para que una computadora entienda lo que queremos decir, esta información tiene que estar bien definida y organizada, de forma similar a lo que se puede encontrar en una hoja de cálculo o una base de datos. Esto se conoce como datos estructurados. La información incluida en los datos estructurados y la forma en que se formatean se determinan en definitiva mediante los algoritmos utilizados por la aplicación final deseada. Por ejemplo, los datos de una aplicación de traducción se estructuran de forma diferente a los de un chatbot. Así es como los datos del párrafo anterior podrían verse como datos estructurados para una aplicación que puede ayudar a vincular perros con posibles adoptantes.
- Nombre: Tala
- Edad: 5
- Castrada/o: Castrada
- Sexo: Hembra
- Raza: Husky
- Peso: 29 kilos (65 libras)
- Color: Gris y blanco
- Color de ojos: Azul
- Bueno con los niños: Sí
- Bueno con los gatos: Sí
- Actividades preferidas: Parques, caminatas
- Ubicación: Troutdale
Comprensión del lenguaje natural y generación de lenguaje natural
El PLN actual ha madurado con sus dos subtemas: la comprensión del lenguaje natural (CLN) y la generación de lenguaje natural (GLN). El procesamiento de datos no estructurados a datos estructurados se denomina comprensión del lenguaje natural (CLN). La CLN utiliza muchas técnicas para interpretar el lenguaje escrito o hablado y comprender su significado y contexto. Obtendrá información acerca de estas técnicas en la siguiente unidad.
El procesamiento de datos a la inversa (de estructurados a no estructurados) se denomina generación de lenguaje natural (GLN). La GLN es lo que permite a las computadoras generar un lenguaje similar al humano. La GLN implica el desarrollo de algoritmos y modelos que conviertan los datos estructurados o la información en texto o voz significativos, contextualmente apropiados y que suenen naturales. También incluye la generación de código en un lenguaje de programación, como la generación de una función de Python para ordenar cadenas.
En el pasado, las tareas de CLN y GLN utilizaban representaciones lingüísticas estructuradas explícitas, como los árboles de análisis. Aunque la CLN y la GLN siguen siendo fundamentales para el PLN hoy en día, la mayoría de las aplicaciones, las herramientas y los asistentes virtuales con los que nos comunicamos han evolucionado y utilizan aprendizaje profundo o redes neuronales para realizar tareas de extremo a extremo. Por ejemplo, un sistema neuronal de traducción automática puede traducir una frase de chino directamente al inglés sin crear de forma explícita ningún tipo de estructura intermedia. Las redes neuronales reconocen patrones, palabras y frases para que el procesamiento del lenguaje tenga una rapidez exponencial y su precisión contextual sea mayor.
En la siguiente unidad, aprenderá más sobre los métodos de lenguaje natural y las técnicas que permiten a las computadoras entender lo que decimos y responder en consecuencia.