Skip to main content
Dreamforce llega a San Francisco del 17 al 19 de septiembre. Regístrese ahora y ahorre un 20 % con el código DF24TRAIL20

Convierta datos en modelos

Objetivos de aprendizaje

Después de completar esta unidad, podrá:

  • Explicar las diferencias entre los algoritmos codificados de forma manual y los modelos entrenados.
  • Definir el aprendizaje automático y cómo se relaciona con la IA.
  • Distinguir entre datos estructurados y sin estructurar, y cómo esto afecta el entrenamiento.

Trailcast

Si quiere escuchar una grabación de audio de este módulo, use el reproductor a continuación. Cuando haya terminado de escuchar esta grabación, recuerde volver a cada unidad, consultar los recursos y completar las evaluaciones asociadas.

El truco detrás de la magia

Lo que hace la IA podría parecer magia. Al igual que sucede en la magia, es natural querer conocer los detalles de cómo se hace. Lo que descubrirá es que los científicos informáticos y los investigadores no utilizan trucos y engaños, sino muchos datos, cálculos matemáticos y potencia de procesamiento Aprender cómo funciona en realidad la IA lo ayudará a aprovechar al máximo su potencial, a la vez que evitará los inconvenientes que generan sus limitaciones.

El paso de la creación al entrenamiento

Hace décadas los programadores están escribiendo código que necesita una entrada, la procesa mediante un conjunto de reglas y devuelve un resultado. Por ejemplo, a continuación se muestra cómo obtener el promedio de un conjunto de números.

  • Entrada: 5, 8, 2, 9 
  • Proceso: Sume los valores [5 + 8 + 2 + 9] y, luego, divida esa cifra por la cantidad de entradas [4]
  • Resultado:

Este conjunto simple de reglas para convertir una entrada en un resultado es un ejemplo de un algoritmo. Se escribieron algoritmos para realizar algunas tareas bastante complejas. Sin embargo, otras tareas tienen tantas reglas (y excepciones) que es imposible capturarlas todas en un algoritmo formulado de forma manual. Nadar es un buen ejemplo de una tarea difícil de capturar como un conjunto de reglas. Puede que reciba algunos consejos antes de meterse a una piscina, pero solo entenderá realmente cómo funciona una vez que intente mantener la cabeza fuera del agua. Ciertos conocimientos se aprenden mejor por experiencia.

¿Qué pasaría si pudiéramos entrenar una computadora de la misma manera? ¿Qué tal si, en lugar de arrojarla a una piscina, la dejáramos descubrir qué funciona para realizar con éxito una tarea? Sin embargo, al igual que aprender a nadar es muy diferente de aprender un idioma extranjero, el tipo de entrenamiento depende de la tarea. Veamos algunas formas en que se entrena la IA.

Experiencia necesaria

Imagínese que cada vez que se dirige a la tienda a comprar leche, registra los detalles de la salida en una hoja de cálculo. Es bastante extraño, pero déjese llevar. Establece las siguientes columnas.

  • ¿Es fin de semana?
  • Hora del día
  • ¿Llueve o no?
  • Distancia hasta la tienda
  • Total de minutos de la salida

Luego de varias salidas, comienza a comprender cómo las condiciones afectan su duración. Por ejemplo, la lluvia hace que el viaje sea más largo, pero también significa que habrá menos personas comprando. Su cerebro realiza conexiones entre las entradas (fin de semana [W], tiempo [T], lluvia [R] y distancia [D]), y el resultado (minutos [M]).

Diagrama de entradas [W, T, R y D

Sin embargo, ¿cómo podemos hacer que una computadora identifique tendencias en los datos para que también pueda realizar estimaciones? Una manera de hacerlo es mediante el método de suposición y prueba. Veamos cómo hacerlo.

Paso 1: Asigne una “ponderación” a todas sus entradas. Se trata de un número que representa qué tanto una entrada debería afectar al resultado. Está bien comenzar con la misma ponderación para todas las entradas.

Paso 2: Utilice los valores de ponderación con los datos existentes (y algunos cálculos matemáticos ingeniosos que no analizaremos aquí) para estimar los minutos que tomará una salida para comprar leche. Podemos comparar la estimación con los datos históricos. El cálculo estará bastante errado, pero no pasa nada.

Paso 3: Permita que la computadora estime un nuevo valor de ponderación para cada entrada y que algunas sean más importantes que otras. Por ejemplo, la hora del día podría ser más importante que si está lloviendo o no.

Paso 4: Vuelva a ejecutar los cálculos para comprobar si los nuevos valores de ponderación generan una mejor estimación. De ser así, significa que los valores de ponderación son más adecuados y que se realizó un cambio positivo.

Paso 5: Repita los pasos 3 y 4, y permita que la computadora modifique los valores de ponderación hasta que las estimaciones dejen de mejorar.

En este momento, la computadora habrá establecido valores de ponderación para cada entrada. Si piensa en la ponderación como qué tan conectada está una entrada con el resultado, puede armar un diagrama que utilice el grosor de unas líneas para representar la ponderación de una conexión.

Diagrama de nodos de entradas conectados con un resultado.

En este ejemplo, parece que la hora del día tiene la conexión más fuerte y pareciera que la lluvia no genera una gran diferencia.

Este proceso de suponer y probar generó un modelo de nuestras salidas para comprar leche. Al igual que colocamos un modelo de un bote en una piscina para ver si flota, podemos probar el funcionamiento de este modelo, por así decirlo. Esto significa probarlo en el mundo real. Por lo tanto, para las próximas compras de leche, antes de salir, haga que el modelo estime cuánto tiempo tardará. Si el valor resulta ser correcto varias veces consecutivas, puede permitirle realizar la estimación con confianza para cada salida futura.

Hay un robot en una mesa de trabajo y ensambla las piezas de un modelo pequeño de un velero. La imagen está ilustrada con el estilo de arte en vector en 2D.

[Imagen generada mediante IA con DreamStudio en stability.ai a través de la solicitud “Hay un robot en una mesa de trabajo y ensambla las piezas de un modelo pequeño de un velero. La imagen está ilustrada con el estilo de arte en vector en 2D”.]

Utilice los datos correctos para el trabajo indicado

Este es un ejemplo muy simple de uso del entrenamiento para desarrollar un modelo de IA, pero aborda algunas ideas importantes. En primer lugar, es un ejemplo de aprendizaje automático (machine learning, ML), que es el proceso de utilizar grandes cantidades de datos para entrenar un modelo con el fin de que realice predicciones, en lugar de crear de forma manual un algoritmo.

En segundo lugar, no todos los datos son iguales. En nuestro ejemplo de salida para comprar leche, la hoja de cálculo es lo que podríamos llamar datos estructurados. Se encuentra bien organizada y tiene etiquetas en todas las columnas para saber la importancia de cada celda. Por su parte, los datos sin estructurar serían datos como un artículo de noticias o un archivo de imagen sin etiquetas. El tipo de datos que tenga a su disposición afectará el tipo de entrenamiento que pueda realizar.

En tercer lugar, los datos estructurados de nuestra hoja de cálculo les permiten a las computadoras realizar un aprendizaje supervisado. Se considera supervisado porque podemos asegurarnos de que cada conjunto de datos de entrada coincida con un resultado esperado que podremos verificar. En cambio, los datos sin estructurar se utilizan para el aprendizaje sin supervisión, que es cuando la IA intenta buscar conexiones en los datos sin saber realmente qué se está buscando.

Permitir que la computadora determine un valor individual de ponderación para cada entrada es solo un tipo régimen de entrenamiento. Sin embargo, a menudo, los sistemas interconectados son más complicados de lo que la ponderación individual puede representar. Por suerte, como aprenderá en la siguiente unidad, existen otras formas de entrenamiento.