Comprender los casos de uso comunes de análisis de datos
Objetivos de aprendizaje
Después de completar esta unidad, podrá:
- Explicar por qué los análisis de datos son importantes en las empresas modernas.
- Explicar cómo se utilizan las herramientas de análisis de datos en los escenarios comunes.
Uso de los análisis de datos en un mundo complejo
¿Qué tienen en común el mundo de los videojuegos, el comercio y las redes sociales? Estos ámbitos generan muchos datos que las organizaciones utilizan con el fin de mejorar sus servicios, además de para detectar y solucionar problemas. En el siguiente vídeo, Raf explora los segmentos más comunes y utiliza casos en los que los análisis de datos están presentes en la vida diaria.
¿Estamos hablando de unas 100 líneas de datos? ¿1000? En algunos casos, pueden ser cientos de miles, o incluso millones. ¿Cómo se trabaja con todos ellos?
La prueba al final de esta unidad hace preguntas sobre el contenido de este vídeo. Asegúrese de visualizarlo con el fin de obtener la información que necesita para responder a las preguntas al final de la unidad.
Ver transcripción
[Raf] Ahora que ya conocen la diferencia entre los distintos tipos de análisis de datos, voy a enseñarles algunos ejemplos sobre la probabilidad de que el análisis de datos esté presente en sus vidas, como consumidor y, probablemente, como profesional también. El análisis de datos está presente en numerosos ámbitos, como videojuegos, tablones de redes sociales, comercio electrónico, tiendas en línea, sitios web, estadísticas, a lo que también llamamos rastreo de clics, motores de sugerencias, Internet de las cosas o IoT, procesamiento de registros y mucho más.
Voy a darles un par de ejemplos de casos en los que el análisis de datos es una herramienta muy valiosa, para que entiendan el propósito exacto del análisis de datos en estos contextos. Supongamos que les gusta jugar a videojuegos, como a mí. A quién no, ¿verdad?
Si les gusta jugar a videojuegos, ya sea en el teléfono, el ordenador o la videoconsola, es posible que les suene la casilla que tienen que marcar antes de empezar a jugar. En esa casilla suele poner algo como Enviar estadísticas de datos anónimos para los desarrolladores a fin de mejorar la experiencia de juego. Básicamente, esto permite recopilar información sobre la forma en que juegan los usuarios a fin de detectar posibles bloqueos, fallos de diseño y otro tipo de datos. En este caso queda claro que los datos de la vida real, como estos del juego, se transforman en información que ayuda a los desarrolladores a solventar posibles problemas y mejorar la experiencia de juego. Es por esto que existe el análisis de datos, y por eso es tan importante en el mundo actual.
Puede que se pregunten que por qué ahora, Llevo jugando a juegos desde pequeño, pero no es el mismo caso. Antes, los juegos venían en cartuchos. Solíamos comprarlos así y jugar, ¿verdad? Así es. Pero si lo pensamos, esos juegos no eran tan complejos como los de hoy en día. Quiero que se queden con eso.
El análisis ayuda a las personas a elaborar perspectivas, y estas ayudan a resolver problemas complejos. Puede ser de videojuegos, mercados de valores, datos sobre el sector inmobiliario, información del tráfico, sistemas informáticos de moda, servidores web o registros de seguridad. Sea como sea, el análisis de datos permite obtener respuestas a situaciones complejas.
Teniendo en cuenta que los precios del almacenamiento bajan a diario, las empresas suelen recopilar datos que seguramente no tienen utilidad ahora mismo. Sin embargo, si surge una pregunta en el futuro, la respuesta puede estar en esos datos recopilados.
Ahora mismo, el mundo se está volviendo mucho más complejo que hace diez años. Contar con la ayuda de sistemas informáticos es fundamental por dos motivos principales. La posibilidad de ampliación y la toma de decisiones impulsada por datos. Otra parte fundamental del análisis de datos es el análisis de registros. Voy a centrarme un poco más en este, porque va a ser el tema que veamos en mayor profundidad durante este curso, especialmente los registros de seguridad.
Cuando hablamos de análisis de registros, solemos referirnos a la información generada por sistemas informáticos en función de eventos. Ese evento puede ser una solicitud HTTP enviada a una página web, información de inicio de sesión de usuarios, llamadas API o cualquier otro tipo de solicitud. API es el acrónimo en inglés de interfaz de programación de aplicaciones, que es básicamente una interfaz que define las interacciones entre varios intermediarios de software.
Define el tipo de llamadas o solicitudes que se pueden realizar, cómo se realizan, los formatos de datos que se deben usar, las convenciones que se deben seguir, etc. Desde el punto de vista del análisis de datos, es muy común registrar todas esas actividades en algún sitio.
Un ejemplo clásico de análisis de datos es usar registros de un servidor web para extraer datos de los visitantes de un sitio web. Supongamos que todas las solicitudes enviadas a un servidor HTTP se registran en un sistema de archivos. Normalmente, lo llamamos registro de acceso. Si se añade una línea al registro de acceso por cada visita que se hace a su sitio web, podemos decir que la cantidad de líneas del registro equivale a la cantidad de solicitudes procesadas por el servidor web.
Si solo tienen un servidor y un sitio web pequeño con un par de visitas por minutos, pueden usar algunas herramientas básicas, como editores de texto, para analizar los archivos y extraer la información que buscan. Sin embargo, si el objetivo es hacer algo más útil que simplemente añadir líneas en el archivo de registro, es fundamental usar una herramienta de análisis de datos.
Siempre recomendamos el uso de herramientas de análisis de datos, pero es importante usar herramientas profesionales que gestionen la escala cuando queramos agregar y visualizar registros. Imaginen que tienen decenas de servidores web intentando gestionar miles de usuarios por segundo. Podemos estimar que cada archivo de registro de cada servidor se rellenará muy rápido. Y tenemos que concentrar todos esos datos en algún lugar.
Además, es posible que necesitemos una forma de visualizar los datos en un gráfico de líneas, lo que podría ayudarnos con la identificación de picos, también llamados desviaciones o valores atípicos. Hoy en día, otro uso importante del análisis de datos es la seguridad de los datos. Si tienen sistemas que generan registros de seguridad a los que pueden acceder fácilmente para extraer análisis, significa que tienen una gran ventaja si necesitan buscar el momento en que se realiza una solicitud, quién la hace, desde cuándo y desde dónde, además de cuál fue la respuesta del sistema.
Si además alcanzan el nivel de hacer análisis predictivos a partir de esos datos, podrán incluso llegar al punto de bloquear automáticamente solicitudes maliciosas o erróneas a sistemas informáticos antes de que se envíen o crear una arquitectura autocorrectiva que empiece a crear un entorno de conmutación por error cuando un entorno actual presente una reducción del rendimiento.
Esto se puede lograr con la ayuda de herramientas de automatización de infraestructura en la nube. Hay un servicio de AWS llamado AWS CloudTrail que registra la actividad de las API en una cuenta de AWS, y otro servicio de AWS llamado Amazon S3 que facilita almacenamiento. Vamos a hablar de ellos brevemente.
Esto es lo que almacena CloudTrail cada vez que usted u otra persona inicia sesión en su cuenta de AWS desde la consola de administración de AWS. La información que se guarda en Amazon S3 contiene datos como quién realizó la solicitud, desde qué dirección IP, para qué era la solicitud, cuál fue la respuesta y otra información útil sobre cumplimiento que puede convertirse rápidamente en pruebas en caso de que sea necesario. Dada su naturaleza, CloudTrail es un servicio que facilita la gobernanza de las infraestructuras, así como la auditoría de las operaciones y el riesgo en su cuenta de AWS.
No obstante, si necesitan investigar datos de texto de CloudTrail a menudo, puede resultar complicado. En este sentido, el análisis de datos es muy útil para saber todo lo que pueden hacer con esos datos de cumplimiento. Si cuentan con herramientas de visualización de datos para la información generada por CloudTrail, pueden elaborar paneles de seguridad con gráficos y alertas en caso de actividades sospechosas. Si, de repente, empiezan a ver registros de actividades de error de inicio de sesión, puede deberse a que alguien esté intentando iniciar sesión en su cuenta de AWS, o a que han cambiado la contraseña y no la recuerdan.
Yo suelo decir que el análisis de la seguridad de los datos no solo es bueno para los informes de cumplimiento, sino también para solucionar problemas. Si aplican ese concepto a los paquetes de firewall, la actividad de redes, el equilibrador de carga, los registros de servidores y otro tipo de temas de infraestructura, podrán identificar fácilmente valores atípicos y resolver problemas con rapidez. Piensen en todo momento en qué más cosas podrían estar usando el análisis de datos, y en cómo les ayuda a obtener perspectivas más fundamentadas sobre lo que está sucediendo, ya sea en temas de seguridad, mejora de productos, mejora de la experiencia del cliente o cualquier otra parte del espectro del análisis de datos.
Teniendo en cuenta que no existen límites, en el siguiente vídeo hablaremos de por qué todas estas acciones en la nube nos proporcionan una gran ventaja, y de cómo nos permiten usar el análisis de datos allá donde queramos, en cualquier momento y al servicio de quien queramos.
¿Ha visto el vídeo?
Recuerde, la prueba realiza preguntas sobre el video en esta unidad. Si aún lo ha visto, vuelva y hágalo ahora. Después, estará listo para realizar la prueba.