Comprender los fundamentos de las bases de datos

Objetivos de aprendizaje

Después de completar esta unidad, podrá:

Identificar cinco hitos en la historia de las bases de datos.
Diferenciar entre las bases de datos relacionales y no relacionales.
Definir “Big Data”.

Historia de las bases de datos

“Está en la nube.” Es algo que escuchamos todo el tiempo. Por supuesto las evocaciones de algodón y nebulosidad son engañosas por que la nube es solo un centro de datos físico lleno de servidores. Salesforce tiene muchos de ellos por todo el mundo. Pero ¿cómo se organizan estos datos y se accede a ellos? Bueno, depende de la base de datos. Esta unidad es un curso intensivo sobre los conceptos clave de las bases de datos.

Cronología

Nuestra historia empieza en los años 60 del siglo pasado, en los tiempos cuando una computadora llenaba una sala.

Una cronología que esboza la historia de las bases de datos y de la computación de escritorio desde la década de los 60 hasta la década del año 2000

Década	Eventos clave
Años 60 del siglo XX	El término “base de datos” surgió a comienzos de la década de los 60, cuando los discos sustituyeron el almacenamiento basado en cinta. Las primeras bases de datos no eran relacionales, lo que significa que eran simplemente listas vinculadas de registros en formato libre. Eso cambió en una década.
Años 70 del siglo XX	En los 70 se presentaron las bases de datos relacionales, y se convirtieron en la norma. A diferencia de las bases de datos anteriores, estas ofrecían tablas normalizadas, relacionadas y con capacidad de búsqueda.
Años 80 del siglo XX	La computación de escritorio quedó muy difundida en los años 80, junto con software de negocio pensado para los usuarios que interactuaba con bases de datos subyacentes.
Años 90 del siglo XX	En esta década, la programación orientada a objetos (OOP) hizo posible la organización de los datos por clases y atributos en vez de simplemente por tablas y campos.
Década del año 2000	Las bases de datos no relacionales retornaron en esta década en la forma de bases de datos NoSQL (no solo SQL). Estas son sencillas y muy ampliables, de modo que cumplen las demandas de Big Data y aplicaciones web en tiempo real.

Ahora que tenemos una rápida lección de historia en nuestro haber, echemos un vistazo con mayor detalle a dos clasificaciones principales de bases de datos.

Relacionales frente a no relacionales

Las bases de datos relacionales dominaron el panorama durante décadas, y aún son relevantes en la actualidad. Dividen los datos entre múltiples tablas relacionadas. Las tablas principales contienen identificadores exclusivos denominados “claves principales”. Las tablas secundarias hacen referencia a esas claves principales con otros identificadores (“claves externas”). En el diagrama, la Tabla A es la principal y la Tabla B es la secundaria.

Se muestran dos tablas de bases de datos relacionadas. La Tabla A tiene la columna de clave principal. La Tabla B tiene columnas de clave principal y de clave externa. La columna de clave externa de la Tabla B hace referencia a la columna de clave principal de la Tabla A.

Características de las bases de datos relacionales

Los administradores y desarrolladores normalmente acceden y manipulan datos en una base de datos relacional empleando el lenguaje de consultas estructurado (SQL). Las transacciones tienen cuatro características (que puede recordar con el acrónimo ACID). Las bases de datos relacionales valoran la coherencia sobre la disponibilidad.

Atómica: Todas las tareas deben tener éxito o la transacción se revierte.
Coherente: El estado de la base de datos debe mantener la coherencia durante toda la transacción.
aIslada: Cada transacción es separada, no dependiente de otras.
Duradera: Los datos de una transacción fallida pueden recuperarse.

Las bases de datos relacionales son ideales para el análisis y las operaciones de datos complejos. Siguen una estructura rígida, y los datos deben ajustarse a ella.

Por otro lado, a veces los datos simplemente no pueden forzarse a ingresar en una estructura rígida. Esta situación comenzó a presentarse en la década de los años 90 cuando despegó Internet, y las aplicaciones web generaban datos que no estaban categorizados claramente. Presenciamos un amplio resurgimiento de las bases de datos no relacionales, ahora llamadas a veces bases de datos “no solo SQL” o “NoSQL”.

Tipos de bases de datos no relacionales

Los cuatro tipos de bases de datos no relacionales son pares de clave-valor, almacenes orientados a columnas, sistemas orientados a documentos y gráficos.

Hay cuatro.

Los pares de clave valor utilizan el modelo de matriz asociativa, lo que significa que los datos están representados en una recopilación de pares (clave+valor).
Los almacenes orientados a columnas utilizan una estructura de tabla. Las columnas en una tabla pueden cambiar de fila a fila.
Los sistemas orientados a documentos guardan la información de cada documento como una única instancia en la base de datos. Los documentos pueden anidarse.
Los gráficos organizan los elementos, las relaciones entre los elementos y los atributos asignados a ambos elementos y relaciones.

Características de bases de datos no relacionales

Las bases de datos no relacionales comparten tres cualidades. (Recuérdelas utilizando el acrónimo BASE.) Valoran la disponibilidad sobre la coherencia, lo opuesto a lo que vemos en las bases de datos relacionales.

Básicamente disponible: El sistema está disponible, incluso en el caso de un fallo.
Estado Suave: El estado de los datos podría cambiar.
Eventual coherencia: La coherencia no se garantiza al nivel de la transacción, pero los datos se sincronizan eventualmente en todos los nodos.

Las bases de datos no relacionales son altamente ampliables, ya que la estructura es fácil de modelar. La coherencia puede ser imperfecta, ya que no hay garantía de que todos los clientes vean los mismos datos al mismo tiempo.

Comparemos.

Relacional	No relacional
Normalizada	Desnormalizada
SQL	SQL limitado o SQL asíncrono
Datos estructurados	Datos estructurados o no estructurados
Transacciones ACID	Sin transacciones o limitadas

No hay una clara ganadora, ya que cada tipo de base de datos se ajusta a requisitos de negocio diferentes. En lo referente a volúmenes ingentes de información, las bases de datos no relacionales representan el camino a seguir.

Hola, Big Data

Suena imponente, ¿pero qué es? Big data hace referencia a conjuntos de datos demasiado masivos o complejos para procesarse a través de software de aplicaciones de procesamiento de datos tradicionales. Estamos hablando de cientos de millones (incluso miles de millones) de filas. Big Data está en todas partes ahora que el almacenamiento es barato y el procesamiento es rápido. La inteligencia artificial (IA) utiliza aprendizaje automático para procesar registros de manera más rápida que cualquier humano.

Dado el bajo costo y la velocidad, los negocios no quieren tirar a la basura los datos. Pero ¿cómo pueden elegir entre bases de datos no relacionales (para gestionar la cantidad y variedad masivas de los datos) frente a las relacionales (para procesar lógica de negocio compleja)? El hecho es que necesitan una arquitectura corporativa para hacerlo todo. Deben integrarse múltiples tecnologías en una única solución integral.

Ahora que sabe un poco de las bases de datos y los retos del Big Data, en la siguiente unidad averiguaremos cómo se puede utilizar Salesforce para almacenar datos.

Estimación de tiempo

Temas

¿Necesita ayuda?

Recursos de CRM Analytics

Recursos de Headless 360 Platform