1. Libros y videos
  2. Diseño de bases de datos
  3. Introducción
Extrait - Diseño de bases de datos Del análisis a la implementación
Extractos del libro
Diseño de bases de datos Del análisis a la implementación Volver a la página de compra del libro

Introducción

¿Qué es una base de datos?

Vamos a introducir conceptos básicos, comenzando por explicar qué es una base de datos, cuáles son los diferentes tipos de bases de datos y sus características principales, así como las funciones de las personas que trabajan con las bases de datos.

Desde un punto de vista formal, una base de datos se puede definir en términos generales como un sistema informático, que almacena una gran cantidad de datos relacionados y estructurados.

Por lo tanto, aquí hay tres características importantes de una base de datos que debemos recordar:

  • Una gran cantidad de datos: se crea una base de datos teniendo en cuenta la necesidad de almacenar una gran cantidad de información. Una base de datos pequeña puede contener cientos o miles de registros, mientras que para que una base de datos se considere grande, estaríamos hablando de cientos de miles o millones de registros. 

    El criterio sobre cómo de grande o pequeña es una base de datos es relativo, pero la idea es que una base de datos está diseñada para almacenar grandes cantidades de datos, lo hagamos o no. De la misma manera que un avión comercial de pasajeros fue diseñado para volar con un gran número de personas, aunque podría volar con menos pasajeros o con ninguno, solo afectaría a su eficiencia.

Un avión comercial de gran tamaño...

Tipos de bases de datos

Existen diferentes tipos de bases de datos que se adaptan a nuestras necesidades. Las bases de datos se pueden clasificar de diferentes maneras en función de sus características:

  • bases de datos transaccionales,

  • almacenes de datos (Data Warehouses),

  • lagos de datos (Data Lakes),

  • datamarts,

  • bases de datos centralizadas,

  • bases de datos distribuidas,

  • bases de datos espaciales,

  • bases de datos de investigación.

Esta lista no es exhaustiva y no sigue un orden particular en términos de clasificación. Simplemente sirve para proporcionar una visión general de los diferentes tipos de bases de datos que existen para que el lector pueda comprender mejor los conceptos que se presentarán a continuación.

1. Bases de datos transaccionales

Las bases de datos transaccionales son el tipo de base de datos que más se utiliza. Como su nombre indica, se basan en el uso de un gran número de transacciones.

Una transacción es una operación de base de datos o un conjunto de operaciones de base de datos, realizadas por el mismo usuario. Por ejemplo, un usuario que realiza una transferencia bancaria implica una transacción en la base de datos del banco, en la que se realiza una solicitud (SELECT), un cambio (UPDATE) y una llamada a un proceso externo para enviar el dinero a la cuenta bancaria de destino.

Podríamos decir que la principal característica de este tipo de bases de datos es que recibe una gran cantidad de transacciones. Es decir, existe un gran número de usuarios que realizan operaciones más o menos engorrosas en relación con el uso de la base de datos.

Las características de una base de datos transaccional son las siguientes:

  • Rendimiento orientado a muchas operaciones rápidas: el objetivo es que las transacciones realizadas por los usuarios se completen lo más rápido posible. Normalmente, las bases de datos transaccionales deben ser capaces de realizar muchas operaciones a la vez.

  • Disponibilidad: la base de datos debe estar disponible durante el mayor tiempo posible. El tiempo de actividad del 100% no es realista, pero cuanto más nos acerquemos a ese valor, mejor será nuestra base de datos en términos de disponibilidad.

  • Concurrencia: el objetivo principal de este tipo de bases de datos, como su nombre indica, es permitir que se realicen un gran número de transacciones al mismo...

Los roles de la ciencia de datos

La ciencia de datos es un factor muy importante a la hora de crear un sistema de información. Podemos disponer de una gran variedad de sistemas: un sistema informático hospitalario, una biblioteca, el sistema informático para la gestión de un aeropuerto, etc. Los elementos pueden ser más o menos diversos, pero salvo algunas excepciones, hay un elemento que siempre tendrán en común: la presencia de datos.

Estudiar estos datos es precisamente el objetivo de la ciencia de datos. Son todas las técnicas, estrategias, actores, métodos, etc. que se han ido creando y perfeccionando a lo largo de los años para poder gestionar y explotar estos datos en función de las necesidades de los usuarios.

En primer lugar, los siguientes roles están directamente relacionados con las bases de datos:

  • analista de datos,

  • ingeniero de datos,

  • arquitecto de datos,

  • científico de datos,

  • administrador de bases de datos,

  • operador de base de datos,

  • desarrollador de bases de datos.

En segundo lugar, los siguientes roles requieren conocimiento de bases de datos sin que ésta sea su función principal, por lo que se podría decir que están relacionadas indirectamente:

  • desarrollador de aplicaciones,

  • gerente de proyectos,

  • gerente de negocios,

  • director de servicios informáticos.

Veremos cada uno de estos roles en detalle. Ten en cuenta que estos son solo algunos ejemplos para hacerte una idea de la diversidad de roles que se pueden desempeñar en la ciencia de datos. Esta no es una lista exhaustiva, puede haber otras y el uso de nuevos métodos y tecnologías seguramente sacará a la luz nuevos roles en el futuro.

1. Analista de datos

El papel del analista de datos, como su nombre indica, es analizar un conjunto de datos. Este conjunto de datos puede pertenecer a un Datamart, como hemos visto anteriormente, en el caso de grandes organizaciones que cuentan con este tipo de arquitectura.

En el caso de estructuras más pequeñas, el analista de datos tendrá que extraer sus propios datos de la base de datos de producción para poder trabajar con ellos. 

El analista de datos no necesita tener un perfil técnico, sino que su trabajo consistirá en analizar los datos preparados correspondientes a un campo concreto, que no tiene por qué ser necesariamente informático....