Índice

Ponerse en armonía con los datos

El error más habitual de las personas recién iniciadas en las data sciences resulta ser el uso directo, sin precaución y sin un análisis preliminar de los algoritmos a su disposición sobre conjuntos de datos incomprendidos.

A lo largo de todo el proceso de elaboración de su estudio y con más razón desde su primer contacto con un problema, el data scientist deberá interesarse por evaluar sus datos mediante diversas herramientas estadísticas y visualizarlos desde diversos puntos de vista. Este precio nos permite emitir hipótesis correctas que trataremos de validar o invalidar a lo largo del proceso.

El lector interesado que quiera consultar las fuentes encontrará sin duda mucho interés en consultar la obra de Andrei Kolmogorov, a quien debemos numerosas contribuciones respecto a ciertos conceptos subyacentes a nuestra práctica dentro de las data sciences (formalización de la lógica intuicionista como parte del «cálculo sobre problemas», ley fuerte de los grandes números, axiomatización de las probabilidades mediante el lenguaje de las teorías de la medición, upsilon-entropía que nos permite cualificar los estimadores, aplicación del método de Poincaré al estudio de los equilibrios...).

La interpretación de las herramientas estadísticas requiere asimilar ciertas nociones fundacionales relativas a la probabilidad que vamos a abordar a continuación. ...