Índice

El ciclo interno de data sciences

Dentro del ciclo de proyecto, el data scientist va a gestionar las iteraciones específicas de un ciclo que le pertenece, pero que tendrá que sincronizar cuidadosamente con los ciclos de producción y de decisión del proyecto.

A partir de un cierto estado «funcional» concreto del proyecto, a saber una definición de sus objetivos, diversas exigencias de negocio, cuestiones planteadas, casos de uso, datos disponibles y equipos materiales, el data scientist va a comenzar una nueva iteración.

Tendrá que planificar cuidadosamente esta iteración y tratar de no dejarse llevar por un perfeccionismo o un laxismo matemático, algorítmico o técnico incompatible con los objetivos de su planificación. Planificar una actividad I+D es algo particularmente delicado y requiere mucha atención.

En primer lugar, el data scientist que haya cualificado una necesidad y un contexto va a realizar un estudio más o menos analítico de estos.

1. Revisión detallada del problema planteado

La primera tarea consiste en expresar el problema en términos de técnicas propias de data sciences. Preste atención a no centrarse exclusivamente en las técnicas estadísticas o de machine learning, sino en recorrer la gama de algoritmos a su disposición basándose en los objetivos funcionales enunciados.

En lo relativo a los aspectos machine learning, hay que identificar rápidamente si el problema planteado se traduce ...