El objetivo de este libro, que tiene dos enfoques diferentes de lectura, es ofrecer una formación completa y operacional en las data sciences. El primer enfoque permite al lector aprender a generar soluciones completas usando el lenguaje R y su ecosistema y el segundo, le permite adquirir un conocimiento profundo de las data sciences abstrayéndose del detalle del código R, usando para ello un arsenal de herramientas interactivas que hace que no sea necesario codificar en R...
El objetivo de este libro, que tiene dos enfoques diferentes de lectura, es ofrecer una formación completa y operacional en las data sciences. El primer enfoque permite al lector aprender a generar soluciones completas usando el lenguaje R y su ecosistema y el segundo, le permite adquirir un conocimiento profundo de las data sciences abstrayéndose del detalle del código R, usando para ello un arsenal de herramientas interactivas que hace que no sea necesario codificar en R.
De este modo, el autor plantea un recorrido didáctico y profesional que, sin más requisitos previos que un nivel de enseñanza secundaria en matemáticas y una gran curiosidad, permita al lector:
• integrarse en un equipo de data scientists,
• abordar artículos de investigación en IA o data sciences,
• desarrollar en lenguaje R,
• y poder conversar con un equipo de proyecto que incluya data scientists.
Este libro no se limita a los algoritmos clásicos del Machine Learning (arboles de decisión, redes neuronales, etc.), sino que aborda diversos aspectos importantes como el tratamiento del lenguaje natural, las series temporales, la lógica difusa y la manipulación de imágenes.
No se evitan los aspectos prácticos o complicados. El libro enseña el acceso a las bases de datos, los procesos paralelos, la programación funcional y la orientación a objetos, la creación del API, la compartición de resultados de análisis con R Markdown y los dashboard Shiny, el estudio de las representaciones cartográficas e incluso, la implementación del Deep Learning con TensorFlow-2 y Keras.
Los lectores también demandaban que en esta tercera edición, se presentara un introducción al lenguaje Python y su interfaz con R, así como la instalación de una aplicación R/shiny que fuera accesible en internet, a través de un servidor Linux alojado en un cloud profesional. Una extensión a la utilización de R para los cálculos numéricos y matemáticos para la ingeniería, con el mismo espíritu que MatLab y el uso básico de una herramienta de prototipado rápido de modelos de Machine Learning (BigML) en «point and click», también permitirán al lector que no quiera utilizar R producir modelos de predicción sin codificar.
La dinámica del libro acompaña al lector paso a paso en la introducción al mundo de las data sciences y la evolución de sus competencias teóricas y prácticas. El manager podrá recorrer el libro después de haber leído atentamente el bestiario de las data sciences de la introducción, que presenta el tema ahorrando notación matemática o formalismos disuasorios, sin vulgarización excesiva.
Los programas R que se describen en el libro, se pueden descargar en el sitio web www.ediciones-eni.com y se pueden ejecutar paso a paso.
¡Nuevo! Rondas de preguntas disponibles con la versión online.
Estrategias en función de la naturaleza de los datos
1. Conteos
2. Proporciones
3. Variable de respuesta binaria
4. Datos que inducen un modelo mixto (mixed effect)
5. Gráficos
6. Análisis de supervivencia (survival analysis)
Filtros (sobre imágenes)
Distancias
Trucos y pequeños consejos
1. Sobre las pruebas
2. Gestión de las variables
3. Análisis y manipulación de resultados
a. Residuos
b. Manipulación de los modelos
Paquetes y temas para estudiar
1. Crear su propio paquete
2. Reglas de asociación
3. Exportar un modelo
4. Tensores
5. SVM para la detección de novedades (noveltydetection)
Vocabulario y «tricks of the trade»
1. Complementos sobre las bases del machine learning
2. Complementos sobre los aspectos bayesianos
3. Vocabulario (del inglés) de los modelos gaussianos
Algoritmos que se deben estudiar
Algunas formulaciones del álgebra lineal
Bibliografía
Conclusión
Conclusión
Eva LAUDE
Eva LAUDE desarrolla sus actividades de consultoría y gestión de proyectos en Data science en diversos sectores, como el INSEE, empresas de biotecnología o ESNs. Además de sus actividades profesionales como desarrolladora de R-Shiny, organiza data-challenges en varias organismos y escuelas donde trabaja como profesora asociada. Geek y apasionada de R, DataViz y Data Journalisme, no duda en compartir sus conocimientos con numerosos tutoriales y participa en la revista académica Management&Data Science.
Henri LAUDE es un reconocido profesional de las Computer Sciences. Ha supervisado numerosos trabajos de I+D en data sciences, IA, Fintech, detección de fraude y despliegue de arquitecturas Big Data. Es cofundador de Advanced Research Partners, donde impulsa el diseño de algoritmos altamente innovadores. Premiado en varias ocasiones por sus soluciones innovadoras, como en el Data Intelligence Forum con una IA especializada en inteligencia económica llamada DxM (por Deus eX Machina), está involucrado en proyectos tan variados como el desarrollo de un exoesqueleto inteligente o la IA de ciber protection.