-
Notifications
You must be signed in to change notification settings - Fork 0
/
index.qmd
44 lines (21 loc) · 3.65 KB
/
index.qmd
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
# Prólogo {#prologo .unnumbered}
En los últimos años, la cantidad de datos generados en todo el mundo ha crecido exponencialmente, abriendo un mundo de posibilidades para la toma de decisiones en base información valiosa extraída de los datos. En este contexto, la ciencia de datos se ha convertido en una disciplina fundamental para descubrir patrones, tendencias y relaciones ocultas en grandes conjuntos de datos.
## Objetivos del libro
El objetivo principal de este libro es proporcionar a los lectores una guía práctica llevara a cabo un análisis estadístico en ciencia de datos basado en la metodología *Cross-Industry Standard Process for Data Mining* (CRISP-DM), un modelo de proceso de minería de datos de estándar abierto.
Centrado en el uso del lenguaje de programación **R** y el IDE RStudio, este libro pretende proporcionar a los lectores las herramientas necesarias para llevar a cabo un análisis estadístico
con datos de contaminación del aire en la ciudad de Madrid. El enfoque estará orientado hacia la reproducibilidad y la gobernanza del dato, garantizando así la integridad y la transparencia en el análisis.
## Estructura del libro
El libro se divide en tres capítulos:
- Introducción: las bases de un análisis de datos con **R**.
- *Toolkit* para la ciencia de datos con **R**.
- Análisis de datos de contaminación del aire en la ciudad de Madid.
## Enfoque del manual
El enfoque teórico-práctico adoptado en este libro permitirá a los lectores adquirir los conocimientos fundamentales para aplicar eficazmente las técnicas de minería de datos en el contexto de la contaminación atmosférica. Desde la comprensión de los fundamentos de CRISP-DM hasta la aplicación de modelos predictivos y la validación de los resultados, cada paso del proceso se aborda de forma clara y concisa.
Uno de los puntos fuertes de esta obra es su énfasis en la reproducibilidad y la gobernanza de los datos. Se ofrecen ejemplos prácticos en **R** y RStudio que permiten a los lectores aplicar los conceptos teóricos y seguir el proceso de análisis de forma rigurosa y transparente. Además, se aborda el despliegue de los resultados a través de diferentes enfoques, como el desarrollo de una ShinyApp o la generación de informes reproducibles.
<!-- En definitiva, este libro pretende ser una guía accesible y práctica para los interesados en la aplicación de CRISP-DM y la minería de datos espaciales en el contexto de la contaminación atmosférica. Esperamos que este libro proporcione las herramientas necesarias para comprender, analizar y abordar los retos de la calidad del aire, y que inspire a los lectores a seguir explorando nuevas aplicaciones y enfoques en este ámbito en constante evolución. -->
¡Bienvenidos a este apasionante viaje de descubrimiento y análisis de datos sobre contaminación atmosférica utilizando CRISP-DM y el potente lenguaje de programación **R**!
[Gema Fernández-Avilés](https://blog.uclm.es/gemafaviles/)
[Michal Kinel](https://www.linkedin.com/in/michal-kinel/?originalSubdomain=es)
## Licencia y copyright
Guía práctica para el análisis de datos con R mediante la aplicación de la metodología CRISP-DM en **R** © 2023 de [Gema Fernández-Avilés](https://blog.uclm.es/gemafaviles/) y [Michal Kinel](https://www.linkedin.com/in/michal-kinel/?originalSubdomain=es) está licenciado bajo una [licencia de Creative Commons Reconocimiento-NoComercial-CompartirIgual 4.0 Internacional](https://creativecommons.org/licenses/by-nc-sa/4.0/).
Todos los logotipos y marcas comerciales que puedan aparecer en este texto son propiedad de sus respectivos dueños y se incluyen en este texto únicamente con fines didácticos.