- ¿Qué es Big Data?
- La era de las grandes cantidades de información: historia del big data
- La importancia de almacenar y extraer información
- Big Data enfocado a los negocios
- Open Data
- Información pública
- IoT (Internet of Things - Internet de las cosas)
- Diagnóstico inicial
- Diseño del proyecto
- Proceso de implementación
- Monitorización y control del proyecto
- Responsable y recursos disponibles
- Calendarización
- Alcance y valoración económica del proyecto
- Definiendo el concepto de Business Intelligence y sociedad de la información
- Arquitectura de una solución de Business Intelligence
- Business Intelligence en los departamentos de la empresa
- Conceptos de Plan Director, Plan Estratégico y Plan de Operativa Anual
- Sistemas operacionales y Procesos ETL en un sistema de BI
- Ventajas y Factores de Riesgos del Business Intelligence
- Cuadros de Mando Integrales (CMI)
- Sistemas de Soporte a la Decisión (DSS)
- Sistemas de Información Ejecutiva (EIS)
- ¿Qué es Data Science?
- Historia del Data Science
- ¿Qué función tiene un Científico de datos?
- Data Science vs Big Data. Principales diferencias
- Hadoop
- Pig
- Hive
- Sqoop
- Flume
- Spark Core
- Spark 2.0
- Fundamentos de Streaming Processing
- Spark Streaming
- Kafka
- Pulsar y Apache Apex
- Implementación de un sistema real-time
- Hbase
- Cassandra
- MongoDB
- NeoJ
- Redis
- Berkeley DB
- Lucene + Solr
- Arquitectura Lambda
- Arquitectura Kappa
- Apache Flink e implementaciones prácticas
- Druid
- ElasticSearch
- Logstash
- Kibana
- Amazon Web Services
- Google Cloud Platform
- Administración e Instalación de clusters: Cloudera y Hortonworks
- Optimización y monitorización de servicios
- Seguridad: Apache Knox, Ranger y Sentry
- Herramientas de visualización: Tableau y CartoDB
- Librerías de Visualización: D, Leaflet, Cytoscape
- ¿Qué es la ciencia de datos?
- Herramientas necesarias para el científico de datos
- Data Science & Cloud Computing
- Aspectos legales en Protección de Datos
- Introducción
- El modelo relacional
- Lenguaje de consulta SQL
- MySQL: Una base de datos relacional
- Obtención y limpieza de los datos (ETL)
- Inferencia estadística
- Modelos de regresión
- Pruebas de hipótesis
- Inteligencia Analítica de negocios
- La teoría de grafos y el análisis de redes sociales
- Presentación de resultados
- ¿Qué es una base de datos NoSQL?
- Bases de datos Relaciones Vs Bases de datos NoSQL
- Tipo de Bases de datos NoSQL: Teorema de CAP
- Sistemas de Bases de datos NoSQL
- ¿Qué es MongoDB?
- Funcionamiento y uso de MongoDB
- Primeros pasos con MongoDB: Instalación y shell de comandos
- Creando nuestra primera Base de Datos NoSQL: Modelo e Inserción de Datos
- Actualización de datos en MongoDB: Sentencias set y update
- Trabajando con índices en MongoDB para optimización de datos
- Consulta de datos en MongoDB
- ¿Qué es Hadoop? Relación con Big Data
- Instalación y configuración de insfraestructura y ecosistema Hadoop
- Sistema de archivos HDFS
- MapReduce con Hadoop
- Apache Hive
- Apache Hue
- Apache Spark
- ¿Qué es Weka?
- Técnicas de Data Mining en Weka
- Interfaces de Weka
- Selección de atributos
- Una aproximación a Pentaho
- Soluciones que ofrece Pentaho
- MongoDB & Pentaho
- Hadoop & Pentaho
- Weka & Pentaho
- Introducción a la minería de datos y el aprendizaje automático
- Proceso KDD
- Modelos y Técnicas de Data Mining
- Áreas de aplicación
- Minería de textos y Web Mining
- Data mining y marketing
- Aproximación al concepto de DataMart
- Bases de datos OLTP
- Bases de Datos OLAP
- MOLAP, ROLAP & HOLAP
- Herramientas para el desarrollo de cubos OLAP
- Visión General: ¿Por qué DataWarehouse?
- Estructura y Construcción
- Fases de implantación
- Características
- Data Warehouse en la nube
- Tipos de herramientas para BI
- Productos comerciales para BI
- Productos Open Source para BI
- Beneficios de las herramientas de BI
- Definición de KPIs
- KPI, CSF y metas
- Principales KPIS
- Ejemplos de KPIS
- Supuesto práctico: Cálculo de KPI con Excel
- Introducción a los cuadros de mando y dashboard
- Estrategias para la creación de un cuadro de mando
- Dashboard en Excel o Google Analytics
- Aplicaciones gratuitas
- Aplicaciones propietarias
- Introducción a Python
- ¿Qué necesitas?
- Librerías para el análisis de datos en Python
- MongoDB, Hadoop y Python: Dream Team del Big Data
- Introducción a R
- ¿Qué necesitas?
- Tipos de datos
- Estadística Descriptiva y Predictiva con R
- Integración de R en Hadoop
- ¿Qué es la visualización de datos?
- Importancia y herramientas de la visualización de datos
- Visualización de datos: Principios básicos
- ¿Qué es Tableau? Usos y aplicaciones
- Tableau Server: Arquitectura y Componentes
- Instalación Tableau
- Espacio de trabajo y navegación
- Conexiones de datos en Tableau
- Tipos de filtros en Tableau
- Ordenación de datos, grupos, jerarquías y conjuntos
- Tablas y gráficos en Tableau
- Fundamentos D3
- Instalación D3
- Funcionamiento D3
- SVG
- Tipos de datos en D3
- Diagrama de barras con D3
- Diagrama de dispersión con D3
- Visualización de datos
- Tipologías de gráficos
- Fuentes de datos
- Creación de informes
- Instalación y arquitectura
- Carga de datos
- Informes
- Transformación y modelo de datos
- Análisis de datos
- Introducción a Power BI
- Instalación de Power BI
- Modelado de datos
- Visualización de datos
- Dashboards
- Uso compartido de datos
- CartoDB
- ¿Qué es CARTO?
- Carga y uso de datos. Tipos de análisis
- Programación de un visor con la librería CARTO.js
- Uso de ejemplos y ayudas de la documentación de la API