Diplomado en Data Science y Business Intelligence
El principio de este diplomado es fortalecer en los participantes una actitud analítica basada en datos, gracias a la exploración y práctica de las diferentes técnicas, retos y tendencias de la analítica; todo lo anterior enmarcado en una metodología especializada para proyectos de analítica que le permitirá al participante llevar de manera más natural todo lo aprendido a la práctica organizacional.
Los datos para el análisis vienen de diversas fuentes y, en la mayoría de los casos, con problemas de calidad (datos inválidos, datos repetidos o vacíos, formatos inconsistentes, etc).
Para evitar análisis incorrectos o interpretaciones sesgadas, necesitas realizar una limpieza y transformación de los datos que garanticen su calidad para el análisis. Te enseñaremos a recolectar y comprender los datos, cómo verifcar su calidad y resolver los problemas que se presenten, También conocerás cómo aplicar las transformaciones necesarias para que tu análisis tenga éxito.
OBJETIVOS
* La capacidad de identificar necesidades y oportunidades de negocio y traducirlas en términos de técnicas y métodos de analítica de datos.
* Presentar las diferentes técnicas de analítica de datos contemplando necesidades organizacionales de índole descriptivo y predictivo.
Modulo 1 – Introducción (6 horas)
- Conceptos básicos.
- Relación entre analítica de datos, minería de datos, ciencia de los datos.
- Casos de éxito: Analítica para la toma de decisiones y competitividad.
- Metodología para proyectos de analítica.
- Tendencias en la ciencia de los datos.
Modulo 2 – Estadística, Probabilidad y Python para Ciencia de Datos (8 horas)
RUn acercamiento a los datos para comenzar su comprensión usando medidas estadísticas y distintos tipos de gráficos.
- Estadística Descriptiva.
- Regresión lineal simple y múltiple.
- Distribuciones de Probabilidad.
- ANOVA y toma de decisiones.
- Conceptos básicos de Python: I/O, tipos y variables, lógica booleana, Estructuras de control de flujo, funciones, manejo de archivos y estructuras de datos.
- Ecosistema Python: Numpy, Matplotlib, Pandas para Cargar, preparar, manipular, modelar y analizar datos.
Módulo 3 – Análisis Exploratorio de la Calidad de los Datos (8 horas)
Realizar un análisis de la calidad actual de los datos y descubrir algunas relaciones interesantes entre ellos.
- Introducción al análisis de calidad de los datos.
- Análisis de tendencia central, posición y dispersión.
- Perfilamiento de la calidad de los datos.
- Agrupamiento de los datos.
- Descubrir relaciones entre atributos.
- Ponlo en práctica con Python – Analizando la calidad de los datos.
Modulo 4 – Resolviendo Problemas de Calidad Datos (7 horas)
Realizar la limpieza de los datos para corregir problemas de calidad
- Técnicas para corregir los problemas de calidad de los datos.
- Formato de los datos.
- Tratando atributos con muchos valores iguales o muchos valores diferentes.
- Tratando con datos duplicados.
- Tratando con datos redundantes.
- Tratando atributos no observables en la decisión.
- Ponlo en práctica con Python – Datos duplicados.
- Ponlo en práctica con Python – Limpieza de datos.
Módulo 5 transformando los datos (8 horas)
En este módulo se realizan las transformaciones necesarias para obtener la vista minable y preparar los datos para la analítica.
- La vista minable o vista analítica de los datos.
- Aplicando normalización.
- Convirtiendo variables numéricas a categóricas – Discretizar.
- Convirtiendo variables categóricas a numéricas – Numerizar.
- Generando nuevos atributos a partir de los datos.
- Manejando datos imbalanceados.
- Ponlo en práctica con Python – Transformaciones.
SEGUNDA CORTE
Modulo 1 – Business Intelligence y La Sociedad de la Información (8 horas)
- Definiendo el concepto de Business Intelligence y sociedad de la información.
- Arquitectura de una solución de Business Intelligence.
- Business Intelligence en los departamentos de la empresa.
- Conceptos de Plan Director, Plan Estratégico y Plan de Operativa Anual.
- Sistemas operacionales y Procesos ETL en un sistema de B.
Modulo 2: Principales Productos de Business Intelligence (5 horas)
- Cuadros de Mando Integrales (CMI).
- Sistemas de Soporte a la Decisión (DSS).
- Sistemas de Información Ejecutiva (EIS).
Modulo 4 – Tableau (10 horas)
- ¿Qué es Tableau? Usos y aplicaciones.
- Tableau Server: Arquitectura y Componentes.
- Instalación Tableau.
- Espacio de trabajo y navegación.
- Conexiones de datos en Tableau.
- Tipos de Filtros en Tableau.
- Ordenación de datos, grupos, jerarquías y conjuntos.
- Tablas y gráficos en Tableau.
Modulo 5 – Powerbi ( 7 horas)
- Business Intelligence en Excel.
- Herramientas Powerbi.
- Data Warehouse.
- Herramientas para el desarrollo de cubos OLAP.