Diplomado en Data Science y Business Intelligence

Obtén el curso
Diplomado en Data Science y Business Intelligence

El principio de este diplomado es fortalecer en los participantes una actitud analítica basada en datos, gracias a la exploración y práctica de las diferentes técnicas, retos y tendencias de la analítica; todo lo anterior enmarcado en una metodología especializada para proyectos de analítica que le permitirá al participante llevar de manera más natural todo lo aprendido a la práctica organizacional.

Los datos para el análisis vienen de diversas fuentes y, en la mayoría de los casos, con problemas de calidad (datos inválidos, datos repetidos o vacíos, formatos inconsistentes, etc).

Para evitar análisis incorrectos o interpretaciones sesgadas, necesitas realizar una limpieza y transformación de los datos que garanticen su calidad para el análisis. Te enseñaremos a recolectar y comprender los datos, cómo verifcar su calidad y resolver los problemas que se presenten, También conocerás cómo aplicar las transformaciones necesarias para que tu análisis tenga éxito.

OBJETIVOS

* La capacidad de identificar necesidades y oportunidades de negocio y traducirlas en términos de técnicas y métodos de analítica de datos.

* Presentar las diferentes técnicas de analítica de datos contemplando necesidades organizacionales de índole descriptivo y predictivo.

Modulo 1 –  Introducción (6 horas)

  • Conceptos básicos.
  • Relación entre analítica de datos, minería de datos, ciencia de los datos.
  • Casos de éxito: Analítica para la toma de decisiones y competitividad.
  • Metodología para proyectos de analítica.
  • Tendencias en la ciencia de los datos.

Modulo 2  – Estadística, Probabilidad y Python para Ciencia de Datos (8 horas)

RUn acercamiento a los datos para comenzar su comprensión usando medidas estadísticas y distintos tipos de gráficos.

  • Estadística Descriptiva.
  • Regresión lineal simple y múltiple.
  • Distribuciones de Probabilidad.
  • ANOVA y toma de decisiones.
  • Conceptos básicos de Python: I/O, tipos y variables, lógica booleana, Estructuras de control de flujo, funciones, manejo de archivos y estructuras de datos.
  • Ecosistema Python: Numpy, Matplotlib, Pandas para Cargar, preparar, manipular, modelar y analizar datos.

Módulo 3 – Análisis Exploratorio de la Calidad de los Datos (8 horas)

Realizar un análisis de la calidad actual de los datos y descubrir algunas relaciones interesantes entre ellos.

  • Introducción al análisis de calidad de los datos.
  • Análisis de tendencia central, posición y dispersión.
  • Perfilamiento de la calidad de los datos.
  • Agrupamiento de los datos.
  • Descubrir relaciones entre atributos.
  • Ponlo en práctica con Python – Analizando la calidad de los datos.

Modulo 4 – Resolviendo Problemas de Calidad Datos (7 horas)

Realizar la limpieza de los datos para corregir problemas de calidad

  • Técnicas para corregir los problemas de calidad de los datos.
  • Formato de los datos.
  • Tratando atributos con muchos valores iguales o muchos valores diferentes.
  • Tratando con datos duplicados.
  • Tratando con datos redundantes.
  •  Tratando atributos no observables en la decisión.
  • Ponlo en práctica con Python – Datos duplicados.
  • Ponlo en práctica con Python – Limpieza de datos.

Módulo 5 transformando los datos (8 horas)

En este módulo se realizan las transformaciones necesarias para obtener la vista minable y preparar los datos para la analítica.

  • La vista minable o vista analítica de los datos.
  • Aplicando normalización.
  • Convirtiendo variables numéricas a categóricas – Discretizar.
  •  Convirtiendo variables categóricas a numéricas – Numerizar.
  • Generando nuevos atributos a partir de los datos.
  • Manejando datos imbalanceados.
  • Ponlo en práctica con Python – Transformaciones.

 

SEGUNDA CORTE

Modulo 1 –  Business Intelligence y La Sociedad de la Información (8 horas)

  • Definiendo el concepto de Business Intelligence y sociedad de la información.
  • Arquitectura de una solución de Business Intelligence.
  • Business Intelligence en los departamentos de la empresa.
  • Conceptos de Plan Director, Plan Estratégico y Plan de Operativa Anual.
  • Sistemas operacionales y Procesos ETL en un sistema de B.

Modulo 2: Principales Productos de Business Intelligence (5 horas)

  • Cuadros de Mando Integrales (CMI).
  • Sistemas de Soporte a la Decisión (DSS).
  • Sistemas de Información Ejecutiva (EIS).

Modulo 4 –  Tableau (10 horas)

  • ¿Qué es Tableau? Usos y aplicaciones.
  • Tableau Server: Arquitectura y Componentes.
  • Instalación Tableau.
  • Espacio de trabajo y navegación.
  • Conexiones de datos en Tableau.
  • Tipos de Filtros en Tableau.
  • Ordenación de datos, grupos, jerarquías y conjuntos.
  • Tablas y gráficos en Tableau.

Modulo 5 –  Powerbi ( 7 horas)

  • Business Intelligence en Excel.
  •  Herramientas Powerbi.
  • Data Warehouse.
  • Herramientas para el desarrollo de cubos OLAP.

Sea el primero en agregar un comentario.

Por favor, accede para dejar una valoración