Hola a todos. Yo soy MarÃa del Pilar Villamil, profesora de ingenierÃa de sistemas y computación de la Universidad de los Andes y junto con John Calvo, experto en analÃtica y egresado de la MaestrÃa de IngenierÃa de Sistemas y Computación, también de la Universidad de los Andes, queremos darte la bienvenida al curso de "Integración y Preparación de Datos", de la especialización de Ciencia de datos. Es grato para nosotros tenerte en este curso y esperamos que aproveches al máximo esta experiencia. Este curso fue diseñado pensando en brindarte herramientas que te permitan entender conjuntos de datos, utilizar técnicas para explorar, transformar y llevar los datos de un formato a otro formato apropiado para realizar análisis; entender la relación entre los procesos para la preparación de datos y los objetivos de los análisis; y principalmente, estar en capacidad de aplicar todo lo que vemos acá en el contexto real del desarrollo de proyectos centrados en datos. John, ¿cómo lograrlo? Hola. Creemos que si apropias los objetivos de este curso, debes ser capaz de comprender que este proceso de integración, exploración y transformación de datos se requiere para formular una solución a un problema centrado en datos, de una organización o una oportunidad identificada. Aplicar técnicas para integrar fuentes de datos estructuradas, explorarlas y prepararlas con el fin de llevarlas a un formato adecuado para los análisis a realizar. Utilizar herramientas y lenguajes como Python, usado para el manejo de datos por profesionales como los cientÃficos de datos y los analistas de negocio, e identificar y solucionar problemas en los datos relacionados con su calidad. Con las herramientas que te brindaremos, llegarás a la meta y aumentarás las posibilidades de ser exitoso en este estilo de proyectos. Ahora bien, si estás viendo este vÃdeo, quizás ya viste los dos cursos previos a este de la especialización de Ciencia de datos y debes ser consciente de las posibilidades que se te abrirán, fortaleciendo tu formación en temáticas relacionadas con el aprovechamiento de los datos en el contexto de empresas puntuales o de la sociedad. En este curso, trabajaremos el caso de órdenes de productos para el sector retail y datos relacionados con empleados de una organización, disponibles en la dependencia de manejo de personal. Este proyecto lo realizaremos de forma iterativa a lo largo del curso y te permitirá aplicar y apropiar los conceptos vistos en los recursos propuestos de forma inmediata, con el objetivo de aprovechar al máximo el curso y relacionarlo con un proyecto en un entorno del sector real. El gran reto será que a partir de los datos y el contexto que te proponemos, logres entender bien el proceso que generó los datos y asà familiarizarte con los datos, detectar posibles problemas que puedan afectar los análisis que hagas y sugerir alternativas para corregirlos, al mismo tiempo que reportar estos hallazgos para que la organización dueña de los mismos pueda entender la causa del problema y de ser posible, iniciar su corrección En los últimos dos módulos del curso, te propondremos soluciones y opciones para integrar nuevas fuentes de datos, continuar con los análisis que hiciste en los primeros módulos para entenderlos y adaptarlos si se requiere, y entraremos al mundo del manejo de texto y terminaremos con unas nuevas transformaciones a los datos que se requieren para aplicar análisis un poco más sofisticados relacionados con aprendizaje de máquina. Pero, Pilar, ¿cómo aprovechamos al máximo el curso? Para hacerlo, te sugerimos a nivel de los recursos, entenderlos en detalle. Pensar en otras alternativas para resolver los retos propuestos. Ser consciente de la metodologÃa que seguimos. Y principalmente, articularlo con un contexto real para que estés en capacidad de abstraer los conceptos y competencias que esperamos desarrolles, para aplicar lo visto y obtener resultados de calidad. Recuerda que tendremos cuestionarios formativos y sumativos para que valides rápidamente tu aprendizaje. Cerramos este video invitándote a querer ser parte del cambio de nuestra sociedad y aportando en el desarrollo de proyectos centrados en datos, en particular en la comprensión de los datos disponibles para un proyecto y su preparación, lo que es fundamental en cualquier proyecto de este estilo. Bienvenido y a dar lo mejor de ti.