Universidad de los Andes
Integración y preparación de datos
Universidad de los Andes

Integración y preparación de datos

This course is part of Ciencia de datos​ Specialization

Taught in Spanish

Maria Del Pilar Villamil Giraldo
John Calvo Martínez

Instructors: Maria Del Pilar Villamil Giraldo

5,489 already enrolled

Included with Coursera Plus

Course

Gain insight into a topic and learn the fundamentals

4.9

(46 reviews)

|

95%

Beginner level

Recommended experience

19 hours (approximately)
Flexible schedule
Learn at your own pace

What you'll learn

  • Comprender qué proceso de exploración, transformación e integración de datos, se requiere para formular una solución a un problema centrado en datos.

  • Comprender y aplicar técnicas para explorar, transformar e integrar fuentes de datos estructuradas y no estructuradas.

  • Identificar y solucionar problemas en los datos relacionados con su calidad.

Details to know

Shareable certificate

Add to your LinkedIn profile

Assessments

9 quizzes

Course

Gain insight into a topic and learn the fundamentals

4.9

(46 reviews)

|

95%

Beginner level

Recommended experience

19 hours (approximately)
Flexible schedule
Learn at your own pace

See how employees at top companies are mastering in-demand skills

Placeholder

Build your subject-matter expertise

This course is part of the Ciencia de datos​ Specialization
When you enroll in this course, you'll also be enrolled in this Specialization.
  • Learn new concepts from industry experts
  • Gain a foundational understanding of a subject or tool
  • Develop job-relevant skills with hands-on projects
  • Earn a shareable career certificate
Placeholder
Placeholder

Earn a career certificate

Add this credential to your LinkedIn profile, resume, or CV

Share it on social media and in your performance review

Placeholder

There are 4 modules in this course

Bienvenido al primer módulo del curso. En este módulo trabajaremos sobre la metodología para realizar proyectos centrados en datos, en especial de ciencia de datos. Adicionalmente, profundizaremos en la etapa de entendimiento de los datos, para lo cual comprenderemos temas relacionados con perfilamiento, exploración de datos y visualización de los mismos. De igual manera, introduciremos el caso del proyecto y tendremos una serie de videos en diferentes sectores que espero te ayuden a lograr los objetivos del módulo y disfrutarlo.

What's included

7 videos10 readings3 quizzes1 discussion prompt3 plugins

Bienvenido al segundo módulo del curso, centrado en la forma de preparar datos para mejorar su calidad. En este módulo tendrás la oportunidad de entender qué es calidad de datos, describiremos algunas de las dimensiones de calidad más frecuentes en fuentes de datos y las acompañaremos de videos, tutoriales y actividades que te permitirán comprender estas temáticas, entender los problemas que se generan en los datos relacionados con las dimensiones de calidad y, algunas formas de solucionarlos.

What's included

4 videos7 readings2 quizzes2 discussion prompts5 plugins

Hola, en este módulo nos centraremos en la integración de datos. Con ello en mente, nos enfocaremos en las diferentes formas de unir dos o más fuentes de información con el fin de generar análisis y conclusiones que no habríamos podido obtener con información fragmentada. Allí recae el punto de importancia de aprender a integrar datos, pues la información integrada representa un valor para nuestros proyectos de Ciencias de Datos. Es por ello que en este módulo vamos a ver qué hay diferentes formas de unir diferentes fuentes de información, como lo son los joins, union y merge. Además, veremos los conceptos de lookup y de filtrado condicional de información en Pandas. Podrás aplicar todo lo aprendido en las actividades del módulo y en los ejercicios propuestos. ¡Espero te guste!

What's included

4 videos6 readings2 quizzes2 discussion prompts3 plugins

Bienvenido al cuarto y último modulo del curso. En este módulo veras como transformar datos, con el fin de tener un conjunto de datos que podamos trabajar fácilmente al momento de entrenar nuestros modelos de predicción. Vas a poder seleccionar y transformar atributos mediante técnicas como la normalización, la combinación de atributos para generar nuevas variables, la reducción de dimensionalidad y la transformación de texto. Tendrás la oportunidad de reforzar tu aprendizaje mediante ejercicios prácticos y tutoriales utilizando Python.

What's included

4 videos8 readings2 quizzes1 discussion prompt4 plugins

Instructors

Instructor ratings
5.0 (6 ratings)
Maria Del Pilar Villamil Giraldo
Universidad de los Andes
3 Courses5,980 learners

Offered by

Recommended if you're interested in Data Analysis

Why people choose Coursera for their career

Felipe M.
Learner since 2018
"To be able to take courses at my own pace and rhythm has been an amazing experience. I can learn whenever it fits my schedule and mood."
Jennifer J.
Learner since 2020
"I directly applied the concepts and skills I learned from my courses to an exciting new project at work."
Larry W.
Learner since 2021
"When I need courses on topics that my university doesn't offer, Coursera is one of the best places to go."
Chaitanya A.
"Learning isn't just about being better at your job: it's so much more than that. Coursera allows me to learn without limits."

New to Data Analysis? Start here.

Placeholder

Open new doors with Coursera Plus

Unlimited access to 7,000+ world-class courses, hands-on projects, and job-ready certificate programs - all included in your subscription

Advance your career with an online degree

Earn a degree from world-class universities - 100% online

Join over 3,400 global companies that choose Coursera for Business

Upskill your employees to excel in the digital economy

Frequently asked questions