Manipulating big data distributed over a cluster using functional concepts is rampant in industry, and is arguably one of the first widespread industrial uses of functional ideas. This is evidenced by the popularity of MapReduce and Hadoop, and most recently Apache Spark, a fast, in-memory distributed collections framework written in Scala. In this course, we'll see how the data parallel paradigm can be extended to the distributed case, using Spark throughout. We'll cover Spark's programming model in detail, being careful to understand how and when it differs from familiar programming models, like shared-memory parallel collections or sequential Scala collections. Through hands-on examples in Spark and Scala, we'll learn when important issues related to distribution like latency and network communication should be considered and how they can be addressed effectively for improved performance.
Ofrecido Por


Big Data Analysis with Scala and Spark (Scala 2 version)
École Polytechnique Fédérale de LausanneAcerca de este Curso
3306 vistas recientes
Fechas límite flexibles
Restablece las fechas límite en función de tus horarios.
Certificado para compartir
Obtén un certificado al finalizar
100 % en línea
Comienza de inmediato y aprende a tu propio ritmo.
Nivel intermedio
Aprox. 28 horas para completar
Inglés (English)
¿Podría tu empresa beneficiarse de la capacitación de los empleados en las habilidades más demandadas?
Prueba Coursera para negociosHabilidades que obtendrás
- Scala Programming
- Big Data
- Apache Spark
- SQL
Fechas límite flexibles
Restablece las fechas límite en función de tus horarios.
Certificado para compartir
Obtén un certificado al finalizar
100 % en línea
Comienza de inmediato y aprende a tu propio ritmo.
Nivel intermedio
Aprox. 28 horas para completar
Inglés (English)
¿Podría tu empresa beneficiarse de la capacitación de los empleados en las habilidades más demandadas?
Prueba Coursera para negociosOfrecido por
Programa - Qué aprenderás en este curso
12 horas para completar
Getting Started + Spark Basics
12 horas para completar
7 videos (Total 105 minutos), 6 lecturas, 3 cuestionarios
7 horas para completar
Reduction Operations & Distributed Key-Value Pairs
7 horas para completar
4 videos (Total 59 minutos)
1 hora para completar
Partitioning and Shuffling
1 hora para completar
4 videos (Total 57 minutos)
8 horas para completar
Structured data: SQL, Dataframes, and Datasets
8 horas para completar
5 videos (Total 133 minutos)
Preguntas Frecuentes
¿Cuándo podré acceder a las lecciones y tareas?
¿Qué recibiré si compro el Certificado?
¿Hay ayuda económica disponible?
¿Tienes más preguntas? Visita el Centro de Ayuda al Estudiante.