Что нового?

Практический курс по Big Data. Часть 2. Spark: from zero to hero [bigdata team]

Статус
В этой теме нельзя размещать новые ответы.

Майкл

Админ
Регистрация
Дек 12, 2019
Сообщения
165,586
ЧАСТЬ 1 - HDFS || ЧАСТЬ 2 - Spark (ВЫ ТУТ) || ЧАСТЬ 3 - Kafka, RT, NoSQL, Data layout

На протяжении этой части курса вы будете работать со Spark: от основных терминов и RDD до Spark DataFrames и оптимизации Spark вычислений.

В этом модуле вы изучите:
▶ cхема выполнения задачи в Spark;
▶ основные термины Spark (job, task, stage);
▶ представление вычислений в виде графа. Spark Python API. Spark RDD API;
▶ Broadcast-сообщения и счетчики.
▶ взаимодействие Hive и Spark SQL;
▶ отличия DF от...



ДОСТУП К СКЛАДЧИНАМ
 
Статус
В этой теме нельзя размещать новые ответы.
Сверху