Hadoop. MapReduce (алгоритмы)
Техносфера Group, МГУ им. М.В. Ломоносова.
Курс “Методы распределенной обработки больших объемов данных в Hadoop“
Лекция №5 “MapReduce в Hadoop (алгоритмы)“
Лектор - Алексей Романенко.
WordCount (baseline, In-mapper combining, среднее значение, различающиеся значения). Кросс-корреляция (pairs, stripes). Реляционные паттерны MapReduce (Selection, Projection, Union, Intersection, Difference, Symmetric Difference, GroupBy и Aggregation, Repartition Join, Replicated Join, TF-IDF).
Слайды лекции htt