Hadoop. Введение в Big Data и MapReduce

Техносфера Group, МГУ им. М.В. Ломоносова. Курс “Методы распределенной обработки больших объемов данных в Hadoop“ Лекция №1 “Введение в Big Data и MapReduce“ Лектор - Алексей Романенко. Что такое «большие данные». История возникновения этого явления­. Необходимые знания и навыки для работы с большими данными. Что такое Hadoop, и где он применяется. Что такое «облачные вычисления», история возникновения и развития технологии. Web 2.0. Вычисление как услуга (utility computing). Виртуализация. Инфраструктура как сервис (IaaS). Вопросы параллелизма. Управление множеством воркеров. Дата-центры и масштабируемость. Типичные задачи Big Data. MapReduce: что это такое, примеры. Распределённая файловая система. Google File System. HDFS как клон GFS, его архитектура.
Back to Top