Методы распределенной обработки больших объемов данных в Hadoop. Лекция 5. MapReduce в Hadoop (алгоритмы). Романенко Алексей
Романенко Алексей рассказывает о WordCount и Кросс-корреляции. Говорит о реляционных паттернах MapReduce (Selection, Projection, Union, Intersection, Difference, Symmetric Difference, GroupBy и Aggregation, Repartition Join, Replicated Join, TF-IDF). WordCount Среднее значение Distinct…
Поделиться