Романенко Алексей рассказывает о платформе для анализа больших коллекций данных, состоящей из языка высокого уровня и инфраструктуры для запуска программ и о Hive.
- Pig
- Pig & MapReduce
- Основные возможности Pig
- Компоненты Pig
- Режимы выполнения
- Запуск Pig
- Pig Latin
- Простой пример Pig Latin
- Операции DUMP & Store
- Большой объем данных
- Команда LOAD
- Типы данных для схемы
- Pig Latin: средства диагностики
- Pig Latin: группировка
- Pig Latin: FOREACH
- Pig Latin: функция TOKENIZE
- Pig Latin: оператор FLATTEN
- Pig Latin: WordCount
- Pig Latin: Joins
- Inner Join, пример
- Pig Latin: Outer Join
- Left Outer Join
- Hive
- Архитектура Hive
- Hive интерфейс
- Концепция Hive
- Hive: создание таблицы
- Hive: загрузка данных
- Hive: выполнение запроса
- Hive: удаление таблицы
- Hive: нарушение системы
- Hive: Joins
- Hive: Inner Join
- Hive: Outer Join
- Hive: WordCount