Воропаев Алексей рассказывает о логических схемах поисковых машин, поисковых кластерах и индексации. Говорит о частотной матрице и лагорифмическом взвешивании. Объясняет методы оптимизации текстового ранжирования. Рассказывает об обратной связи по ревалентности, бинарной вероятности моделей и о бейсовых сетях в задаче ранжирования.
- Архитектура Web-поиска
- С чего начинается поиск
- Поисковый кластер
- Булев поиск
- Вычисление веса
- Недостатки ранжирования коэффициентом Жаккара
- Частота термина
- Лагорифмическое взвешивание
- Корпусная и документная частоты
- Булевская – частотная – весовая матрица
- Документы как векроры
- Документы с большим количеством терминов из запроса
- Статические веса, общий вес
- Эшелоны
- Кластеризация индекса
- Параметрические индексы и зоны
- Поля (числовые зоны)
- Индексы для зон
- Компактность вхождения
- Вероятностный поиск
- Использование языковых моделей при поиске
- Варианты сравнения моделей
- Правдоподобие запроса и документа
- Сравнение моделей
- Обратная связь по релевантности
- Бинарная вероятностная модель
- Байесовы сети в задаче ранжирования