Соловьев Дмитрий рассказывает, как анализируя контент, выявлять спам-сайты.
- Что мы хотим получить
- Зачем?
- Методы воздействия на поисковый механизм
- Классификация воздействия на поисковый механизм
- Простые функции
- Карта классов (SOM)
- Что делать дальше
- Спам или нет?
- Причины:
- Характеристики сайта
- Результаты
- Источники данных
- Текстовая классификация
- Недостатки подхода
- Трудные случаи
- Результаты текстовой классификации
- Добавляем данные
- Что получилось?
- Классификация запросов