Кацев Илья рассказывает о технических задачах, которые необходимо решить для построения такого краулера и об экспериментальном проекте под названием «Роботестер», который разрабатывается Яндексом.
- Вступление
- Идеальное будущее
- Краулеры
- Deep Web
- Очень сложные формы
- Crawljax
- Используем текст
- Веб для незрячих
- Признаки
- Стратегии краулинга
- AutoBlackTest
- Ходим на один шаг
- Общие принципы
- Анализ страницы
- WebDriver
- Город
- Анализ страницы
- Покрывающие наборы
- Реализация
- Пример
- Запрещенные слова
- Проверки
- Как пользоваться
- Добавили поле
- И наконец
- Менеджерское
- Будущее: обучение
- Еще