Numeralis
Подписаться
Numeralis
Numeralis
  • FAQ
  • Создатели
  • Предметный указатель
  • Реклама
  • Информационное спонсорство
  • О нас
  • Контакты
  • Технопарк Mail.ru Group

Современные методы и средства построения систем информационного поиска. Лекция 3. Основы обработки текста. Андреев Игорь

  • 30 Май 2015
  • Юлия Ласкевич
Total
0
Shares
0
0
0

Андреев Игорь рассказывает об основах обработки текста.

  1. Критерии документа, кодировки
  2. Уровни лингвистического анализа
  3. Токены и термины
  4. Детекция языка: графематический, N-граммный и лексический подходы
  5. Нормализация
  6. Проблемы токенизации
  7. Наличие и отсутствие пробелов
  8. Китайский, японский, арабский языки
  9. Ударение и диакритика
  10. Классы эквивалентности
  11. Понижение регистра
  12. Стоп-слова
  13. Лемматизация
  14. Стемминг
  15. Предиктор
  16. Виды языков
  17. Статистическое снятие омонимии
  18. Разбиение текста на предложения
  19. Расширение поискового запроса
Total
0
Shares
Share 0
Tweet 0
Pin it 0
Метки материала
  • Андреев Игорь
  • Информационный поиск
  • обработка текста
  • Технопарк Mail.ru Group
Юлия Ласкевич

Люблю учиться, читать и делиться новостями. Зиму провожу в горах, занимаясь самообразованием и катаясь на лыжах, а летом возвращаюсь к морю. Но никогда не покину зону стабильного интернета, ведь рискую пропустить свежее событие, которое происходит где-то рядом…

Предыдущий материал
  • Технопарк Mail.ru Group

Современные методы и средства построения систем информационного поиска. Лекция 2. Лингвистика. Андреев Игорь

  • 30 Май 2015
  • Юлия Ласкевич
Смотреть материал
Следующий материал
  • Технопарк Mail.ru Group

Современные методы и средства построения систем информационного поиска. Лекция 5. Языковые модели. N-граммы. Цепи Маркова. Воропаев Алексей

  • 30 Май 2015
  • Юлия Ласкевич
Смотреть материал
Вас также может заинтересовать
Смотреть материал
  • Посмотреть
  • Технопарк Mail.ru Group

Смыслопоиск. Пять историй о карьере и образовании IT-шника. Волошин Дмитрий

  • Юлия Ласкевич
  • 21 Ноя 2015
Смотреть материал
  • Посмотреть
  • Технопарк Mail.ru Group

Мобильная разработка. Лекция 6. Styles G Themes Preferences. Кильдиев Рустам

  • Юлия Ласкевич
  • 21 Ноя 2015
Смотреть материал
  • Посмотреть
  • Технопарк Mail.ru Group

Многопоточное программирование на языке С/С++. Лекция 5. Калугин-Балашов Дмитрий

  • Юлия Ласкевич
  • 21 Ноя 2015
Смотреть материал
  • Посмотреть
  • Технопарк Mail.ru Group

Многопоточное программирование на языке С/С++. Лекция 4. Балашов-Калугин Дмитрий

  • Юлия Ласкевич
  • 15 Ноя 2015
Смотреть материал
  • Посмотреть
  • Технопарк Mail.ru Group

Базовое администрирование Linux. Лекция 6. Молчанов Дмитрий

  • Юлия Ласкевич
  • 15 Ноя 2015
Смотреть материал
  • Посмотреть
  • Технопарк Mail.ru Group

20 ошибок при создании IT-компании. Щукин Станислав

  • Юлия Ласкевич
  • 15 Ноя 2015
Смотреть материал
  • Посмотреть
  • Технопарк Mail.ru Group

Работа с индексами: лучшие практики для MySQL. Зайцев Петр

  • Юлия Ласкевич
  • 15 Ноя 2015
Смотреть материал
  • Посмотреть
  • Технопарк Mail.ru Group

Подготовительная программа по программированию на С/С++. Лекция 7. Модульное и обобщенное программирование. Глазкова Валентина

  • Юлия Ласкевич
  • 15 Ноя 2015

Добавить комментарий Отменить ответ

Ваш адрес email не будет опубликован. Обязательные поля помечены *

Метки
Apple C++ Party 2014 CNews CodeFreeze facebook Google mail.ru Mail.Ru Group Microsoft Netpeak seo smm TrueConf Академия Яндекса Безопасность интернет-приложений Вебинары Воронцов Константин Гроховский Леонид Конференции Костин Евгений Машинное обучение Мероприятия Обучающий центр CyberMarketing Онлайн Академия Zillion Петров Алексей Пресс-релизы Роскомнадзор Россия Семинар Технопарк Mail.ru Group ТопЭксперт Управление продуктом ШРИ в Москве ШРИ в Москве 2012 Шестаков Олег Школа вебмастеров Яндекс Яндекс.Директ бизнес литература вебинар вконтакте конференция курсы рецензии форум
Numeralis
Удивительный мир Digital маркетинга

Введите ключевые слова для поиска и нажмите Enter