Программа лекций и презентации по курсу «Обработка естественного языка»

Презентации к практическим работам

  1. Предобработка текста.
  2. Векторное представление слов (вектора для слов можно брать тут).

Задания к практическим работам

Практическая работа «Предобработка текста »

Требуется прочитать текст на русском языке из файла и вывести все пары соседних слов, которые:

Все пары следует выводить в виде лемм. Например, если исходная пара имела вид «необычайных университетов», то должна быть выведена пара «необычайный университет».

Практическая работа «Векторное представление слов»

Используя import gensim, необходимо реализовать вычисление десяти самых близких по смыслу слов, находящихся в окрестности от результата операций сложения и вычитания в векторной модели. Каждому студенту преподавателем будет дана пара слов и необходимо найти такую линейную комбинацию исходных слов, чтобы в результате вычислений заданная пара попадала в первую десятку.