Затеи
Проекты свободного и несвободного программного обеспечения
Платформа LUWRAIN
Платформа LUWRAIN — открытый и свободный инструментарий на языке Java, предоставляющий компоненты для создания переносимых и интуитивно понятных невизуальных приложений для людей с нарушениями зрения. LUWRAIN обеспечивает меня инструментарием для работы на компьютере и делает независимым от технологического и политического непостоянства окружающего мира. Помимо этого Превратился в увлекательный проект, давший основу для иинтересных исследований со студентами. LUWRAIN способен функционировать на разных платформах и архитектурах, включая Microsoft Windows, GNU/Linux и Raspberry Pi.
Морфологический анализатор SelfTagger
Морфологический анализатор SelfTagger — это исследовательская библиотека для определения грамматических атрибутов в тексте на русском языке на основе multi-head attention. Multi-head attention — это специальный метод кодирования текста, впервые представленный исследователями Google в статье «Attention is all you need», лежащий в основе большинства современных языковых моделей, включая модели семейства GPT и BERT. Морфологическое тегирование необходимо, например, для расстановки ударений в словах-омографах. В расширенной постановке задача подразумевает морфологическое тегирование для тех слов, которые не могут быть прочитаны в тексте полностью.
Inlandes
Inlandes — декларативный язык для обработки текста и его одноимённая реализация на java. Он позволяет накладывать за линейное время фильтры на текст на русском языке с последующей возможностью его трансформации на основе действий, заданных на JavaScript, интегрированного в синтаксис Inlandes. Перейти к странице проекта...
VoiceMan
VoiceMan — это речевой сервер для GNU/Linux. Он является одним из базовых компонентов для дистрибутива Homeros. Создан преимущественно для возможности переключения речевых синтезаторов для раздельной обработки текста на разных языках. Перейти к репозиторию Git...