Возможные варианты правил конфигурирования речевого вывода в среде ALT Linux

Пятая конференция разработчиков свободных программ "На Протве", г. Обнинск, 21 июля 2008 г.

См. также:

Последнее время в процессе разработки речевых систем наблюдается рост активности. Появилось движение в сторону консолидации механизмов передачи речевой информации. Текущее направление разработки речевых систем позволяет говорить, что в GNU/Linux в будущем будет возможна работа без зрительного контроля в графической оконной среде, в то время как раньше речь шла только о консольных приложениях и о emacspeak. Такие крупные проекты, как OpenOffice.org, FireFox, Java Swing, GTK+, QT, заявили о реализации механизмов передачи оповещений об изменении в пользовательском интерфейсе для вывода их в речевом виде. Ведётся также разработка AT-SPI — центрального компонента для сбора такой информации, являющейся частью проекта Gnome.

Возникает серьёзный вопрос о реализации в дистрибутивах ALT Linux инструментария для централизованного конфигурирования речевых систем. Сложность в том, что важно сохранить работу инструментов, используемых в настоящий момент. К примеру, emacspeak остаётся самой развитой средой и имеет множество достоинств. Наиболее вероятным развитием событий будет существование отдельных механизмов обработки речевой информации для KDE, для Gnome и для консольных приложений. Трудно сказать, удастся ли создать компонент для "Альтератора", в котором у пользователя будет возможность менять настройки одновременно для всех систем. Вероятно, что это может оказаться неудобным, и тогда лучше предоставить настройку вывода в KDE и Gnome средствам, поставляемыми вместе с этими системами, а через "Альтератор" выполнять настройку только консольных приложений.

Главный параметр, который пользователь должен уметь свободно менять — речевой синтезатор, используемый для обработки английской и русской речи. Желательно выработать соглашения, которые позволяли бы качественно поддерживать список установленных синтезаторов. Это дало бы возможность пользователю видеть каждый новый синтезатор в списке поддерживаемых сразу после его установки. В качестве такого соглашения предлагается ввести специальную директорию, например /etc/tts.d, для добавления файлов, поставляемых в пакете синтезатора и содержащих необходимую информацию для конфигурирования. Содержимое такой директории возможно обрабатывать специальным модулем "Альтератора". Формат подобных файлов и множество содержащейся в них информации ещё предстоит выработать.

В настоящий момент, благодаря наличию в QT механизма генерации оповещений о изменении состояния пользовательского интерфейса, появляется интересная возможность. Разработчики QT предусмотрели наличие уровня абстракции, необходимого для перенаправления подобных оповещений не в AT-SPI, а в любой другой компонент, в том числе и созданный сторонним разработчиком. Как известно, на QT реализован оконный интерфейс платформы "Альтератор". Можно попытаться реализовать специальный мост, пересылающий оповещения в некоторый лёгкий обработчик, связанный с речевыми синтезаторами и способный работать в среде программы установки. В случае успеха возможно получить операционную систему с полностью озвученной процедурой установки, что является очень важным жизненным требованием.