BRAZHKO.info

Блог о компьютерном железе и IT-технологиях

Многоязычная самообучающаяся система автоматизированного перевода

| 1 комментарий

Буквально сегодня мне понадобилось перевести несколько небольших текстов с украинского языка на русский. Оказывается, ситуация с переводчиками текстов в Linux такая же, как и с системами распознавания — выбора, по большому счету, на данный момент нет никакого. Единственный более-менее вменяемый вариант (которым я и воспользовался) — это «Переводчица» — многоязычная самообучающаяся система автоматизированного перевода. На сайте проекта доступны два вида перевода — перевод текста и перевод файла. В обоих случаях размер переводимого фрагмента/текста ограничен 100 Кб. По сравнению с другими online-переводчиками, где ограничение составляет 500-1000 символов, 100 Кб — очень даже неплохо. Поддерживаемые типы файлов: rtf, xml, html, а также все форматы OpenOffice.org. Поддерживаемые языки для перевода (имеющиеся в наличии): русский, украинский, английский. Но словари можно сделать для любого языка.

Систему можно также установить на локальный компьютер. Со страницы загрузки доступны исходные тексты программы и словарей, а также собранные пакеты для ALT Linux, ASP Linux (Fedora Core), Gentoo Linux и MS Windows. Для Ubuntu/Debian пакетов к сожалению нет.

Следует отметить, что для программы имеется графический интерфейс на wxWidgets.

Перед установкой переводчика необходимо установить несколько пакетов:

$ sudo apt-get install libarchive-zip-perl libconfig-general-perl libhtml-simpleparse-perl libtext-csv-perl$ sudo apt-get install ncftp

и модули Perl, которых в репозитории нет:

$ sudo cpan RTF::Tokenizer$ sudo cpan Wx

Затем скачиваем пакет Lingua-Pere-0.2.0.tar.gz, распаковываем, собираем и устанавливаем его:

$ tar xvfz Lingua-Pere-0.2.0.tar.gz$ cd Lingua-Pere-0.2.0$ perl Makefile.PL$ make$ sudo make install

То же самое проделываем с пакетом wxpere-0.2.0.tar.gz:

$ tar xvfz wxpere-0.2.0.tar.gz$ cd wxpere-0.2.0$ perl Makefile.PL$ make$ sudo make install

Теперь очередь словарей. Словари берем из http://pere.org.ua/dwn/src/dic/(dmp или src; пакеты src меньше в 3 раза, но их сборка займёт больше времени; у меня русско-украинский словарь собирался из исходников 3,5 часа; за это время я успел скачать архивы с дампами и восстановить словари из них). Для каждого словаря после распаковки выполняем команду вида:

$ ./install.sh ~/dic/en-us_ru-ru_dzer-tyzh en-us_ru-ru_dzer-tyzh.dmp

На этом установка окончена. Теперь можно запустить wxpere:



Если переводить тексты необходимо время от времени, то нет смысла устанавливать «Переводчицу» — намного проще воспользоваться online-переводом.

Один комментарий

  1. Ужасный превод 🙂

Добавить комментарий

Войти с помощью: 

Обязательные поля отмечены *.