Технология для гуманитариев

Систему машинного перевода с русского языка на татарский и наоборот планируется создать в республике в рамках госпрограммы сохранения, изучения и развития государственных языков.

Автор статьи: Евгения ЧЕСНОКОВА

information_items_10119611

Переводчикам в Татарстане будет помогать компьютер

Систему машинного перевода с русского языка на татарский и наоборот планируется создать в республике в рамках госпрограммы сохранения, изучения и развития государственных языков. Проект будет воплощать в жизнь НИИ «Прикладная семиотика» Академии наук РТ при поддержке российской компании ABBYY Language Services, занимающейся лингвистическими технологиями и услугами.

Проблема ускорения процесса и повышения качества перевода для республики, где вся официальная документация ведется на двух государственных языках, несомненно, очень актуальна. При этом машинный перевод, поясняет генеральный директор лингвистической компании Иван Смольников, никоим образом не сможет заменить живого специалиста – конечный вариант переведенного текста все равно редактируется человеком. Но технология, предложенная ABBYY Language Services, способна облегчить и значительно ускорить его труд. В систему загружаются все ранее переведенные тексты, и на их основе программа предлагает для перевода нового текста оптимальные слова и словосочетания. А когда речь идет о документах, где есть целые куски шаблонно повторяющихся фраз (например, в «шапке» какого-нибудь законопроекта или судебного решения), то весь этот шаблон можно автоматически вставлять в новый текст. Преимуществом системы автоматизации переводов SmartCAT, предлагаемой компанией, является и возможность четкой фиксации единого перевода для специальных терминов внутри одного ведомства – до сих пор в этом вопросе нередко возникали разночтения. Умная техника проследит и за тем, чтобы в тексте все было в порядке с пробелами и знаками препинания.

Разумеется, для того, чтобы машинный перевод полноценно заработал, необходимо накопить в системе определенный лингвистический фонд – не менее 100 миллионов словоформ, поясняет руководитель отдела продаж технологий ABBYY Language Services Алсу Бикбаева. Пока же, по словам руководителя проекта, заместителя директора института «Прикладная семиотика» Рината Гильмуллина, в программу внесено только 10 миллионов словоформ. Планируется, что к концу этого года их будет уже более 50 миллионов, но полноценно программа машинного перевода должна заработать к 2020 году.

Чтобы наработать необходимую словарную базу, уже сейчас в проект включаются профессиональные переводчики из государственных структур республики. Они начинают работать в SmartCAT (на том уровне, который она может предложить им сейчас) и параллельно своими текстами создают ту самую необходимую для полноценного запуска проекта лингвистическую базу. При этом программа позволяет одновременно работать над одним документом целой командой, куда, кроме переводчиков, войдут корректоры и редакторы, но у каждого будет свой уровень доступа, так что окончательные варианты перевода, которые затем попадут в конечную базу, будет утверждать кто-то один – опять же во избежание разночтений. У каждого ведомства будет нарабатываться своя собственная база, но при необходимости специалисты смогут знакомиться с базой коллег.

Возможно, человеку, не сталкивающемуся с переводческими проблемами, не совсем понятны все вышеописанные нюансы, но сами переводчики из различных государственных структур, которых на днях собрали на презентацию программы в Академии наук, судя по множеству заинтересованных реплик и вопросов, перспективе создания программы машинного перевода рады. Были даже предложения разработать аналогичные программы для английского и татарского, татарского и турецкого языков. Но директор НИИ «Прикладная семиотика» Джавдет Сулейманов призвал переводчиков трезво оценивать ситуацию, пояснив при этом, что в Европе, например, создание подобных программ для многочисленных «малых» языков обходится в миллионы евро. У нас, понятное дело, ситуация с финансированием совсем иная – так, в этом году на проект выделено около 7 миллионов рублей.

+1
0
+1
0
+1
0
+1
0
Еще