Помочь в создании голосового русско-татарского онлайн-переводчика призывают всех желающих сотрудники Института прикладной семиотики Академии наук Татарстана. Для того чтобы набрать необходимую языковую базу, они создали специальный чат в телеграме.
Как рассказал на брифинге в агентстве «Татар-информ» директор института Ринат Гильмуллин, один из ключевых проектов, которые разрабатывали учёные в последние несколько лет, – машинный русско-татарский переводчик «Татсофт». Сегодня им пользуются в 93 странах.
В Институте семиотики создали также татарскую версию столь популярного сегодня чата GPT – нейросети, которая может давать осмысленные ответы на вопросы, создавать по запросам картинки, писать тексты и делать ещё много чего другого.
Сейчас в планах учёных – создание татароязычной системы фотоперевода (когда при наведении камеры на иноязычный текст можно получить мгновенный его аналог на твоём родном языке), а также голосового перевода. Но для создания голосового переводчика нужен большой объём языковой базы, причём для обучения машины требуются разные голоса – молодых, пожилых, женщин, мужчин.
– И мы создали специальный телеграм-бот «Татар тавышы», который позволяет записывать голосовые сообщения от всех желающих, – рассказывает Ринат Гильмуллин. – Так что каждый житель республики может внести свой вклад в реализацию этого функционала.
Сейчас в активе сотрудников института уже больше 16 тысяч сообщений, 24 часа речи. Но чтобы научить искусственный интеллект правильно переводить русско-татарские сообщения, нужно собрать как минимум 200 часов. Поэтому учёные призывают татарстанцев поучаствовать в проекте, перейдя в бот «Татар тавышы» (https://t.me/TatarVoiceDataBot).