15.05.2025

Искусственный интеллект научат понимать и генерировать текст на татарском языке

Искусственный интеллект научат понимать и генерировать текст на татарском языке

Академия наук Республики Татарстан, Университет Иннополис и Институт AIRI подписали соглашение в рамках XVI Международного экономического форума «Россия – Исламский мир: KazanForum». Организации обучат искусственный интеллект работе с языками малых народов России, в первую очередь, над татарским, сообщил вице-президент Академии наук Республики Татарстан Айрат Хасьянов.

ИИ будет работать в области Natural Language Processing (NLP) – это обработка естественного языка. Это направление изучает проблемы компьютерного анализа (понимания) и синтеза (генерации) текстов на естественных языках.

«Сегодня мы подписали соглашение с Институтом AIRI – это ведущая в России структура, которая занимается искусственным интеллектом. Наработки по NLP можно будет использовать для всех тюркских языков. Мы планируем двигаться в направлении трансляции результатов для применения в решении задач других языков России. Ближайшее, что мы планируем сделать – это провести совместную конференцию на Kazan Digital Week, посвященную ИИ, провести хакатон по технологиям обработки естественного языка», — отметил Хасьянов.

Руководитель группы «Domain-specific NLP» Института AIRI, доктор физико-математических наук Елена Тутубалина рассказала, что ее подразделение занимается исследованиями, связанными с обобщающей способностью языковых моделей.

«Одна из проблем при работе с языковыми моделями в том, что чаще всего мы не можем с уверенностью сказать, правдива ли информация, которую они предоставляют пользователю. Лучше ее фильтровать. Мы изучаем, как избежать неверной информации и не показывать ее пользователю, выбрать те сценарии, где клиенту можно с ней взаимодействовать. В рамках соглашения мы будем заниматься развитием языковых моделей, в том числе и на татарском языке», — отметила Тутубалина.

Партнером по аппаратному обеспечению выступает МГТУ им. Баумана. В университете занимаются суперкомпьютерами «Тераграф», на которых происходит перевод большого цифрового языкового наследия Татарстана, добавил Хасьянов.

«Мы создаем технологическую платформу для того, чтобы реализовывать перспективные языковые модели. Мы подразумеваем под этим использование графов знаний. Это некоторый уход от исключительно нейросетевого подхода к естественному представлению знаний в виде связанных фактов. Эту задачу мы рассматриваем как новую вычислительную идею, которая приводит к тому, что надо переделывать аппаратное обеспечение», — сказал руководитель лаборатории гетерогенных вычислительных систем DISC, руководитель проекта «Тераграф» МГТУ им. Баумана, доктор технических наук Алексей Попов.

Related Images:

contnast@wwwpromo.ru

Главный редактор “Россия-онлайн”

Ссылки на автора:

Темы новости

Все новости лентой

за 14 июня 2025 года