ГигаЧат освоил татарский: завершился этап работы по развитию ИИ для национальных языков
Академия наук Республики Татарстан совместно со Сбером завершила важный этап работы по развитию технологий искусственного интеллекта для национальных языков: нейросетевая модель ГигаЧат освоила татарский язык, сообщили в официальном канале Академии наук РТ в MAX.
В рамках проекта сформировали масштабный и качественно выверенный корпус данных на татарском языке, включающий произведения литературы, публикации прессы, учебные пособия, ресурсы Национального корпуса татарского языка «Туган тел» Института прикладной семиотики АН РТ, а также другие верифицированные открытые текстовые источники. Это позволило заметно повысить качество понимания и генерации текста на татарском языке.
Согласно сообщению, особую значимость проекту придает то, что первым результатом совместной работы по адаптации модели к языкам народов России стало именно обучение ГигаЧат татарскому языку. Для Татарстана это не только технологическое достижение, но и важный шаг в сохранении, изучении и развитии татарского языка в условиях глобальной цифровизации.
Развитие этого направления ведется в рамках стратегии по сохранению языкового многообразия народов России. Речь идет не просто о технологической адаптации, а о создании условий для полноценного использования татарского языка в современных цифровых сервисах и интеллектуальных системах.
Новые возможности открываются для образования, науки, медиа и повседневной коммуникации: пользователи смогут обращаться к нейросети на татарском языке, а значит, использовать современные цифровые инструменты без утраты связи с родным языком и культурной традицией.
Проект формирует основу для дальнейшего расширения практик использования национальных языков в цифровой среде. В дальнейшем наработанный подход может быть масштабирован и на другие языки народов России.