РУВИКИ поможет обучить «ГигаЧат» 20 языкам народов России
Российская интернет-энциклопедия РУВИКИ передала материалы для обучения нейросети «ГигаЧат», разработанной Сбербанком, 20 языкам народов России.
Переданные материалы включают тексты на алтайском, башкирском, бурятском, вепсском, горномарийском, ингушском, коми, коми-пермяцком, марийском, мокшанском, ливви-карельском (одном из трех основных наречий карльского, ливвикском – прим. Т-и), татарском, тувинском, калмыцком, удмуртском, хакасском, чеченском, чувашском, эрзянском и якутском языках.
На основе собранных волонтерами энциклопедических статей большая языковая модель будет осваивать идиомы народов России. Это позволит не только повысить качество генерации текстов на них, но и сохранить уникальное культурное наследие в цифровую эпоху, рассчитывают организаторы проекта.
«Наша миссия – делать знания доступными для всех, в том числе на языках народов России. Мы видим, как технологии становятся важным инструментом сохранения культурной идентичности и знаний, находившихся под угрозой утраты; и рады, что вклад авторов РУВИКИ поможет развитию генеративного искусственного интеллекта, который будет способен понимать и уважать языковое многообразие нашей страны», – заявил генеральный директор РУВИКИ Владимир Медейко.
РУВИКИ – современная российская интернет-энциклопедия. Проект был объявлен на РИФ-2023. Платформа объединяет экспертов и обычных пользователей: любой может стать автором РУВИКИ, но лишь профессионалы выступают гарантами верификации материалов. Главными ценностями площадки заявлены удобство, открытость, технологичность, достоверность информации. В энциклопедию внедрен искусственный интеллект, который позволяет формулировать точный ответ на запрос пользователя, пересказывать его в разных стилях и углубляться в тему.