Т-банк выложил в открытый доступ большую языковую модель с 32 млрд параметров

По информации, которую приводят «Ведомости«, принадлежащая Т-банку IT-компания Т-технологии выложила в открытый доступ две большие языковые модели (LLM). Первая модель, T-Pro, имеет 32 млрд параметров, у второй, T-Lite, 7 млрд параметров. Объём инвестиций в проект компания T-технологии не раскрывает. Модели созданы на базе китайской большой языковой модели Qwen 2.5 от компании Alibaba Group. Большее число параметров позволяет модели учитывать больше контекста и особенностей языка, такая модель лучше запоминает информацию и делает более сложные и точные выводы. Появление моделей в открытом доступе позволит различным бизнесам, не зависимо от их размера, использовать модели для решения своих внутренних бизнес-задач без создания собственных моделей. Несмотря на то, что модели созданы на основе китайской модели, но обучены и адаптированы они под использование русского языка. Благодаря такому подходу можно сократить расходы на 80%-90% в сравнении с компаниями, которые осуществляют обучение с нуля, и сэкономить десятки миллионов долларов, так как затраты на создание больших языковых моделей с нуля обходятся очень дорого.

v_romashov@list.ru
наверх