Т-Банк открыл доступ к собственной русскоязычной языковой модели в весовой категории 7—8 млрд параметров

Москва, Россия — 20 июля 2024 г.
Центр искусственного интеллекта Т-Банка (AI-Центр) открыл доступ к своей большой языковой модели T-lite. Индустриальные и внутренние бенчмарки показали, что T-lite показывает лучшие результаты в решении бизнес-задач на русском языке среди открытых моделей размером 7–8 млрд параметров. Об этом было объявлено на первой конференции Т-Банка по машинному обучению Turbo ML Conf.

Модель T-lite — это инструмент разработки. С ее помощью компании смогут создавать LLM-приложения для собственного использования без передачи данных третьим лицам. Например, ассистентов поддержки, которые могут автоматически обрабатывать запросы клиентов и предоставлять мгновенные ответы, инструменты для анализа и обобщения больших объемов текста, таких как отчеты или исследования, интеллектуальные поисковые системы, которые могут находить нужную информацию с учетом контекста, модели суммаризации текста.

T-lite выпущена в размере 8 миллиардов параметров. Параметры — это числовые значения, которые модель настраивает, чтобы лучше понимать и генерировать текст. Чем больше параметров, тем больше возможностей у модели для выполнения сложных заданий, но с увеличением размера также ухудшается экономическая эффективность модели. T-lite же после дообучения на конкретные бизнес-задачи в области обработки естественного языка (NLP) дает качество, сопоставимое с проприетарными моделями размером от 20 миллиардов параметров, но при этом в разы дешевле в эксплуатации.

На индустриальных и внутренних бенчмарках модель обогнала по показателям зарубежные llama3-8b-instruct и chat-gpt 3.5. При этом T-lite создана с использованием всего 3% вычислительных ресурсов, которые обычно требуются для такого типа моделей.

T-lite входит в Gen-T — это семейство собственных специализированных языковых моделей Т-Банка, которые умеют обучаться под решение конкретных узкоспециализированных задач. В отличие от универсальных моделей, таких как ChatGPT, технология Gen-T ориентирована на конкретные области и предлагает решения с максимальной адаптацией под нужды пользователя.

Артем Бондарь, руководитель NLP в Центре искусственного интеллекта Т-Банка:

«Разработка собственного семейства языковых моделей — это насущная необходимость по многим причинам. Существующие на рынке решения не закрывают всех задач, которые есть у нас, и не являются оптимальными.

Наши модели семейства Gen-T показали свою эффективность в наших сервисах, оптимальны по соотношению используемых мощностей и качеству. И мы готовы поделиться этой разработкой с другими компаниями, с пользователями, с профессиональным сообществом. Это наш вклад в развитие искусственного интеллекта в России».

Модель доступна разработчикам по ссылке.

Похожие новости