WINWIN AI Center of Excellence при Минцифры и Киевстар — оператор электронных коммуникаций Украины — начинают разработку национальной большой языковой модели (LLM).
Модель будут использовать в цифровых государственных и бизнес-продуктах с искусственным интеллектом, чтобы сделать сервисы удобнее для людей и помочь организациям работать эффективнее, сообщили в Министерстве цифровой трансформации.
Большая языковая модель — это нейросеть, которая работает по принципу человеческого мозга и способна анализировать и генерировать тексты. Модели используют как базу для работы чатботов, AI-ассистентов и т.д.
На основе языковой модели государство будет создавать ИИ-продукты — для удобства граждан и улучшения внутренних процессов. Так, Минцифры планирует запустить AI-ассистента в Дие, инструменты для анализа законодательства, а также сервисы в Мрие для формирования индивидуальных образовательных траекторий для школьников. Всего в работе WINWIN AI Center of Excellence при Минцифры, который занимается разработкой AI-решений для министерства, более 10 продуктов.
Украинская LLM будет давать более точные ответы, чем глобальные модели, поскольку будет дополнительно натренирована (pre-trained) на украинских данных. Она лучше будет понимать языковые особенности — диалекты, термины, контекст — и хорошо ориентироваться в темах, связанных с украинской историей, культурой и общественным опытом. Так, модель будет отвечать правильно не только языково, но и по содержанию.
Национальная LLM позволяет сохранять и обрабатывать данные внутри страны, что критически важно для безопасности в сфере обороны, государственных учреждений, медицины и финансов. Модель обеспечит защиту персональных данных и национальной безопасности Украины при интеграции AI в различные секторы.
"Создание украинской LLM — важный шаг к лидерству Украины в сфере ИИ. Мы как государство сможем создавать удобные AI-сервисы для граждан и сделаем искусственный интеллект помощником правительства. При этом этот ИИ будет качественным и безопасным для граждан. Так, AI станет частью обороны, образования, науки и других стратегических сфер. С другой стороны, национальная LLM позволит бизнесу создавать инновационные продукты — более дешевые, безопасные и адаптированные к украинскому контексту. Для реализации этого амбициозного проекта мы объединяем усилия Минцифры с Киевстаром. Это пример эффективного партнерства, когда ведущий бизнес присоединяется к созданию решений национального масштаба", — отметил Михаил Федоров, Вице-премьер-министр по инновациям, развитию образования, науки и технологий — Министр цифровой трансформации.
Минцифры будет координировать процесс разработки модели и формировать технологическое и этическое видение создания LLM. В частности, создаст все ключевые структуры для качественной разработки модели — координационный комитет и этический и технический борды.
Координационный комитет будет отвечать за видение и стратегию разработки. В него войдут представители Минцифры, WINWIN AI Center of Excellence, других профильных государственных институций, Киевстара, технического и этического бордов. Этический борд будет отслеживать соответствие законодательству и этичность модели. Технический борд будет отвечать за архитектуру, тренировку модели на данных и т.д. Разработкой модели будет заниматься проектный офис, сформированный компанией Киевстар как операционным исполнителем разработки модели.
Минцифры будет обеспечивать сбор данных для обучения модели, для чего будет привлекать государственные и частные институции — университеты, научные структуры, национальные библиотеки и интеллектуальные фонды. К обучению будут привлекать данные из открытых источников на украинском языке, собранные в датасетах. Персональные данные, данные из реестров и любую другую чувствительную информацию для pre-training использовать не будут.
Стратегическим партнером государства в создании национальной LLM стал Киевстар — национальный оператор электронных коммуникаций. Компания активно инвестирует в новые технологии и цифровые сервисы, имеет глубокую экспертизу в сфере ИИ и интегрирует AI-решения в долгосрочную стратегию технологической трансформации. Киевстар сочетает языковые модели и современные RAG-системы (Retrieval Augmented Generation) с реальными бизнес-процессами, сервисной поддержкой и анализом данных, соблюдая высокие стандарты безопасности и этики.
Киевстар имеет прямой доступ к международному опыту через материнскую компанию VEON, которая уже реализовала успешные национальные AI-проекты. Так, Киевстар станет надежным технологическим партнером на старте, поможет обеспечить быстрый запуск и создать LLM, максимально адаптированную к языку и культуре Украины.
Использование украиноязычной модели будет стоить дешевле для украинских пользователей по сравнению с англоязычными аналогами. После разработки и тестового периода модель станет собственностью государства. С момента готовности LLM государство сразу будет иметь к ней доступ для бесплатного использования.
Не ТЦК: в ВСУ ответили, кто может определить пригодность к службе
Пенсия в четверть миллиона: ПФУ показал самого богатого пенсионера Украины
Украинцы могут потерять жилье: кого лишат недвижимости и почему
Теперь каждый день с 6:00: для владельцев авто ввели важные изменения
Появление украиноязычной LLM будет способствовать появлению новых AI-стартапов, привлечению международных инвестиций в страну и повышать ВВП благодаря разработке AI-решений для различных секторов экономики.
Основа для национальной модели — одно из open-source решений, без привлечения государственных средств. Первую версию модели планируют запустить до декабря 2025 года.