Яндекс добавил в Алису вторую версию YandexGPT

Гонка нейросетей продолжается. Помните, как несколько месяцев назад ряд крупнейших российских IT-компаний выпустили свои нейросети? Около недели назад вышло обновление для голосового помощника Алиса, в рамках которого разработчики Яндекса реализовали поддержку новой версии YandexGPT. Активные пользователи нейросети отмечают, что ответы на их запросы стали лучше по сравнению со старой. Разработчики провели колоссальную работу по улучшению каждого отдельного этапа обучения языковой модели, но особое внимание уделили претрейну.

Чтобы сравнить разницу в качестве работы двух языковых моделей, то отзывов пользователей будет недостаточно. Сотрудники Яндекса решили подготовить огромный список запросов и заданий для нейросети, которые были разделены между собой на отдельные группы: мозговой штурм, анализ или пересказ материала, генерация текста и так далее. Порядка 500 уникальных и разных заданий были предложены двум версиям ИИ, а конечный результат оценивался независимыми специалистами в рамках выделенных групп. Итоги тестирования оказались крайне обнадеживающими: YandexGPT 2 показывает лучшие результаты в более чем 60% запросов по сравнению с предыдущей моделью. Компания опубликовала свои результаты проводимого тестирования:

  • ответы на пользовательские запросы — YandexGPT-2 победила в 62% заданий;
  • мозговой штурм (генерация идея) — 66%;
  • пересказ и анализ текста — 68%;
  • стилизация текста по заданным параметрам — 62%;
  • генерация текста — 69%.

Во второй версии были изменен процесс обучения, в который теперь входит два этапа: претрейн и файнтюн. Во время претрейна искусственный интеллект собирает фактическую информацию по запросу, а при переходе на файнтюн выбирает формат и стиль ответа для пользователя. Разработчики подчеркнули, что на первом этапе YandexGPT собирает большое количество полезных знаний, поэтому их необходимо собирать в общий массив под названием «датасет». Это одна из причин, почему обучение языковой модели с нуля происходит не так часто: слишком трудозатратно и дорого. Чтобы сэкономить ресурсы, компания ждет, когда накопится внушительный объем критических обновлений датасета, после чего начинает процесс обучения заново. Интересно, что оба этапа независимы друг от друга, поэтому ошибки, совершенные на одном из них, не могут быть исправлены на другом.

Сложно не заметить, как российские компании отчаянно пытаются повторить успех ChatGPT от OpenAI, но пока лишь Яндекс демонстрирует стремительные темпы роста своего продукта. А что на это скажете вы? Довольны ли обновленной моделью и пользуетесь ли вообще помощью «Алисы» во время работы или учебы?

Обсуждение