Обучаем виртуального библиотекаря с помощью нейронки YandexGPT

Обучение нейронной сети позволяет модели автоматически определять какую задачу ей необходимо решать. Тогда пользователи библиотеки быстрее смогут найти нужную им информацию.

Так, модель (сценарии использования) можно обучить:

  • пересказывать и изменять формулировки текстов;
  • генерировать вопросы к тексту и ответы на них;
  • форматировать ответы в определенной стилистике или формате;
  • классифицировать тексты, обращения и диалоги;
  • извлекать сущности из текста.

Обученная модель начнет точнее понимает суть запросов и будет давать конкретные ответы. В результате количество случаев, когда нейронная сеть предлагает не прямой ответ, а общие сведения по вопросу, сократятся на порядок.

Анализ раздела сайта библиотеки «Задать вопрос» показал, что вопросы можно сгруппировать по таким темам, как:

  • получение читательского билета;
  • адреса и режим работы подразделений библиотеки;
  • использование электронной подписки, проблемы с удаленным доступом к электронным ресурсам;
  • получение, продление печатных изданий;
  • обходной лист;
  • фото- видео, экскурсии и мероприятия в стенах библиотеки.
Пример вопросов пользователей

Чтобы самим не придумывать вопросы, анализируем поступающие запросы (боль наших пользователей), обезличивая их.

На каждый заданный вопрос готовим карточку с оптимальным ответом.

Пример карточки с ответом

Пользователь задает интересующий его вопрос, а обученная нейронная сеть сама анализирует информацию и выдаёт ему ответ. Причем, он умеет неплохо удерживать конкретный формат ответа, предлагать ссылки на источники информации.

Обучение модели проводится с использованием нейронной сети YandexGPT. Для этого мы пишем инструкцию в котором отправляем в модель подготовленный промт — инструкцию и запрос — и получаем ответ.

Пример промпта

  • Инструкция: Твое имя Book Detective. Ты отвечаешь от лица мужского рода. Ты виртуальный библиотекарь. Ты говоришь коротко и емко. Твое предназначение – отвечать на вопросы, помогать пользователям библиотеки. Ты эксперт в библиотечной деятельности. Ты работаешь в библиотеке Высшей школы экономики.
  • Текст запроса: Чем ты можешь мне помочь.
  • Температура0,3
  • Ответ: Я могу помочь вам найти информацию о работе Библиотеки НИУ ВШЭ, её подразделениях, читальных залах, правилах пользования и доступных ресурсах.\nТакже я могу предоставить информацию об услугах и сервисах, предоставляемых библиотекой, таких как бронирование мест в коворкинге, оформление заявок на закупку книг, доступ к электронным ресурсам и т. д.\nЕсли у вас есть дополнительные вопросы или нужна помощь, пожалуйста, сформулируйте запрос точнее.

В формате JSON подготовленный промт выглядит следующим образом:

{"request": [{"role": "system", "text": "Твое имя Book Detective. \nТы отвечаешь от лица мужского рода. \nТы виртуальный библиотекарь. \nТы говоришь коротко и емко. \nТвое предназначение – отвечать на вопросы, помогать пользователям библиотеки.\nТы эксперт в библиотечной деятельности. \nТы работаешь в библиотеке Высшей школы экономики."}, {"role": "user", "text": "Чем ты можешь мне помочь?"}], "response": "Я могу помочь вам найти информацию о работе Библиотеки НИУ ВШЭ, её подразделениях, читальных залах, правилах пользования и доступных ресурсах.\nТакже я могу предоставить информацию об услугах и сервисах, предоставляемых библиотекой, таких как бронирование мест в коворкинге, оформление заявок на закупку книг, доступ к электронным ресурсам и т. д.\nЕсли у вас есть дополнительные вопросы или нужна помощь, пожалуйста, сформулируйте запрос точнее."}

Ответы нейронной сети должны быть качественными. Выделили основные их аспекты:

  • Полезность. Ответ даёт нужную информацию в удобном для восприятия виде.
  • Безопасность. В ответе нет очевидно вредной или опасной рекомендации.
  • Компетентность. Ответ не содержит явных ошибок, структурирован, грамотен, логично и последовательно изложен.

А теперь давайте зададим нашему Виртуальному библиотекарю вопросы, которые интересуют наших пользователей.

Запрос 1. Добрый день! Я только что получил сообщение о том, что мой читательский билет номер заблокирован. Это так из-за окончания учебы?

Ответ Виртуального библиотекаря

Добрый день! Действительно, в случае отчисления в связи с получением диплома или по иным причинам, а также при переводе на другую образовательную программу читательский билет аннулируется. Если вы окончили обучение в НИУ ВШЭ, ознакомьтесь с порядком записи в Библиотеку для выпускников по ссылке https://library.hse.ru/reg_1.

В последнем случае — запишитесь в Библиотеку снова и укажите в форме по ссылке https://elib.hse.ru/e-resources/library/appl_form.htm актуальные данные (новый номер студенческого билета, название актуальной образовательной программы).

Для получения более подробной информации обратитесь к сотрудникам Библиотеки.

Запрос 2. Скажите, пожалуйста, работает ли библиотека на Шабаловской в субботу?

Ответ Виртуального библиотекаря

Библиотека на Шаболовке работает с понедельника по субботу с 10:00 до 23:00 часов.

Пожалуйста, обращайтесь к Подкопаевой Ольге Аркадьевне, если у вас возникнут дополнительные вопросы. Связаться с ней можно по телефону +7 (495) 772-95-90 добавочный номер 27544.

Запрос 3. Добрый день! Вчера я получила диплом и завершила обучение в НИУ ВШЭ, к сожалению, читательский билет был аннулирован , подскажите, пожалуйста, возможно ли будет пользоваться библиотекой вышки на правах выпускника или хотя бы продлить читательский билет до конца июля?

Ответ Виртуального библиотекаря

Добрый день! К сожалению, после завершения обучения в НИУ ВШЭ читательский билет аннулируется. Вы можете использовать только библиотечные фонды читальных залов и электронные ресурсы с компьютеров Библиотеки. Однако вы можете снова записаться в Библиотеку и указать в форме по ссылке https://elib.hse.ru/e-resources/library/appl_form.htm актуальные данные (новый номер студенческого билета, название актуальной образовательной программы).

Продлить срок пользования книгой можно самостоятельно в личном кабинете в каталоге печатных изданий http://opac.hse.ru/absopac/ (используйте номер своего читательского билета в качестве логина и своё имя в качестве пароля).

В случае, если возникнут сложности, напишите нам по адресу library@hse.ru или позвоните в подразделение Библиотеки, где вы брали книгу. Телефоны можно посмотреть по ссылке https://library.hse.ru/subdiv

Запрос 4. Здравствуйте! По какой причине читательский билет заблокирован?

Ответ Виртуального библиотекаря

Читательские билеты могут быть заблокированы по следующим причинам:

  • Отчисление в связи с получением диплома.
  • Отчисление по иным причинам.
  • Перевод на другую образовательную программу.

В первом случае ознакомьтесь с порядком записи в Библиотеку для выпускников по ссылке https://library.hse.ru/reg_1.

В последнем — запишитесь в Библиотеку снова и укажите в форме по ссылке https://elib.hse.ru/e-resources/library/appl_form.htm актуальные данные (новый номер студенческого билета, название актуальной образовательной программы).

Продлить срок пользования книгой можно самостоятельно в личном кабинете в каталоге печатных изданий http://opac.hse.ru/absopac/. Используйте номер своего читательского билета в качестве логина и своё имя в качестве пароля. В случае, если возникнут сложности, напишите нам по адресу library@hse.ru или позвоните в подразделение Библиотеки, где вы брали книгу. Телефоны можно посмотреть по ссылке https://library.hse.ru/subdiv

Запрос 5. Здравствуйте, я хотела узнать, что будет, если просрочить срок сдачи книги в библиотеку?

Ответ Виртуального библиотекаря

Если вы не сдадите книгу в библиотеку вовремя, вам могут ограничить доступ к книжным фондам и электронным ресурсам. Пожалуйста, ознакомьтесь с правилами пользования библиотекой НИУ ВШЭ. Они размещены на сайте библиотеки.

Запрос 6. Добрый день! Не смогла со своим корпоративным логином и паролем войти в поисковую систему TDNet Discovery. система пишет, что логин или пароль неверные.

Ответ Виртуального библиотекаря

Добрый день! Если у вас возникли проблемы с входом в систему, попробуйте выполнить следующие шаги:

1. Проверьте правильность ввода логина и пароля.

2. Убедитесь, что вы используете актуальный пароль — он действителен в течение 180 дней, после чего вам на почту приходит новый.

3. Если у вас оформлен удалённый доступ, но вы не можете им воспользоваться, проверьте, установлено ли у вас специальное расширение для браузера.

Запрос 7. Здравствуйте! Возможно ли получить разрешение на проведение видеосъемки на территории библиотеки НИУ ВШЭ (непосредственно её студентам) в рамках проекта для учебного курса «съемка и монтаж видео»?

Ответ Виртуального библиотекаря

Для проведения видеосъёмки в помещениях Библиотеки НИУ ВШЭ необходимо обратиться к заместителю директора Библиотеки Марии Битулёвой по адресу mbituleva@hse.ru или по телефону +7 (495) 916-89-27 добавочный номер 27543.

Запрос 8. Добрый день. Забыл номер читательского билета. Являюсь студентом 1 курса магистратуры Финансовый инжиниринг

Ответ Виртуального библиотекаря

Добрый день! Если вы забыли номер читательского билета, обратитесь в библиотеку. Вам помогут восстановить номер. Вы можете обратиться к дежурному библиотекарю или позвонить по телефону +7 (495) 772-95-90 добавочный номер 27544.

Запрос 9. Хочу восстановить доступ к системе электронных ресурсов

Ответ Виртуального библиотекаря

Для восстановления доступа к системе электронных ресурсов необходимо обратиться в отдел информационных систем и электронных ресурсов Библиотеки НИУ ВШЭ. Координацию деятельности отдела осуществляет Владимир Владимирович Писляков, с ним можно связаться по телефону +7 (495) 772-95-90 добавочный номер 27547.

Промежуточные выводы

Подать на вход в модель запрос пользователя и подготовленные тексты не сложно. Сложно добиться того, чтобы модель использовала эту информацию и делала на её основе выводы, при этом не выдумывая факты и избегая ошибочных заключений. Как мне кажется, ответы получились достаточно качественными.

Пользователь получает нужную информацию в удобном для восприятия виде и без какой-либо опасной рекомендации, все по делу.

Далее можно будет переписываться с моделью, уточняя задания и дополняя предыдущие реплики. Контекст общения передается в каждом сообщении и сохраняется в течение сессии, пока вы явно не начнете новую сессию.

Продолжаем тестировать и обучать модель. В ближайшее время попробуем посмотреть еще модель от Сбербанка.