
Промпт-инжиниринг – это процесс разработки подробных инструкций и подсказок, то есть промптов, для языковой модели с целью получения пользователем желаемого результата запроса. Этот процесс схематически показан на рисунке [7]. В инженерии подсказок пользователь выбирает наиболее подходящие форматы, фразы, слова и символы, которые помогают искусственному интеллекту или языковой модели создать максимально приближенный к желаемому результат [3].

Рис. 1. Принцип промпт-инжиниринга
Для получения приближенного к желаемому ответа от нейросети используют элементы промпта [2] такие, как:
- задача или инструкция – пользователь отправляет языковой модели конкретный запрос, который хочет получить на выходе;
- контекст – информация, которая может направить нейросеть на нужный ответ;
- входные данные – вопрос, на который пользователь хочет получить ответ;
- индикатор вывода – формат, в котором пользователь желает увидеть ответ.
Не обязательно в запросах использовать все четыре элемента, так как это зависит от конкретной задачи.
Помимо элементов промпта используются различные техники промпт-инжиниринга, которые помогают пользователю настроить языковую модель или нейросеть:
- Zero-shot prompting (обучение без примеров): нейросети, такие как ChatGPT версии 3 и выше, обучаются на больших объемах данных, поэтому способны выполнять некоторые задачи без примеров, инструкций и классификаций.
- Few-shot prompting (обучение с примерами) [3] используется для контекстного обучения, когда пользователь приводит пример в запросе, чтобы направить модель на желаемый формат ответа.
- Chain-of-Thought prompting (обучение, основанное на рассуждении) [8] позволяет выполнять сложные рассуждения шаг за шагом.
- Generated Knowledge prompting (генерация знаний, как часть промпта)используется для получения развернутого, обоснованного и доказательного ответа от нейросети.
- Prompt chaining (цепочка промптов) [6] используется для решения задач, которые сложно выполнить с помощью одного большого промпта и они выполняются с помощью деления задачи на мелкие подзадачи. При первом запросе нейросеть выполняет одну подзадачу и далее на основе полученного результата пользователь может задать языковой модели следующий промпт, который будет основан на уже полученном ответе, и так до тех пор, пока задача не будет выполнена.
- Directional Stimulus prompting (направляющий промптинг) [5] используется для суммаризации текста. Помимо самого текста и запроса пользователь отправляет нейросети подсказки – важные слова, фразы, цифры, даты, которые должны составить основу саммари.
- CETO позволяет получить ответ на экспертном уровне. Пользователь задает нейросети роль, в соответствии с которой получает ответ.
Для сравнения сгенерированных нейросетями текстов были составлены и использованы следующие критерии:
- достоверность данных (от 0 до 2 баллов);
- логичность и последовательность структуры текста (от 0 до 1 балла);
- использование специализированной терминологии (от 0 до
1 балла);
- грамматическая правильность текста (от 0 до 1 балла);
- стилистическая правильность текста (от 0 до 1 балла);
- соответствие полученного текста промпту (от 0 до 2 баллов).
По итогам оценки текстов, сгенерированных нейросетями, с помощью техник промпт-инжиниринга была получена диаграмма на рисунке 2 для большей наглядности результатов. Эксперименты с промптами проводились на русском и английском языках. На русском языке было сделано 10 промптов с различными примерами, а на английском – 8 промптов. Максимальный балл за результат, соответствующий всем критериям оценки сгенерированных нейросетями текстов, – 8 баллов. Соответственно, максимальный балл за выполнение всех промптов на русском языке – 80 балла; максимальный балл за выполнение всех промптов на английском языке – 64 баллов.

Рис. 2. Сравнение возможностей текстовых нейросетей
(ChatGPT, GigaChat, YandexGPT, Llama3и Mixtral) при обработке запросов, составленных с помощью техник промпт-инжиниринга
Таким образом, после проведения ряда экспериментов, можно заключить, что нейросеть ChatGPT-4o отлично справляется с промптами и на русском, и на английском языках. Нейросеть Giga Chat обучена на данных на русском и английском языках, как заявляют разработчики. По сравнению с предыдущей версией она работает с запросами на английском языке и отвечает на них. Yandex GPT 2 поддерживает только русский язык и не реагирует на некоторые техники промпт-инжиниринга, такие как promptchaining (цепочка промптов) и directional stimulus prompting (направляющий промптинг). Yandex GPT 3 – более усовершенствованная версия Yandex GPT 2, которая поддерживает английский язык и лучше реагирует на запросы пользователя, но техника prompt chaining и все запросы, состоящие из более 1000 символов, остаются для нейросети нерешаемой задачей. YandexGPT 4 Pro лучше реагирует на запросы пользователя и различные техники промпт-инжиниринга. Как и в предыдущих версиях, запросы от 1000 символов не поддерживает. Локальные нейросети Llama3и Mixtral реагируют на русскоязычные и англоязычные промпты. Стоит отметить, что нейросеть ChatGPT4o и локальные нейросети Llama 3и Mixtral отвечают на запросы, включающие в себя политический или околополитический контекст, в отличие от нейросетей Giga Chat, Yandex GPT 2, 3 и 4.
По результатам сравнения текстовых нейросетей были выявлены сильные и слабые стороны. На их основе можно составить рекомендации по использованию той или иной нейросети для получения определенного результата:
1. Выбор нейросети в соответствии с языком запроса, текста или желаемого результата:
- английский язык – Chat GPT, Giga Chat, Yandex GPT 3 и 4,
- Llama 3, Mixtral;
- русский язык – Chat GPT, Giga Chat, Yandex GPT 2–4,
Llama 3 и Mixtral.
- Выбор техники промпт-инжиниринга и составление промпта.
- Использование подкрепляющего запроса или переформулирование промпта (в случае, если ответ нейросети не устроил пользователя).
- Проверка результата на ошибки и неточности.
Перспективы использования искусственного интеллекта в работе с текстовыми данными обширны и разнообразны. Технологии позволяют оптимизировать составление аналитических отчетов, улучшая точность и снижая временные затраты. Обработка и структуризация текстовой информации обеспечивает упорядочивание больших массивов данных, что важно для аналитики и принятия решений. Визуализация данных с использованием искусственного интеллекта упрощает восприятие сложных аналитических отчетов. Применение трансформеров, таких как Chat GPT, Giga Chat, Yandex GPT, Llama, Mixtral и других, открывает новые возможности в генерации высококачественного контента. Кроме того, искусственный интеллект активно используется для повышения точности машинного перевода и автоматического реферирования.
Проведённое исследование подтверждает, что современные нейросетевые модели способны создавать понятный и качественный контент для различных аудиторий, предоставляя новые возможности для автоматизации работы с текстом.
Литература и источники:
- Информационная аналитика в современном социально-политическом процессе: теория и практика / Ремарчук В.Н., Бочарников И.В., Артемьев А.А., Галаганова С.Г., Гришнова Е.Е., Егоров В.Г., Карась Р.А., Катков О.Н., Ламинина О.Г., Смульский С.В., Шевчун В.Н., Урсул В.И. Москва, 2024.
- Руководство по промпт-инжинирингу [Электронный ресурс] // Prompt Engineering Guide: [сайт]. [2024]. URL: https:www.promptingguide.ai/ru.
- Что такое инженерия подсказок? [Электронный ресурс] // Amazon Web Services: [сайт]. URL: https:aws.amazon.com/ -is/prompt-engineering/.
- Brown T.B., Mann B., Ryder N., Subbiah M., Kaplan J., Dhariwal P., Neelakantan A., Shyam P., Sastry G., Askell A. идр. Language Models are Few-Shot Learners // arXiv. 2020. URL: https: arxiv.org/pdf/2005.14165.pdf.
- Li Z., Peng B., He P., Galley M., Gao J., Yan X. Guiding Large Language Models via Directional Stimulus Prompting // arXiv. 2023. URL: https:arxiv.org/pdf/ 2302.11520.pdf.
- Prompt chaining [Электронный ресурс] // Anthropic: [сайт]. [2024]. URL: https:docs.anthropic.com/claude/docs/prompt-chaining.
- Prompt Engineering [Электронный ресурс] // cohere docs: [сайт]. [2023]. URL: https:/docs.cohere.com/docs/prompt-engineering.
- Wei J., Wang X., Schuurmans D., Bosma M., Ichter B., Xia F., Chi E.H., Le Q.V., Zhou D. Chain-of-Thought Prompting Elicits Reasoning in Large Language Models // arXiv. 2023. URL: https://arxiv.org/.11903.pdf.
Вуйкович А.Д., аспирантка кафедры № 65 «Анализ конкурентных систем» Национальный исследовательский ядерный университет «МИФИ»
