Есть ли будущее у професии промпт инженера?

14 июня 2024 г.

Категории: чатботы

В феврале прошлого года, спустя несколько месяцев после запуска ChatGPT, я был одним из первых, кто подробно обсудил новое направление в искусстве — инжиниринг запросов и даже "взлом" запросов в своем информационном бюллетене.

С тех пор я наблюдал, как это узкое увлечение превратилось в широко признанную область и основную профессию с зарплатами, якобы достигающими высот Эмпайр-стейт-билдинг в Нью-Йорке. В своей сути, инжиниринг запросов — это наука об управлении моделями ИИ, создание "идеального" вопроса или команды, которая позволяет ИИ генерировать значимые ответы, словно ключ, открывающий замок и раскрывающий огромный потенциал ИИ.

Однако несколько дней назад компания, с которой всё началось — OpenAI — выпустила новую версию DALL-E, утверждая, что это будет конец инжиниринга запросов, как и заявлял генеральный директор OpenAI Сэм Альтман, считая, что инжиниринг запросов — временная стадия в пути развития ген-ИИ. Учитывая, что человек, который начал всё это, делает такое предсказание, мы должны серьезно к этому отнестись и тщательно рассмотреть текущее состояние инжиниринга запросов.

Создатели DALL-E 3 утверждают, что эта версия понимает значительно больше тонкостей и деталей, чем предыдущие. Это значит, что он переводит идеи в очень точные изображения, лучше, чем прежде.

Итак, у нас есть "интеллектуально превосходная" версия DALL-E. И скоро, возможно, у нас будет более продвинутая версия остальных инструментов ген-ИИ.

Лично я склонен частично согласиться с Сэмом. Вот почему:

Позвольте привести свой пример: я ежедневно использую инструменты ген-ИИ — от текстовых до генераторов изображений и видео, для чего, конечно, нужно вводить свои инструкции машине. Но крайне редко, может всего 1% случаев, я использую шаблонные запросы для этого.

Я понимаю, что более тонкий и "в контексте" запрос дает лучший результат. Поэтому я часто использую 2–3 команды, чтобы получить нужный мне результат. Почти каждый раз выход довольно приличный. И результаты становятся лучше по мере того, как "машина" "понимает" меня со временем.

Несмотря на растущий интерес к генеративному ИИ, большинство людей вроде меня ни разу не создали ни одного профессионального запроса. Но если дача инструкций машине тоже является определением инжиниринга запросов, то, конечно, мы все это делаем.

Один из инструментов, который я использую и которым я крайне доволен, это Microsoft Designer. В одной из его версий была введена функция, где сам ИИ предлагает "профессиональный" запрос на основе ваших исходных данных.

Две вещи здесь важны:

a) Машина сама пишет запрос

б) Результаты на основе моих исходных инструкций и от профессионального запроса сильно не отличаются

Я не хочу утомлять своих читателей техническими деталями, но запросы — это всего лишь инструкции, данные на человеческом языке ИИ. В отличие от компьютеризации и других цифровых технологий, здесь не требуется сложный, кодовый ввод каждый раз, когда вы хотите получить результат. Это благодаря обработке естественного языка (NLP). Это значит, что человеческие разговоры переводятся в язык компьютера ИИ, экономя человеку время, энергию и усилия по изучению "кода".

Я часто задаюсь вопросом, почему инжиниринг запросов стал такой "большой вещью" для широкой аудитории. Я имею в виду, что в самом его основе идея использования ген-ИИ заключается в том, чтобы иметь ассистента, союзника, а возможно и "умного" коллегу, который помогает вам в ваших творческих и профессиональных начинаниях. Так что давать инструкции машине должно быть так же просто, как говорить с другим человеком, верно? По крайней мере, это теоретическая идея. Конечно, в настоящий момент общение между Человеком и Машиной далеко не такое, как между людьми, но кажется, что мы к этому приближаемся.

Когда мы используем вычислительные устройства как обычные пользователи, от нас не требуется знание какого-либо кода для общения. Большинство из нас, даже сегодня, не знает, как использовать HTML, C/C++, C#, Java или что-то подобное. Так почему же должен быть какой-либо инжиниринг ввода для ИИ, который является гораздо более сложной технологией, чем все, что у нас когда-либо было?

Исходя из всего сказанного выше, естественно задать вопрос: стоит ли инжиниринг запросов на грани устаревания? Для меня время для ответа еще не наступило, чтобы ответ мог быть простым "Да" или "Нет".

Инжиниринг запросов, на данный момент, остается неотъемлемой частью функциональности ИИ. Это компас, направляющий нейронные сети через обширные моря человеческого языка, помогая модели генерировать связные, контекстуально точные ответы. Но по мере того, как мы идем в будущее, стремительные технологические достижения говорят о том, что море может измениться.

Одним из таких достижений является переход к автономным системам обучения. Эти модели ИИ спроектированы так, чтобы учиться самостоятельно, без явных инструкций или запросов. Они имитируют способность человеческого мозга поглощать, обрабатывать и реагировать на информацию, снижая потребность в человеческом вмешательстве. Если эти модели в конечном итоге станут реальностью, инжиниринг запросов как наука может утратить свою актуальность.

Как бы ни были сложны текущие машины, им всегда будет не хватать интуиции и творчества, присущих людям. Это гарантирует, что какая-то форма запроса остается. До тех пор, пока не родится Искусственный Общий Интеллект (AGI). Поэтому, хотя ген-ИИ может научиться работать самостоятельно, тонкое понимание языка, контекста и культуры — достижение, достигнутое с помощью запросов — может остаться недостижимым. Таким образом, вероятно, что инжиниринг запросов будет эволюционировать, а не станет неактуальным. Он может трансформироваться от создания явных инструкций к внедрению понимания неявных сигналов в модели ИИ.

Используя точные запросы, мы учим ИИ понимать контекст, догадываться о значении и выдать связные, актуальные ответы. Однако может прийти время, когда простой фразы будет достаточно, чтобы машина полностью поняла ваши намерения.

Более того, идея полной автономии ИИ поднимает этические и безопасностные проблемы. По мере того, как машины становятся более независимыми, риск неправильного использования или непреднамеренных последствий увеличивается. Инжиниринг запросов, таким образом, может служить регуляторным механизмом, обеспечивая ответственное использование технологии ИИ. В этом отношении роль инженеров запросов может сместиться к обеспечению соблюдения этических границ ИИ-приложений.

Должны ли Ученые Сосредоточиться на Формулировке Проблем, а Не на Инжиниринге Запросов?

Огуз А. Огуз, заведующий кафедрой маркетинга в King’s Business School, внес интересный аспект в эту дискуссию. Пишущие в Harvard Business Review, он задается вопросом: "Должны ли ученые тратить больше энергии на формулировку проблем, чем на инжиниринг запросов?"

Формулировка проблемы, по сути, это искусство определения вопросов, которые ИИ должен ответить или решить. Это выявление пробелов, определение границ и задание курса для наших решений, основанных на ИИ. В отличие от инжиниринга запросов, который больше связан с инструкциями ИИ по реакции, формулировка проблем сосредоточена на том, какие проблемы ИИ должен решать в первую очередь.

Когда мы рассматриваем ИИ через призму формулировки проблем, наша перспектива смещается от инструкции к исследованию. Мы спрашиваем: "Какие вопросы может помочь решить ИИ?", а не "Как заставить ИИ реагировать правильно?" Этот сдвиг требует глубокого понимания как возможностей ИИ, так и человеческих потребностей. Это требует междисциплинарного подхода, сочетающего технологию с социологией, психологией, экономикой и многими другими науками.

Действительно, некоторые утверждают, что этот целостный, ориентированный на проблему подход может привести к более значительным достижениям в ИИ. Вместо того чтобы сосредоточиваться узко на уточнении запросов, которые мы вводим в системы ИИ, мы могли бы добиться большего, расширяя наш взгляд и обращаясь к большим, более сложным общественным проблемам. Потенциал ИИ для революционирования здравоохранения, образования, охраны окружающей среды и множества других областей огромен. Конечно, чтобы реализовать этот потенциал, мы должны сначала определить правильные проблемы для ИИ. Но это уже другая история.

(Признание: некоторая помощь была получена от машины для написания/переписывания фрагментов этого бюллетеня.)

Скопировано

Категории

чатботы

Что такое ChatGPT?

ChatGPT, сокращение от Chat Generative Pre-trained Transformer, является интерфейсом чата, основанным на крупных языковых моделях (LLM), которые обучены массивной базой данных с 117 миллионами параметров и 4,6 гигабайтами информации, и могут отвечать практически на любые вопросы с использованием обработки естественного языка.

Разработанный OpenAI, ChatGPT способен вести разговоры, похожие на человеческие, и выполнять множество творческих задач, получая подсказки от пользователей.

Его потрясающая способность заключается в том, чтобы суммировать контент, предлагать исправления для кода или некоторых языков программирования, генерировать изображения, писать маркетинговые письма и многое другое.

Удивительно, что его можно использовать для создания новых текстов песен и рассказов для фильмов 一 все с нуля и инновационно, как никто не делал ранее.

Potенциал ChatGPT так велик, что ожидается, что индустрия будет синтетически производить 30% исходящих маркетинговых сообщений к 2025 году.

Могут ли предприятия использовать потенциал ChatGPT для разговорного ИИ?

ChatGPT может генерировать текстовые ответы на основе подтекста, используя глубокую модель обучения, однако ему сложно предоставить решения для конечных пользователей в режиме реального времени. Это означает, что ChatGPT вряд ли поможет создать разговорный чат-бот или виртуального помощника, который может взаимодействовать с людьми и предлагать решения.

Наоборот, платформы разговорного ИИ, которые наделены функциями, такими как обработка естественного языка, распознавание намерений и извлечение контекста, могут легко понять запросы людей и предложить решение.

Как ChatGPT отличается от платформ разговорного ИИ для предприятий?

Существует несколько путей, по которым ChatGPT отличается от платформ разговорного ИИ для предприятий.

Недостатки ChatGPT как платформы разговорного ИИ для предприятий

Отсутствие интеграции с корпоративными системами

ChatGPT не предлагает доступ к API для интеграции с внутренними корпоративными системами, что исключает использование ChatGPT для взаимодействия с такими системами, как CRM, ERP и другими платформами. Это препятствует его способности масштабировать рабочие процессы и разрешать проблемы в реальном времени.

Отсутствие возможности кастомизации

Для эффективной работы корпоративных операций требуется актуальная информация. ChatGPT трудно кастомизировать для выполнения специфических корпоративных задач.

Уязвимость к атакам на основе подтекстов

ChatGPT базирует свои ответы на огромной базе данных, что делает его уязвимым для создания неэтичных или предвзятых текстов.

Проблемы безопасности

LLM модели, такие как ChatGPT, могут хранить данные, которые ими обрабатываются, что создает риски утечки данных.

Нехватка объяснимости и точности

ChatGPT является 'черным ящиком', что означает, что его ответы трудно интерпретировать и проверять на достоверность.

Высокие затраты на внедрение

Для использования возможностей ChatGPT на уровне предприятия требуются большие бюджеты на инфраструктуру и обслуживание.

Как Workativ использует ChatGPT для улучшения разговорного ИИ для предприятий?

Workativ использует возможности ChatGPT для автоматического создания контента и улучшения поиска знаний, извлечения намерений и генерации диалогов для виртуальных помощников.

Заключение

ChatGPT имеет огромный потенциал для улучшения пользовательского опыта, хотя его возможности для корпоративного использования ограничены. Платформы, такие как Workativ, могут комбинировать ChatGPT с разговорным ИИ для достижения высокой операционной эффективности в корпоративной среде.

Таким образом, улучшение опыта сотрудников и клиентов с использованием виртуальных помощников от Workativ и интеграция с ChatGPT могут значительно повысить результаты бизнеса.