Есть ли будущее у професии промпт инженера?

профессия промпт инженер

В феврале прошлого года, спустя несколько месяцев после запуска ChatGPT, я был одним из первых, кто подробно обсудил новое направление в искусстве — инжиниринг запросов и даже "взлом" запросов в своем информационном бюллетене.

С тех пор я наблюдал, как это узкое увлечение превратилось в широко признанную область и основную профессию с зарплатами, якобы достигающими высот Эмпайр-стейт-билдинг в Нью-Йорке. В своей сути, инжиниринг запросов — это наука об управлении моделями ИИ, создание "идеального" вопроса или команды, которая позволяет ИИ генерировать значимые ответы, словно ключ, открывающий замок и раскрывающий огромный потенциал ИИ.

Однако несколько дней назад компания, с которой всё началось — OpenAI — выпустила новую версию DALL-E, утверждая, что это будет конец инжиниринга запросов, как и заявлял генеральный директор OpenAI Сэм Альтман, считая, что инжиниринг запросов — временная стадия в пути развития ген-ИИ. Учитывая, что человек, который начал всё это, делает такое предсказание, мы должны серьезно к этому отнестись и тщательно рассмотреть текущее состояние инжиниринга запросов.

Создатели DALL-E 3 утверждают, что эта версия понимает значительно больше тонкостей и деталей, чем предыдущие. Это значит, что он переводит идеи в очень точные изображения, лучше, чем прежде.

Итак, у нас есть "интеллектуально превосходная" версия DALL-E. И скоро, возможно, у нас будет более продвинутая версия остальных инструментов ген-ИИ.

Лично я склонен частично согласиться с Сэмом. Вот почему:

Позвольте привести свой пример: я ежедневно использую инструменты ген-ИИ — от текстовых до генераторов изображений и видео, для чего, конечно, нужно вводить свои инструкции машине. Но крайне редко, может всего 1% случаев, я использую шаблонные запросы для этого.

Я понимаю, что более тонкий и "в контексте" запрос дает лучший результат. Поэтому я часто использую 2–3 команды, чтобы получить нужный мне результат. Почти каждый раз выход довольно приличный. И результаты становятся лучше по мере того, как "машина" "понимает" меня со временем.

Несмотря на растущий интерес к генеративному ИИ, большинство людей вроде меня ни разу не создали ни одного профессионального запроса. Но если дача инструкций машине тоже является определением инжиниринга запросов, то, конечно, мы все это делаем.

Один из инструментов, который я использую и которым я крайне доволен, это Microsoft Designer. В одной из его версий была введена функция, где сам ИИ предлагает "профессиональный" запрос на основе ваших исходных данных.

Две вещи здесь важны:

a) Машина сама пишет запрос

б) Результаты на основе моих исходных инструкций и от профессионального запроса сильно не отличаются

Я не хочу утомлять своих читателей техническими деталями, но запросы — это всего лишь инструкции, данные на человеческом языке ИИ. В отличие от компьютеризации и других цифровых технологий, здесь не требуется сложный, кодовый ввод каждый раз, когда вы хотите получить результат. Это благодаря обработке естественного языка (NLP). Это значит, что человеческие разговоры переводятся в язык компьютера ИИ, экономя человеку время, энергию и усилия по изучению "кода".

Я часто задаюсь вопросом, почему инжиниринг запросов стал такой "большой вещью" для широкой аудитории. Я имею в виду, что в самом его основе идея использования ген-ИИ заключается в том, чтобы иметь ассистента, союзника, а возможно и "умного" коллегу, который помогает вам в ваших творческих и профессиональных начинаниях. Так что давать инструкции машине должно быть так же просто, как говорить с другим человеком, верно? По крайней мере, это теоретическая идея. Конечно, в настоящий момент общение между Человеком и Машиной далеко не такое, как между людьми, но кажется, что мы к этому приближаемся.

Когда мы используем вычислительные устройства как обычные пользователи, от нас не требуется знание какого-либо кода для общения. Большинство из нас, даже сегодня, не знает, как использовать HTML, C/C++, C#, Java или что-то подобное. Так почему же должен быть какой-либо инжиниринг ввода для ИИ, который является гораздо более сложной технологией, чем все, что у нас когда-либо было?

Исходя из всего сказанного выше, естественно задать вопрос: стоит ли инжиниринг запросов на грани устаревания? Для меня время для ответа еще не наступило, чтобы ответ мог быть простым "Да" или "Нет".

Инжиниринг запросов, на данный момент, остается неотъемлемой частью функциональности ИИ. Это компас, направляющий нейронные сети через обширные моря человеческого языка, помогая модели генерировать связные, контекстуально точные ответы. Но по мере того, как мы идем в будущее, стремительные технологические достижения говорят о том, что море может измениться.

Одним из таких достижений является переход к автономным системам обучения. Эти модели ИИ спроектированы так, чтобы учиться самостоятельно, без явных инструкций или запросов. Они имитируют способность человеческого мозга поглощать, обрабатывать и реагировать на информацию, снижая потребность в человеческом вмешательстве. Если эти модели в конечном итоге станут реальностью, инжиниринг запросов как наука может утратить свою актуальность.

Как бы ни были сложны текущие машины, им всегда будет не хватать интуиции и творчества, присущих людям. Это гарантирует, что какая-то форма запроса остается. До тех пор, пока не родится Искусственный Общий Интеллект (AGI). Поэтому, хотя ген-ИИ может научиться работать самостоятельно, тонкое понимание языка, контекста и культуры — достижение, достигнутое с помощью запросов — может остаться недостижимым. Таким образом, вероятно, что инжиниринг запросов будет эволюционировать, а не станет неактуальным. Он может трансформироваться от создания явных инструкций к внедрению понимания неявных сигналов в модели ИИ.

Используя точные запросы, мы учим ИИ понимать контекст, догадываться о значении и выдать связные, актуальные ответы. Однако может прийти время, когда простой фразы будет достаточно, чтобы машина полностью поняла ваши намерения.

Более того, идея полной автономии ИИ поднимает этические и безопасностные проблемы. По мере того, как машины становятся более независимыми, риск неправильного использования или непреднамеренных последствий увеличивается. Инжиниринг запросов, таким образом, может служить регуляторным механизмом, обеспечивая ответственное использование технологии ИИ. В этом отношении роль инженеров запросов может сместиться к обеспечению соблюдения этических границ ИИ-приложений.

Должны ли Ученые Сосредоточиться на Формулировке Проблем, а Не на Инжиниринге Запросов?

Огуз А. Огуз, заведующий кафедрой маркетинга в King’s Business School, внес интересный аспект в эту дискуссию. Пишущие в Harvard Business Review, он задается вопросом: "Должны ли ученые тратить больше энергии на формулировку проблем, чем на инжиниринг запросов?"

Формулировка проблемы, по сути, это искусство определения вопросов, которые ИИ должен ответить или решить. Это выявление пробелов, определение границ и задание курса для наших решений, основанных на ИИ. В отличие от инжиниринга запросов, который больше связан с инструкциями ИИ по реакции, формулировка проблем сосредоточена на том, какие проблемы ИИ должен решать в первую очередь.

Когда мы рассматриваем ИИ через призму формулировки проблем, наша перспектива смещается от инструкции к исследованию. Мы спрашиваем: "Какие вопросы может помочь решить ИИ?", а не "Как заставить ИИ реагировать правильно?" Этот сдвиг требует глубокого понимания как возможностей ИИ, так и человеческих потребностей. Это требует междисциплинарного подхода, сочетающего технологию с социологией, психологией, экономикой и многими другими науками.

Действительно, некоторые утверждают, что этот целостный, ориентированный на проблему подход может привести к более значительным достижениям в ИИ. Вместо того чтобы сосредоточиваться узко на уточнении запросов, которые мы вводим в системы ИИ, мы могли бы добиться большего, расширяя наш взгляд и обращаясь к большим, более сложным общественным проблемам. Потенциал ИИ для революционирования здравоохранения, образования, охраны окружающей среды и множества других областей огромен. Конечно, чтобы реализовать этот потенциал, мы должны сначала определить правильные проблемы для ИИ. Но это уже другая история.

(Признание: некоторая помощь была получена от машины для написания/переписывания фрагментов этого бюллетеня.)