После запуска ChatGPT в 2022 году инженерия подсказок — искусство составления умных запросов для получения наилучших результатов от больших языковых моделей (LLM) и генераторов ИИ — стала навязчивой идеей. Интернет наводнен бесчисленными руководствами, шпаргалками и советами, призванными помочь пользователям овладеть этим навыком.
Однако новое исследование показывает, что будущее разработки подсказок может оказаться в руках самих моделей, что потенциально может привести к тому, что 90% людей, занимающихся разработкой подсказок, станут не нужны.
Авторы исследования Рик Бэттл и Теджа Голлапуди из VMware проверили влияние различных стратегий разработки подсказок на способность LLM решать вопросы по математике в начальной школе. Удивительно, но они обнаружили, что самые эффективные подсказки генерировались самой языковой моделью, зачастую превосходя лучшие подсказки, разработанные человеком. Эти подсказки, сгенерированные ИИ, были не только более успешными, но и причудливо креативными: в одну из них даже была включена ссылка на «Звездный путь», чтобы улучшить математические показатели модели.
Эта тенденция распространяется не только на LLM, но и на алгоритмы генерации изображений. Васудев Лал из Intel Labs и его команда разработали NeuroPrompts — инструмент, который автоматически улучшает простые подсказки для создания более качественных изображений с помощью метода стабильной диффузии. Сочетая подсказки экспертного уровня, обучение языковой модели и обучение с подкреплением, NeuroPrompts постоянно превосходит человеческие подсказки, согласно метрике оценки изображений PickScore.
Как бизнесмен, я считаю, что, хотя работа инженеров-подсказчиков может эволюционировать, она не исчезнет совсем. Адаптация генеративного ИИ к потребностям индустрии — это сложный, многоступенчатый процесс, который по-прежнему будет требовать вмешательства человека». Тим Креймер, старший вице-президент по разработке программного обеспечения в Red Hat, подчеркивает, что оперативные инженеры и специалисты по изучению данных будут по-прежнему необходимы для решения задач, выходящих за рамки простого задавания вопросов и обеспечения хороших ответов.
Проблемы создания продуктов ИИ коммерческого уровня включают в себя обеспечение надежности, адаптацию выходных данных моделей к соответствующим форматам, всестороннее тестирование и обеспечение безопасности, конфиденциальности и соответствия нормативным требованиям.
Чтобы решить эти проблемы, многие крупные компании вводят новую должность: Large Language Model Operations (LLMOps), которая включает в себя оперативное проектирование и все остальные задачи, необходимые для успешного внедрения продуктов ИИ.
Поскольку модели ИИ продолжают быстро развиваться, характер работы инженеров по разработке подсказок, скорее всего, тоже изменится. Лал считает, что взаимодействие между людьми и моделями ИИ будет постоянно трансформироваться по мере развития самих моделей.
Креймер добавляет, что, хотя названия должностей могут измениться, потребность в человеческих знаниях в этой области сохранится в обозримом будущем.
На этом «Диком, Диком Западе» развития ИИ, по словам бывшего сотрудника Microsoft Остина Хенли, единственным непреложным правилом, похоже, является отсутствие правил. Пока компании пытаются использовать возможности LLM для всех мыслимых вариантов использования, ландшафт меняется беспрецедентными темпами.
Хотя будущее оперативной инженерии может быть неопределенным, ясно одно: симбиотические отношения между человеческим опытом и инновациями, управляемыми искусственным интеллектом, будут определять эту отрасль еще долгие годы.