
Силиконовая долина в восторге от агентов ИИ. Генеральный директор OpenAI Сэм Альтман сказал, что агенты в этом году "присоединятся к рабочей силе". Генеральный директор Microsoft Сатья Наделла предсказал, что агенты заменят определенные виды работ. Генеральный директор Salesforce Марк Бениофф заявил, что цель Salesforce - стать "номер один поставщиком цифрового труда в мире" благодаря различным "агентистическим" услугам компании.
Но никто не может согласиться на точное определение, что такое агент ИИ.
За последние несколько лет технологическая индустрия утверждала, что ИИ "агенты" - самое последнее модное слово - изменят все. Так же, как ИИ-чатботы, такие как ChatGPT от OpenAI, дали нам новые способы доступа к информации, агенты кардинально изменят наш подход к работе, утверждают генеральные директоры типа Альтмана и Наделлы.
Это может быть правдой. Но это также зависит от того, как кто-то определяет "агентов", что не является легкой задачей. Подобно другим терминам, связанным с ИИ (например, "мультимодальный", "ИИ общего интеллекта" и сам "ИИ"), термины "агент" и "агентиская" становятся размытыми до степени бессмысленности.
Это угрожает оставить OpenAI, Microsoft, Salesforce, Amazon, Google и бесчисленные другие компании, создающие целые линейки продуктов на основе агентов, в неудобном положении. Агент от Amazon не то же самое, что агент от Google или любого другого поставщика, и это приводит к путанице - и разочарованию клиентов.
Райан Салва, старший директор по продукту в Google и бывший лидер GitHub Copilot, сказал, что он начал "ненавидеть" слово "агенты".
"Я думаю, что наша индустрия злоупотребляет термином 'агенты' до такой степени, что он почти нелеп", - сказал Салва в интервью TechCrunch. "Это один из моих главных брезгливый пунктов".
Дилемма определения агента не нова. В статье прошлого года бывший репортер TechCrunch Рон Миллер спрашивал: Что такое агент ИИ? Проблему, которую он выявил, заключается в том, что практически каждая компания, создающая агентов, подходит к технологии по-разному.
Эта проблема в последнее время усугубилась.
На этой неделе OpenAI опубликовала блог, в котором определила агентов как "автоматизированные системы, способные автономно выполнять задачи от имени пользователей". Тем не менее, в ту же неделю компания выпустила разработчиков документации, определяющие агентов как "LLM, оснащенные инструкциями и инструментами".
Лехер Патак, руководитель маркетинга продукта API в OpenAI, затем заявила в сообщении на X, что она понимает термины "ассистенты" и "агенты" как взаимозаменяемые - дальнейшее затуманивание вод.
Тем временем в блогах Microsoft пытаются разграничить агентов и ИИ-помощников. Первые, которых Microsoft называет "новыми приложениями" для "ИИ-включенного мира", могут быть настроены на определенное направление, в то время как помощники просто помогают с общими задачами, такими как написание электронных писем.
Исследовательская лаборатория Anthropic немного более прямо решает проблему рассогласования определений агентов. В блоге Anthropic говорится, что агентов "можно определить несколькими способами", включая как "полностью автономные системы, которые работают независимо в течение продолжительного времени", так и "поставленные варианты, которые следуют за ранее определенными рабочими процессами".
У Salesforce, пожалуй, самое широкое определение ИИ-"агентов". Согласно этому крупнейшему в мире разработчику программного обеспечения, агенты - это "тип […] системы, которая способна понимать и отвечать на запросы клиентов без человеческого вмешательства". На веб-сайте компании перечислены шесть различных категорий, начиная от "простых рефлексивных агентов" до "агентов на основе полезности".
Так почему такой хаос?
Ну, агенты - как и ИИ - являются нечто неопределенным и неустойчиво. OpenAI, Google и Perplexity только начали отправлять то, что они считают своими первыми агентами - Operator OpenAI, Project Mariner Google и shopping agent Perplexity - и их возможности весьма разнообразны.
Рич Вилларс, вице-президент по всемирным исследованиям в IDC, отметил, что технологические компании "имеют долгую историю" не строгого придерживания технических определений.
"Им важнее то, чего они пытаются достичь" на техническом уровне, сказал Вилларс в интервью TechCrunch, "особенно в быстро развивающихся рынках".
Но маркетинг также во многом виноват, считает Андрю Нг, основатель платформы обучения ИИ DeepLearning.ai.
"Понятия 'ИИ-агенты' и 'агентные' рабочие процессы раньше имели технический смысл", - сказал Нг в недавнем интервью, "но примерно год назад ими начали пользоваться маркетологи и несколько крупных компаний".
Отсутствие общепризнанного определения агентов является как возможностью, так и вызовом, говорит Джим Роуэн, руководитель ИИ в Deloitte. С одной стороны, неопределенность дает гибкость, позволяя компаниям настраивать агентов под свои нужды. С другой стороны, это может - и, пожалуй, уже привело к "несогласованным ожиданиям" и сложностям в измерении ценности и ROI от агентских проектов.
"Без стандартизированного определения, по крайней мере внутри организации, становится сложно оценить производительность и обеспечить систематические результаты", - сказал Роуэн. "Это может привести к разнообразным интерпретациям того, что должны представлять из себя ИИ-агенты, что, вероятно, усложнит цели и результаты проектов. В конечном итоге, хотя гибкость может стимулировать креативные решения, более стандартизированное понимание помогло бы предприятиям лучше ориентироваться в ландшафте ИИ-агентов и максимизировать свои инвестиции."
К сожалению, если распад термина "ИИ" является каким-либо указанием, кажется маловероятным, что отрасль скоро сойдется на одном определении "агента" - вряд ли когда-либо.