Войны времени выполнения агентов начались на этой неделе

Разговор с моделью отвлекает. Среда выполнения агента теперь является промежуточным звеном между искусственным интеллектом и вашим веб-сайтом, и большинство веб-профессионалов еще этого не заметили.

Среда выполнения агента — это новый уровень браузера, и ваш веб-сайт будет оцениваться по среде выполнения, а не по какой-либо отдельной модели.

<п>Это сдвиг, которого веб-профессионалы еще не совершили. Разговор по-прежнему ведется вокруг моделей. Какая модель пишет лучше? Какая из них цитирует точнее? Какой из API дешевле в этом месяце? Разговоры о моделях громкие, потому что новые модели выпускаются каждые несколько недель, и каждый выпуск является театральным.

Под этим стоит интересная история. Фундамент восстанавливается. На этой неделе игнорировать было невозможно.

Стек среды выполнения будет выпущен в апреле

<п>15 апреля Cloudflare выпустила Project Think, новый пакет SDK для агентов, построенный на устойчивом выполнении с восстановлением после сбоя и контрольными точками, субагентах, которые запускаются как изолированные дочерние элементы, постоянных сеансах с сообщениями с древовидной структурой и выполнении кода в изолированной программной среде, выполняемом на динамических рабочих процессах. Через несколько часов в тот же день OpenAI выпустила следующую эволюцию своего Agents SDK со встроенной песочницей и встроенными в модель средствами. Два крупнейших инфраструктурных оператора в Интернете предоставили конкурирующие ответы на один и тот же вопрос, и вопрос заключался в следующем: как долго работающий ИИ-агент на самом деле работает в рабочей среде?

<п>Затем, 16 апреля, Cloudflare добавила еще пять штук. Платформа AI: независимый от поставщика уровень вывода, который маршрутизирует модели для агентов. AI Search: векторный индекс плюс конвейер фрагментации, поставляемый как управляемый продукт специально для поиска агентов, конкурирующий с Pinecone и Algolia на уровне RAG на стороне агента, а не с режимом Google AI. Служба электронной почты в публичной бета-версии, разработанная для того, чтобы агенты могли использовать в качестве канала самый универсальный интерфейс в мире. PlanetScale Postgres и MySQL внутри воркеров. И инженерная основа для размещения очень крупных программ LLM с открытым исходным кодом, таких как Kimi K2.5, непосредственно в сети Cloudflare.

<п>Сундар Пичаи описал тот же сдвиг неделей ранее. В подкасте Cheeky Pint от 7 апреля с сооснователем Stripe Джоном Коллисоном он назвал сам Поиск «менеджером агентов»: «Многие из запросов, связанных с поиском информации, в Поиске будут агентными. Вы будете выполнять задания. У вас будет работать много потоков.” Множество потоков на запрос — это описание поиска во время выполнения. Генеральный директор Google указывает на одну и ту же подложку Cloudflare и OpenAI, представленную на этой неделе.

Если OpenClaw был агентской сетью для потребителей (игровая демоверсия, интересный прототип, что-то, на что можно помахать), то это агентская сеть для взрослых. Прочный. В песочнице. Поддается проверке. Тип инфраструктуры, на которой вы действительно будете вести бизнес.

<п>Во всем этом есть одна закономерность: время выполнения. Не та модель. Не приложение для потребительского чата. Не основной слайд. Среда выполнения — это уровень, на котором агенты разворачиваются и сохраняются в течение нескольких часов и дней при наличии доступа к файловой системе, доступу к сети и памяти. Среда выполнения — это уровень, который решает, переживет ли сеанс агента сбой, можно ли рассуждать о его субагентах, сдержать ли выполнение его кода.

Неправильный вопрос и новый

Веб-профессионалы последние 18 месяцев задавали неправильные вопросы. Вопрос заключался в следующем: какую модель ИИ нам следует оптимизировать для ? ChatGPT, Claude, Gemini или Perplexity. Чьи цитаты важнее? Чей сканер мы должны пропустить? Этот разговор имел смысл, когда модели напрямую читали ваш сайт.

<п>Их больше нет. Модель считывает то, что передает ей среда выполнения. Среда выполнения извлекает вашу страницу. Среда выполнения анализирует его. Среда выполнения выполнила (или не выполнила) ваш JavaScript. Среда выполнения разрешила ваши структурированные данные. Аутентификация, согласованная во время выполнения. Когда модель видит что-либо на вашем веб-сайте, она видит интерпретацию этого во время выполнения.

Новый вопрос, если вы серьезно отнесетесь к этой неделе, заключается в том, в какой среде выполнения агента читается ваш веб-сайт. Три вещи, которые стоит проверить до следующей недели:

<ол> <ли>Возвращают ли ваши наиболее важные конечные точки машиночитаемые структурированные ответы или они корректно отображаются только в течение полного сеанса браузера?

Ограничена ли ваша аутентификация таким образом, чтобы агент, действующий от имени пользователя, мог поддерживать сеанс на протяжении нескольких вызовов, или она поддерживает только однократный вход в систему человека?

Означают ли ваши структурированные данные то же самое, если среда выполнения, которая не выполняла ваш JavaScript, попыталась их прочитать?

Это вопросы, связанные с читабельностью во время выполнения. Модель не имеет к ним никакого отношения. Среда выполнения решает, находится ли ваш ответ даже в контекстном окне модели, и модель выбирает из того, что передает среда выполнения.

Сантехника сети восстанавливается. Каждая модель в ближайшие два года будет видеть ваш сайт через одну из этих сред выполнения, а не напрямую. Задача вашего веб-сайта, начиная с этого момента, — сделать его разборчивым во время выполнения.

<стр>Разговор с моделью будет продолжаться на сценах конференции и в основных слайдах. Обсуждение во время выполнения происходит в журналах изменений продуктов инфраструктурных компаний. Компании, поставляющие среду выполнения, будут решать, какие веб-сайты будут доступны для поиска с помощью ИИ и коммерции с использованием ИИ. Хватит спрашивать, какая модель. Начните спрашивать, какая среда выполнения.

Этот пост был первоначально опубликован на No Hacks.