Показатель готовности агента Cloudflare — это настоящий сдвиг. Составное число также не подходит для оптимизации. Вот почему и что делать вместо этого.
<п>На этой неделе готовность агентов перешла от концепции к измеримой инфраструктуре. 17 апреля, когда Неделя агентов Cloudflare продлилась шестой день, компания представила isitagentready.com, общедоступный сканер, который оценивает любой веб-сайт на предмет того, насколько он подготовлен к работе агентов ИИ. Вставьте URL-адрес, получите оценку, посмотрите, какие проверки пройдены, а какие не пройдены, прочитайте рекомендации по улучшению, созданные ИИ. Впервые разговор об агентах удобочитаемости перешел с вопроса «готов ли мой веб-сайт для агентов?» как интуитивное ощущение, что «мой веб-сайт набрал X из 100 в этих пяти категориях, вот сигналы неудачи».
Показатель готовности агента — это настоящий сдвиг. Это также структурно вводящий в заблуждение инструмент, если вы перестанете читать после составного числа.
<п>Я запустил сканирование на этом веб-сайте (nohacks.co) и получил 33 балла из 100, уровень 2 «Bot-Aware». robots.txt пройден. Карта сайта прошла. Правила ИИ-бота в robots.txt пройдены. Сигналы контента пройдены. Затем рейтинг рухнул по категориям, где блогу, состоящему только из контента, действительно не нужно то, что проверяет сканер. Подробнее об этом через минуту.
<п>Во-первых, контекст. Cloudflare всю неделю поставлял инфраструктуру, ориентированную на агентов. Оценка готовности агента появилась вместе с памятью агента, общими словарями, перенаправлениями для обучения ИИ, методом сжатия LLM под названием Unweight и инструментом для проверки функций под названием Flagship, созданным для кода, сгенерированного ИИ. Четырьмя днями ранее они выпустили Project Think (новый Agents SDK), а OpenAI в течение нескольких часов сопоставила его со своим собственным Agents SDK. Я писал об этом в книге «Войны агентов во время выполнения начались на этой неделе». Следующим логическим элементом является сканер готовности: если среда выполнения — это новый уровень браузера, владельцам веб-сайтов нужен способ проверить, читается ли их веб-сайт на этом уровне. Cloudflare отправила тестер.
<п>Вопрос, на который отвечает эта статья, более узкий: что на самом деле проверяет сканер, что вам следует делать со своим результатом и где структурно оценка настолько вводит в заблуждение, что число само по себе вводит вас в заблуждение?
Contents
- 1. Что предлагает Cloudflare: сканер, API и агенты конечной точки MCP, которые могут позвонить вам
- 2. 16 проверок, 5 категорий: Что на самом деле проверяет сканер
- 3. Nohacks.co Оценка 33 из 100, уровень 2 поддержки ботов
- 4. Один и тот же веб-сайт набирает 33 или 67 баллов в зависимости от выбранной вами предустановки
- 5. Готовность агента измеряет доставку, а не сообщение
- 6. 3 риска Гудхарта, включенные в оценку готовности агента
- 7. 6 исправлений выходного дня, соответствующих реальному времени работы агентов
- 8. Скоро появятся сканеры для конкретных поставщиков: отслеживайте, что тестирует каждый сканер
Что предлагает Cloudflare: сканер, API и агенты конечной точки MCP, которые могут вам позвонить
<стр>Сканер находится на сайте isitagentready.com. Вставьте любой URL-адрес, выберите тип веб-сайта («Все проверки», «Сайт контента» или «API/приложение»), чтобы указать, какие сигналы сканируются, нажмите Scan. Сканер извлекает домашнюю страницу и несколько известных путей, выполняет набор проверок для каждого из них и возвращает оценочный отчет с маркерами «прошел/не прошел», кодами состояния, телами ответов и рекомендациями, сгенерированными ИИ, о том, что исправить.
Сканер также доступен тремя другими способами:
<ул> <ли>Интегрирован в Cloudflare Radar, поэтому те же проверки выполняются параллельно с существующим анализом URL-адресов Radar.
мл>
С последним стоит посидеть минутку. Cloudflare предоставила сканер готовности агентов, к которому сами агенты могут обращаться для проверки веб-сайтов, прежде чем решить, как с ними взаимодействовать. Сканер проверяет, готов ли ваш веб-сайт для приема агентов, и любой агент может вызвать его, чтобы решить, как взаимодействовать с вами, прежде чем прибыть. Измерение и измеряемое начинают иметь одну и ту же поверхность.
<п>Вернемся к практическому вопросу. Что именно он проверяет?
16 проверок, 5 категорий: Что на самом деле проверяет сканер
Сканер группирует проверки по пяти категориям. Вот что ищет каждый из них, сгруппированное по тому, что на самом деле означает проверка.
Обнаруживаемость (3 проверки)
Публикует ли веб-сайт основные метаданные, которые агенту необходимо найти, что где находится.
<ул>
мл>
Содержимое (1 проверка)
<ул>
мл>
Контроль доступа ботов (3 проверки)
<ул>
мл>
API, Auth, MCP & Открытие навыков (6 проверок)сильное>
<ул>
мл>
Commerce (3 дополнительных проверки, не учитываются на некоммерческих веб-сайтах)
<ул>
мл> <п>Категория «Коммерция» помечена как “необязательно” на некоммерческих сайтах. Сканер определяет, присутствуют ли какие-либо сигналы электронной торговли, и, если нет, отображает коммерческие чеки в информационных целях, не учитывая их при подсчете баллов.
Последняя деталь дизайна имеет значение. Есть свидетельства того, что Cloudflare предвидел именно ту проблему, о которой пойдет речь в остальной части статьи.
Nohacks.co Оценка 33/100, уровень 2, поддержка ботов
Я просканировал nohacks.co. Результат: <сильный>33 из 100, уровень 2 “Bot-Aware.”
.

<эм>Отчет об оценке готовности агента для nohacks.co, отсканированный 18 апреля 2026 г. Составной: 33/Уровень 2 “Bot-Aware.” Разбивка по категориям: доступность 67 (2/3), контент 0 (0/1), контроль доступа ботов 100 (2/2), API, аутентификация, MCP и amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp; Открытие навыков 0 (0/6). Коммерческие чеки не оценены (сигналы электронной торговли не обнаружены). Изображение предоставлено: Слободан Маниакально
Примечание к этому числу: после первого сканирования я добавил директивы Content Signals в robots.txt, что переместило контроль доступа ботов с 50 на 100 и подняло совокупный показатель на восемь пунктов с первоначальных 25. Все остальные категории ниже не изменились по сравнению с первым сканированием. Я вернусь к исправлению сигналов контента и к тому, почему я его сделал, в конце этого раздела.стр>
Вот что повлияло на оценку каждой категории:
<ул>
мл> <п>Это 33-й сканер, созданный компанией, которой я больше всего доверяю, чтобы понять, куда движется сеть, готовая к работе с агентами. Я считаю, что этот сайт достаточно хорошо спроектирован для агентов. Файл robots.txt чистый и понятный. Содержимое представляет собой машиночитаемый HTML с чистой семантической структурой, отображаемый на сервере. Карта сайта актуальна. URL-адреса стабильны. Если бы неделю назад вы спросили меня, готов ли этот сайт к работе с агентами, я бы ответил что-то среднее между «в основном да» и «в основном да». и “для того, что ему нужно делать, да.”
<п>И еще: 33, Уровень 2.п>
Сканер измеряет то, что говорит. Суммарный балл сам по себе по-прежнему является неправильным числом для оптимизации.
<п>Одно замечание по поводу исправления сигналов контента, поскольку оно имеет отношение к аргументу Гудхарта далее в этой статье. Content Signals — это предложение Cloudflare, которое практически не развертывается за пределами сканеров, ориентированных на Cloudflare. Я обсуждал его добавление именно по той причине, о которой предупреждает эта статья. Я решил, что это защитная реакция по двум причинам. Во-первых, исправление носит декларативный, а не декоративный характер. В директивах изложена реальная политика относительно того, что должно происходить с моим контентом, и это заявление имеет смысл, даже если спецификация не соответствует требованиям. Это отличается от добавления пустой карты сервера MCP для удовлетворения секретаря. Во-вторых, для веб-сайта, который конкретно пишет о готовности агентов, публичное объявление политики в отношении контента является редакционной практикой, независимо от того, какой сканер ее соблюдает. Исправлением было одно изменение в файле public/robots.txt, и директивы доступны для чтения любому человеку, которому достаточно любопытства, чтобы проверить.
Один и тот же веб-сайт набирает 33 или 67 баллов в зависимости от выбранного вами пресета
<п>В наборе настроек «Все проверки» nohacks.co получает 33 балла из 100, уровень 2 «Bot-Aware». В предустановленном контентном сайте тот же веб-сайт, тот же день, другая конфигурация сканирования, он получил оценку 67, по-прежнему уровень 2 “Bot-Aware” Почти в два раза больше составного числа. Разрыв в 34 пункта — это разница между двумя конфигурациями сканирования одного и того же сканера, а не разница между двумя веб-сайтами.
Вот что меняет предустановка сайта контента в конфигурации сканирования:

Настройки сайта контента снимают флажки со всех элементов в категории API/Auth/MCP/Skill Discovery, каждого элемента в категории «Коммерция» и проверки подлинности веб-бота в разделе «Контроль доступа к ботам». Осталось шесть проверенных проверок: три проверки доступности (robots.txt, карта сайта, заголовки ссылок), одна доступность контента (согласование уценки), две проверки доступа к ботам (правила AI-ботов, сигналы контента). Изображение предоставлено: Слободан Маниакально <п>Запуск этого пресета на nohacks.co дал такой результат:

Nohacks.co в настройках сайта контента: 67/уровень 2 “Bot-Aware.” Четыре из шести выигранных проверок проходят успешно. Две неудачные проверки — это заголовки ссылок (исправление, которое я еще не внедрил) и согласование содержимого Markdown (не настроено). И то, и другое — реальные сигналы о том, что работа агентов сегодня только выигрывает. Изображение предоставлено: Слободан Маниакально <п>Четыре из шести выигранных проверок проходят успешно. Эти две ошибки являются однозначными целями исправления: заголовки ссылок через конфигурацию ответа HTTP, согласование содержимого Markdown через источник или логику ответа CDN. Оба сегодня противоречат реальному поведению во время работы агента. Это также не формат на стадии предложения, который, возможно, только станет стандартом. Это честная оценка состояния готовности агента nohacks.co: два конкретных пробела, требующих принятия мер.
Правильный переключатель скрыт, а оценка по умолчанию неверна
Сканер выполняет свою работу. Он знает, что блогу не нужна серверная карта MCP. Он знает, что архив подкастов не публикует каталог API. Настройки «Содержимое сайта» не являются косметическими. Он удаляет ненужные проверки и дает контентному веб-сайту точные показания относительно действительно применимых стандартов.
Проблема в том, что пресет скрыт. Когда пользователь заходит на isitagentready.com и вставляет URL-адрес, по умолчанию используется проверка «Все проверки». Переключатель типа сайта, который переключается на контентный сайт или API/приложение, находится в раскрывающемся списке «Настроить», который большинство пользователей никогда не откроют. Пользователь нажимает «Сканировать», считывает составной номер, делает снимок экрана и делится им. Общее число, которое распространяется в социальных сетях и по которому сравниваются конкуренты, — это совокупный показатель «Все проверки».
<п>Для контентного веб-сайта, который запускает сканирование по умолчанию без чтения отдельных проверок, структура структурно слишком мала. Число 33 на сайте nohacks.co неверно для сайта nohacks.co. 67 из пресета Content Site является точным значением. Два номера с одного сканера на одном сайте. Точное число находится за раскрывающимся списком. На первой странице указан неправильный номер.
<п>Любой веб-профессионал, который запускает сканер и планирует опубликовать результат где угодно, должен открыть «Настроить», выбрать пресет, соответствующий типу его веб-сайта, и запустить его повторно, прежде чем поделиться. Без этого шага общедоступная оценка будет занижать фактическую готовность веб-сайта к работе агента, а разрыв между общим числом и точным числом будет больше для контентных веб-сайтов, чем для веб-сайтов API (которые ближе к базовому показателю всех проверок). Прочтите отдельные чеки. Не публикуйте композицию, пока не узнаете, какой пресет ее создал.
<п>Для справки: меня беспокоит число 67. Я собираюсь пойти и получить 100. Я точно знаю, против чего предостерегает приведенный ниже раздел Гудхарта, и я все равно собираюсь это сделать. Между мной и сотней стоят два исправления. Оба — пятиминутная работа. Оба соответствуют реальному поведению агента во время работы (заголовки ссылок для обнаружения, согласование содержимого Markdown для эффективного анализа агента), так что, по крайней мере, мотивация является законной, а не чистой погоней за результатами. Это предостережение также совпадает с тем, что говорят любители забить. Общественные оценки — это гравитационное поле. Даже человек, написавший длинную статью об их ненадежности, в конечном итоге оказывается на орбите.
Готовность агента измеряется доставкой, а не сообщением
Каждая категория, которую тестирует сканер готовности агента, связана с доставкой: возможность обнаружения, согласование контента, доступ к ботам, обнаружение API, коммерческие протоколы. Никто не проверяет качество самого сообщения.
<п>Сканер никогда не спрашивает, ясны ли ваши заголовки, убедительны ли описания ваших продуктов, хорошо ли ваш контент отвечает на запрос, хорош ли ваш текст. Это вопросы SEO и CRO. Они занимаются дисциплиной, направленной на то, чтобы сделать сообщение лучше. Оценка готовности агента представляет собой совершенно другую дисциплину. Он спрашивает, может ли агент получить ваш контент, проанализировать формат, в котором он поступает, аутентифицироваться на ваших конечных точках, вызвать ваши функции, оплатить ваши выходные данные.
<п>Вот это различие имеет значение. Классическая веб-оптимизация (SEO, CRO) — это то, что вы говорите и насколько убедительно вы это говорите. Готовность агента — это то, как вы доносите то, что говорите, до читателя, не являющегося человеком. Два веб-сайта могут публиковать дословно идентичный контент. Один из них представляет собой HTML-код, отображаемый на сервере, с семантической разметкой, отвечает на Accept: text/markdown, предоставляет структурированные данные, возвращает предсказуемые коды ответов. Другой представляет собой одностраничное приложение, отображаемое на JavaScript, без согласования содержимого и непоследовательной поверхности ошибок. Сообщение идентично. Доставка другая. Оценка готовности агента будет другой. И правильно будет по-другому, ведь доставка – это то, с чем взаимодействует агент.
<п>Именно поэтому исправления готовности агентов, как правило, ортогональны работе по SEO и CRO. Вы можете улучшить показатель готовности агентов, не переписывая ни единого слова своего контента. Вы также можете иметь SEO-контент мирового класса, который получит 10 баллов на сканере готовности агента, поскольку ни один из ваших конвейеров доставки не был разработан для потребителей машин. SEO и CRO работают на уровне контента. Готовность агента работает на транспортном и протокольном уровне. Они смежны, но не являются одним и тем же ремеслом, и относиться к ним как к одному и тому же — это ошибка, которая превращает проект подготовки агентов в проект по переписыванию контента и упускает фактическое исправление.
Люди, которые преуспеют в ближайшие несколько лет, — это те, кто перестанет спорить о том, какая дисциплина важнее, и начнет осознавать, что они занимают разные уровни стека.
3 Риски Гудхарта, встроенные в оценку готовности агента
Закон Гудхарта гласит, что когда мера становится целью, она перестает быть хорошей мерой. Показатель готовности агента хорошо продуман, но теперь он также является общедоступным, общедоступным и сравниваемым показателем, который приводит к трем предсказуемым поведенческим сбоям в дикой природе.
<п>Первый риск заключается в том, что владельцы веб-сайтов будут оптимизировать количество, а не реальное поведение агентов. Добавьте серверную карту MCP, которая никуда не указывает, потому что она нужна сканеру. Опубликуйте индекс навыков агентов без каких-либо реальных навыков. Отправьте инструмент WebMCP, который ничего не делает, просто чтобы пройти проверку обнаружения. Оценка увеличивается, и ничего не меняется для реального времени работы агента, посещающего веб-сайт.
Второй риск заключается в том, что консалтинговые компании начнут продавать “Оптимизацию показателя готовности агентов” как услуга, продающая оценку, а не базовую архитектуру. История SEO дает нам столетние данные о том, как это происходит. PageRank стал целью, и вокруг него выросла десятилетняя экономика ссылочного спама. Целью стала Core Web Vitals, после чего последовало поколение оптимизаций театра производительности. Показатель готовности агента — это более продуманный показатель, чем любой из этих показателей при запуске, но он имеет ту же значимость.
<п>Третий риск заключается в том, что включение в сканер новых стандартов в качестве оцениваемых сигналов ускорит принятие этих стандартов после того момента, когда они будут готовы передавать реальный трафик. Сканер проверяет наличие llms.txt — предлагаемого формата для представления содержимого веб-сайта языковым моделям. Llms.txt не является ратифицированным стандартом, не имеет руководящего органа и имеет конкурирующие предложения по его структуре. Включение его в качестве оцениваемого сигнала придает ему вес, которого он не заработал в экосистеме. Владелец веб-сайта, стремящийся исправить неудачную проверку, является маргинальным пользователем, который превращает предложение в стандарт де-факто до того, как работа над спецификацией будет завершена.
Ни один из этих видов отказа не является гипотетическим. Именно так проявлялись все публичные оценки в истории Интернета. Оценка готовности агента лучше, чем у большинства, потому что Cloudflare честно говорит о том, что это такое, потому что подробные сведения о каждой проверке доступны рядом с составным числом, а также потому, что категория «Коммерция» правильно исключает себя на некоммерческих веб-сайтах. Эту честность стоит защищать. Владельцы веб-сайтов и консалтинговая индустрия в любом случае будут склонны рассматривать составное число как цель.
Не делайте этого.
6 исправлений выходного дня, соответствующих реальному времени работы агентов
<п>Шесть действий для веб-профессионала, запускающего сканер в выходные после его запуска, в порядке от самого высокого кредитного плеча до самого низкого:
<ол>
мл> ли>
ол>
Сканер – это инструмент. Работа остаётся работой.
Сканеры для конкретных поставщиков: отслеживайте, что тестирует каждый сканер
Сканер готовности агента имеет форму списка стандартов: набор проверок по фиксированному списку протоколов и форматов, некоторые из которых ратифицированы (заголовки ссылок RFC 8288, правила robots.txt RFC 9309, обнаружение OAuth RFC 8414, каталог API RFC 9727, защищенный ресурс RFC 9728 OAuth), некоторые новые предложения (MCP). SEP-1649, WebMCP, сигналы контента, проверка подлинности веб-бота, x402, UCP, ACP, llms.txt). Следующее, что произойдет в экосистеме, предсказуемо: другие поставщики будут поставлять свои собственные сканеры в соответствии со своими списками предпочтений. Перекрытие будет значительным, поскольку большинство ратифицированных стандартов не являются противоречивыми. Разница будет заключаться в том, какие предложения получит каждый поставщик.
<п>Именно из-за этого расхождения история измерения готовности агентов становится интересной. Сканер Cloudflare, который проверяет аутентификацию веб-бота и UCP, делает ставку. Сканер Google, если он поставляется, проверит некоторые одни и те же вещи, а некоторые разные (у Google есть UCP, но нет аутентификации веб-бота). Сканер Perplexity проверит наличие еще одного набора. Владельцы веб-сайтов будут видеть разные оценки с разных сканеров на одном и том же веб-сайте. Составное число, уже не заслуживающее доверия, становится зависящим от поставщика.
Сигнал, который стоит отслеживать, — это то, какие проверки отображаются в каждых сканерах, поставляемых в комплекте. Это стандарты де-факто. Чеки, которые отображаются только в сканере Cloudflare, являются ставками Cloudflare. Некоторые победят. Большинство не хочет.
Это шаблон, благодаря которому мне было удобно публиковать статью об инструменте Cloudflare в день его выпуска. Оценка готовности агента реальна. Тезис, лежащий в его основе (готовность агента — это измеримое свойство), является правильным. Конкретная система показателей — это первая версия чего-то, что будет иметь десятки версий, каждая из которых отражает ставки своего поставщика. Веб-профессионалам следует использовать систему показателей первой версии, исправлять то, что она правильно помечает как реальное, следить за тем, что она помечает как появляющееся, и вести собственный текущий список проверок, которые будут сохраняться в каждом сканере, который будет выпущен в ближайшие шесть месяцев.
Этот рабочий список является настоящим стандартом готовности агента. Сводная оценка — это уровень маркетинга.
Запустите сканирование. Прочтите отчет. Исправьте то, что важно. Смотри, что может.стр>
Этот пост был первоначально опубликован на No Hacks.
