Lighthouse не работает с вашим Llms.txt без ссылок Markdown

Пятисимвольное исправление превратило неудачный аудит Lighthouse Agentic Browsing в чистый проход. Что это говорит о том, что на самом деле измеряет аудит.

Новый аудит Chrome Lighthouse Agentic Browsing рассматривает ваш файл .txt как документ с уценкой. Если ваш llms.txt не использует синтаксис ссылок уценки, вы не пройдете аудит, даже если каждая ссылка в файле точна и работает. Я провел аудит на nohacks.co. Пройдены две из шести проверок. Трое вернулись неприменимыми. Один из них не удался: проверка llms.txt с дословной ошибкой “Файл не содержит никаких ссылок.” Исправление состояло из пяти символов на ссылку. Файл по-прежнему отображается в виде обычного текста. Изменился только результат аудита.

1 из 6 проверок на Nohacks.co не пройдены

<п>Я провел аудит через интерфейс командной строки Lighthouse: npx Lighthouse@latest https://nohacks.co –only-categories=agentic-browsing. Шесть проверок вернулись. Три вернулись неприменимыми, все WebMCP: webmcp-registered-tools, webmcp-form-coverage и webmcp-schema-validity. Lighthouse не дает никаких оснований для неприменимого результата, он просто отмечает проверку и идет дальше. nohacks.co предоставляет WebMCP, но только через экспериментальный императивный API-интерфейс navigator.modelContext (два инструмента глоссария, два для каталога агентного браузера), без каких-либо аннотаций декларативной формы. Сканирование выполнялось в Chrome 150 без интерфейса по умолчанию без флага WebMCP, поэтому неприменимый вердикт может означать, что на веб-сайте нет ничего, что распознается этими аудитами, или что в среде сканирования в тот момент не было активного API WebMCP. Маяк не говорит какой именно. Две проверки прошли чисто: агент-доступность-дерево сообщило “Все проверки пройдены”, подтвердив, что семантическая структура HTML и ARIA достаточно хорошо сформирована для навигации агентов, а совокупный сдвиг макета вернулся к нулю.

Одна проверка не удалась: llms-txt. Дословное сообщение об ошибке от Lighthouse было:

Похоже, что файл не содержит ссылок.

Оценка категории составила 0,67. Это был первый сюрприз. В файле nohacks.co/llms.txt имеется множество ссылок. Пути навигации к статьям, выпускам, гостям, глоссарию. URL-адреса RSS-каналов. Шаблоны URL-адресов аудиофайлов. Файл содержит более пяти килобайт структурированного контента. Так почему же Lighthouse сообщил об отсутствии ссылок?

Lighthouse анализирует .txt как уценку и отклоняет обычные текстовые ссылки

<п>Расширение файла — .txt, но Lighthouse анализирует содержимое как уценку и требует синтаксис ссылки уценки, чтобы любой текст считался ссылкой. Файл называется llms.txt. HTTP-сервер возвращает его с текстовым/простым типом MIME. Откройте его в браузере и вы увидите обычный текст. Но спецификация llms.txt на сайте llmstxt.org определяет этот формат как документ с уценкой. Спецификация очевидна: “Каждый раздел содержит маркированный список ссылок. Каждый элемент списка имеет ссылку, за которой следуют необязательные примечания о ссылке, отделенные от ссылки двоеточием.” Синтаксический анализатор Lighthouse строго следит за этим. Каждая ссылка должна быть закодирована в виде синтаксиса уцененной ссылки, [текст](url), с квадратными скобками вокруг текста ссылки и круглыми скобками вокруг URL-адреса.

Мой файл использовал более естественный текстовый формат:

– Домашняя страница:/- Заголовок публикации, краеугольные серии, последние статьи и выпуски – Статьи: /blog – Все статьи об AXO, агентской сети и агентах искусственного интеллекта. – Эпизод: /episode/[slug] – Полные заметки к шоу, стенограмма, аудиоплеер. <стр>Те же пункты назначения. Те же описания. Та же информация. Парсер Lighthouse не регистрирует эти строки как ссылки. Во всем файле он зарегистрировал ровно ноль. Проверка не удалась.

<п>Файл с расширением .txt, обслуживаемый с типом MIME text/plain, который не проходит проверку, если он не отформатирован как уценка. Это несоответствие, в отношении которого уровень аудита должен быть более честным. Расширение говорит одно. Тип MIME говорит об одном. Парсер — источник истины, и он требует уценки.

Исправление: 5 символов на ссылку

Оберните каждую цель ссылки в синтаксис скобок и скобок уценки, [текст](url), и замените разделитель – перед каждым описанием на : . Пять символов по ссылке. Механическое преобразование, повторяющееся по всему файлу.

– [Домашняя страница](/): шапка публикации, краеугольные серии, последние статьи и выпуски. – [Статьи](/блог): все статьи об AXO, агентской сети и агентах искусственного интеллекта. – [Эпизод](/episode/[slug]): полные заметки к шоу, стенограмма, аудиоплеер. <п>Я внес правку. Повторно провел аудит. Оценка изменилась с 0,67 до 1,0. Название аудита изменено с “llms.txt не соответствует рекомендациям” на “llms.txt следует рекомендациям.” В итоговом отчете нет подробных сведений. Чистый проход.

Файл по-прежнему обрабатывается как текстовый/обычный. Расширение файла по-прежнему .txt. Содержимое файла остается тем же. Изменилась только кодировка ссылки.

Lighthouse измеряет синтаксис анализируемых ссылок, а не качество файла

Аудит проверяет, можно ли механически разобрать ваш файл. Он не проверяет, содержит ли файл полезное описание вашего веб-сайта. Оба чтения истинны одновременно.

<п>Первое чтение: Аудит измеряет что-то реальное. Синтаксис ссылок Markdown поддается механическому анализу. Описательные строки в виде обычного текста — нет. Если агенту ИИ (или парсеру Lighthouse, заменяющему агент) необходимо программно извлечь ссылки из файла, требуется формат уценки. Аудит верен: файл до моего исправления не мог быть проанализирован на наличие ссылок стандартными инструментами. Преобразование в синтаксис ссылок уценки устраняет реальный пробел в совместимости.

<п>Второе прочтение: соответствие формата — это не то же самое, что качество файла. Тщательно написанный, точный и всеобъемлющий файл llms.txt, в котором используются текстовые описания, не проходит проверку. Проходит тонкий автоматически созданный файл llms.txt с синтаксисом ссылки уценки. Аудит не может определить разницу между ними. Плагин WordPress AIOSEO, используемый более чем 3 миллионами веб-сайтов в его списке WordPress.org, по умолчанию генерирует файлы llms.txt с синтаксисом ссылок уценки, поведение по умолчанию, о котором рассказал Гленн Гейб, и собственная документация плагина подтверждается. Эти автоматически сгенерированные файлы используют синтаксис ссылок уценки, потому что это то, что генерирует генератор. Большинство из них, вероятно, проходят эту проверку. Большинство созданных вручную файлов llms.txt с информацией о владельце, скорее всего, не справятся с этой задачей.

Об этом пробеле стоит задуматься, прежде чем рассматривать результаты аудита (пройден/не пройден) как показатель того, насколько ваш веб-сайт на самом деле готов к работе с агентами. Аудит проверяет, доступен ли ваш файл для анализа. Он не проверяет, полезен ли ваш файл.

<х2>Стоит ли вам беспокоиться о проверке Llms.txt Lighthouse Agentic Browsing?

Да, но в узком смысле. Lighthouse может сказать вам, можно ли анализировать ваш llms.txt как уценку. Он не может сказать вам, честно ли файл описывает ваш сайт. Этот чек ваш. Откройте Chrome DevTools, перейдите на вкладку Lighthouse, убедитесь, что выбрана категория «Агентный просмотр», и запустите «Анализ» вашего URL-адреса. Аудит занимает менее минуты. В случае сбоя из-за ошибки отсутствия ссылок исправление составляет пять символов на ссылку и пять минут редактирования. Если он пройдет, то Маяк не сможет задать более сложный вопрос. Был ли файл автоматически сгенерирован плагином, который вы не настраивали, или вы написали его самостоятельно, и в любом случае он описывает, что на самом деле представляет собой ваш сайт?

Машинно-ориентированная архитектура Опора структуры лежит в основе всего этого: модели данных перед макетами страниц, независимость рендеринга, контент, который не зависит от клиентского JavaScript или параметры отображения по умолчанию для машиночитаемости. Аудит llms.txt представляет собой узкую проверку на этом уровне. Более серьезный структурный вопрос: точно ли ваша машиночитаемая поверхность описывает ваш веб-сайт, зависит от вас.

<ул>

<п>

Этот пост был первоначально опубликован на No Hacks.

Lighthouse не работает с вашим Llms.txt без ссылок Markdown

1 из 6 проверок на Nohacks.co не пройдены

Lighthouse анализирует .txt как уценку и отклоняет обычные текстовые ссылки

Исправление: 5 символов на ссылку

Lighthouse измеряет синтаксис анализируемых ссылок, а не качество файла

admin

Related Posts