Google раскрывает фундаментальный недостаток LLMs.txt

Многие издатели рассматривают LLMs.txt как путь к видимости ИИ. Google объясняет, почему этого никогда не произойдет.

Джон Мюллер и Мартин Сплитт из Google рассказали о LLMs.txt и уценке, при этом Мюллер рассказал удивительный факт об первоначальной цели LLMs.txt, а также объяснил, почему предлагаемые стандарты имеют серьезные недостатки.

Что такое открытие и почему оно важно

В контексте поиска информации (поиска) обнаружение означает, что поисковая система обнаруживает существование определенной веб-страницы. Discovery является частью общей архитектуры поисковой системы.

Архитектура поисковой системы:

<ол>

<сильный>Дискавери
Обнаружение URL-адреса (добавление его в сканирование).

<ли><сильный>Ползучий
Загрузка и анализ контента.

<ли><сильный>Индексация
Процесс анализа необработанных данных и их сохранения в структурированной базе данных, оптимизированной для поиска.

<сильный>Рейтинг
Та часть, которая интересует всех.

<ли><сильный>Первировка<бр> Это последний шаг, который показывает ранжированные веб-страницы в результатах поиска.

Выше приведен упрощенный обзор того, что такое поиск, а обнаружение — это самая первая часть процесса, который в конечном итоге заканчивается ранжированием и предоставлением ссылок на веб-сайты.

<п>Вывод здесь заключается в том, что Discovery является важной частью постановки веб-страницы в очередь для сканирования, индексации, ранжирования и, в конечном итоге, отображения в результатах поиска. Без Discovery веб-страница невидима.

И вот почему это важно: Discovery не является частью предлагаемого стандарта LLMs.txt. используйте

Первоначальное назначение LLMs.txt

Джон Мюллер рассказал, что он встретился с одним из людей, ответственных за создание предложения LLMs.txt, и сказал, что создатель объяснил, что LLMs.txt никогда не был предназначен для того, чтобы сделать сайт доступным для обнаружения, он никогда не был частью этого процесса.

<п>Это важный момент, поскольку многие владельцы сайтов тратят время, деньги и усилия на создание LLM.txt с целью их обнаружения и ранжирования в LLM. Это означает, что причина, по которой люди используют LLMs.txt, противоречит фактической цели LLMs.txt, которая не имеет ничего общего с Discovery.

Мюллер объяснил:

“Итак, я поговорил, кажется, с одним из людей, которые некоторое время назад создали это предложение. И идея на самом деле заключалась не в том, чтобы создать что-то, что облегчило бы поисковым системам или системам LLM обнаружение всего вашего контента, а скорее в том, что если LLM уже знает о вашем сайте и хочет узнать, что еще здесь есть, то это может быть подходом.

<п>И я думаю, что использование этого способа оптимизации для обнаружения системами искусственного интеллекта или обнаружения поисковыми системами не имеет никакого смысла.”

Мюллер далее объяснил, что многие люди используют LLMs.txt в надежде помочь процессу Открытия, несмотря на то, что это не является целью LLMs.txt.

Затем он обратил внимание на тот факт, что файл LLM.txt по своей сути ненадежен, поскольку владелец сайта говорит, о чем его контент, и это может совпадать, а может и не совпадать с тем, что находится в реальном HTML.

<п><эм>Он продолжил:

“Потому что по сути вы говорите этим системам, что у меня самый лучший веб-сайт на свете. А вот и все страницы, на которые должен зайти каждый. И ты должен купить все мои продукты или все, что ты туда положишь.

Итак, в системе LLM это… по сути, по замыслу, я не могу доверять тому, что здесь есть, как способу различения разных веб-сайтов.”

<стр>Агентские инструкции <п>Затем Мюллер говорит, что некоторые из этих предложений по стандартам могут быть полезны для помощи агенту ИИ, и это звучит так, как будто он говорит о протоколе контекста веб-модели (WebMCP).

Он объяснил:

“Если кто-то уже зашел на ваш сайт, возможно, вам поможет какая-то автоматизированная система. Если так, я хочу пойти в Мартинс Сплитт и купить фотографию, затем система LLM может зайти на ваш сайт и посмотреть, например, как вы покупаете фотографию? Может быть, у него есть какие-то рекомендации для меня как агента по покупке фотографий. В этом есть смысл.

<п>Но если сказать: «Я хочу купить фотографию, на каком веб-сайте она есть», система не будет заходить на ваш веб-сайт и на пять других веб-сайтов и говорить, у кого есть какая-то автоматизированная информация? А скорее они пытаются, собираются попытаться найти лучший веб-сайт…”

LLMs.txt не касается обнаружения ИИ

<стр>Мюллер вернулся к тому, как люди неправильно интерпретируют LLMs.txt как способ обнаружения системами искусственного интеллекта.

Он рассуждал по этому поводу:

“Я думаю, что с этой точки зрения оптимизация как способ быть обнаруженным не имеет смысла.

<п>Но что происходит, когда агент находится на вашем веб-сайте? Я думаю, что в целом это также является открытой областью для обсуждения на данный момент, поскольку в качестве предложения есть LLMs.txt. Обсуждаются различные файлы JSON и общеизвестные типы файлов.

Есть WebMCP, который, я думаю, пытается сделать что-то подобное, где они говорят: ну, вы сейчас находитесь на этой странице, но у нас для этого есть программный интерфейс, добавлен определенный URL-адрес или определенный механизм.

Думаю, это почти разные дискуссии.”

<х2>Обнаружение и рейтинг по-прежнему привязаны к HTML

<стр>Мюллер завершил свою мысль, подчеркнув, что Discovery находится на уровне HTML.

Он объяснил:

“Таким образом, общий подход SEO к тому, как мне найти веб-сайт, который продает мне фотографию, почти полностью будет привязан к HTML-страницам и обычным веб-страницам.

И затем, если пользователь решает обратиться к определенной услуге, то внутри этой службы появляется немного больше возможностей, чтобы помочь агенту или системе LLM найти правильный подход.

<п>Но что интересно, конечно, так это множество идей. И ни один из них по сути не стал единственной вещью, которую будут использовать все. Так что я уверен, что в следующем, я не знаю, полгода, году, а может и дольше, это займет немного времени. И некоторые из этих агентных систем собираются объединиться вокруг какого-то стандартного типа файла, механизма или чего-то еще.”

Мюллер не продвигал стандарт WebMCP, но если ИИ-агенты станут способом взаимодействия пользователей с веб-сайтами, то для веб-сайтов, особенно для сайтов электронной коммерции, будет полезно что-то вроде WebMCP, а не LLMs.txt.

WebMCP, естественно, лучше подходит для электронной коммерции, поскольку он фокусируется на предоставлении агентам ИИ практических возможностей, таких как фильтрация продуктов, поиск и распознавание продуктов, помощь в сравнении различных продуктов и помощь ИИ в добавлении продукта в корзину.

Агенты ИИ могут перемещаться с помощью HTML-кода веб-сайта, разработанного для людей. WebMCP облегчает успешное взаимодействие агентов ИИ с веб-сайтом, чего не делает LLMs.txt.

Хотя ни LLMs.txt, ни WebMCP не помогают ИИ обнаружить веб-сайт, ни один из них не был создан для этой цели. Часть Discovery, первый этап ранжирования, выполняется с помощью HTML. Если это так, то какой твой следующий шаг?

Слушайте поиск Google Off The Record Episode 111

</div>  <footer class="entry-footer"> </footer> <div class="mt-author-box"> <div class="mt-author__avatar"> <img alt='' src='https://secure.gravatar.com/avatar/b985507d7dad0cd1e1fcf1d4593642539fa9b3955938ace836e2e3535923035f?s=96&d=mm&r=g' srcset='https://secure.gravatar.com/avatar/b985507d7dad0cd1e1fcf1d4593642539fa9b3955938ace836e2e3535923035f?s=96&d=mm&r=g 2x' class='avatar avatar-96 photo' height='96' width='96' decoding='async'/> </div> <div class="mt-author-info"> <h5 class="mt-author-name"><a href="https://originalweb.ru/author/admin/" rel="author">admin</a></h5> <div class="mt-author-meta"> <div class="mt-author-website"> <span>Website</span> <a href="https://originalweb.ru" target="_blank">https://originalweb.ru</a> </div> </div> </div> </div> </article> <nav class="navigation post-navigation" aria-label="Записи"> <h2 class="screen-reader-text">Навигация по записям</h2> <div class="nav-links"><div class="nav-previous"><a href="https://originalweb.ru/google-obiasniaet-pochemy-url-adresa-zablokirovannye-failom-robots-txt-vse-eshe-mojno-proindeksirovat-2/" rel="prev">Google объясняет, почему URL-адреса, заблокированные файлом robots.txt, все еще можно проиндексировать</a></div><div class="nav-next"><a href="https://originalweb.ru/google-yjestochaet-trebovaniia-k-migracii-domenov/" rel="next">Google ужесточает требования к миграции доменов</a></div></div> </nav> <section class="mt-single-related-posts"> <h2 class="mt-related-post-title">Related Posts</h2> <div class="mt-related-posts-wrapper"> <article id="post-6066" class="has-thumbnail wow fadeInUp post-6066 post type-post status-publish format-standard has-post-thumbnail hentry category-news"> <a class="post-thumbnail" href="https://originalweb.ru/google-yjestochaet-trebovaniia-k-migracii-domenov/" aria-hidden="true" tabindex="-1"> <div class="post-thumbnail"> <img width="800" height="420" src="https://originalweb.ru/wp-content/uploads/2026/06/google-tightens-requirements-for-domain-migrations-e177edc.jpg" class="attachment-wp-diary-full-width size-wp-diary-full-width wp-post-image" alt="" decoding="async" loading="lazy" srcset="https://originalweb.ru/wp-content/uploads/2026/06/google-tightens-requirements-for-domain-migrations-e177edc.jpg 800w, https://originalweb.ru/wp-content/uploads/2026/06/google-tightens-requirements-for-domain-migrations-e177edc-300x158.jpg 300w, https://originalweb.ru/wp-content/uploads/2026/06/google-tightens-requirements-for-domain-migrations-e177edc-768x403.jpg 768w, https://originalweb.ru/wp-content/uploads/2026/06/google-tightens-requirements-for-domain-migrations-e177edc-600x315.jpg 600w" sizes="auto, (max-width: 800px) 100vw, 800px" /> </div> </a> <div class="mt-cats-list"> <span class="cat-links"> <a href="https://originalweb.ru/category/news/" rel="category tag">Новости</a></span> </div> <header class="entry-header"> <h3 class="entry-title"><a href="https://originalweb.ru/google-yjestochaet-trebovaniia-k-migracii-domenov/" rel="bookmark">Google ужесточает требования к миграции доменов</a></h3> </header> <div class="entry-meta"> <span class="posted-on"><a href="https://originalweb.ru/google-yjestochaet-trebovaniia-k-migracii-domenov/" rel="bookmark"><time class="entry-date published updated" datetime="2026-06-18T13:57:05+03:00">18.06.2026</time></a></span> </div> <footer class="entry-footer"> </footer> </article> <article id="post-6060" class="has-thumbnail wow fadeInUp post-6060 post type-post status-publish format-standard has-post-thumbnail hentry category-news"> <a class="post-thumbnail" href="https://originalweb.ru/google-obiasniaet-pochemy-url-adresa-zablokirovannye-failom-robots-txt-vse-eshe-mojno-proindeksirovat/" aria-hidden="true" tabindex="-1"> <div class="post-thumbnail"> <img width="800" height="420" src="https://originalweb.ru/wp-content/uploads/2026/06/google-explains-why-urls-blocked-by-robotstxt-can-still-be-indexed-b9f741d.jpg" class="attachment-wp-diary-full-width size-wp-diary-full-width wp-post-image" alt="" decoding="async" loading="lazy" srcset="https://originalweb.ru/wp-content/uploads/2026/06/google-explains-why-urls-blocked-by-robotstxt-can-still-be-indexed-b9f741d.jpg 800w, https://originalweb.ru/wp-content/uploads/2026/06/google-explains-why-urls-blocked-by-robotstxt-can-still-be-indexed-b9f741d-300x158.jpg 300w, https://originalweb.ru/wp-content/uploads/2026/06/google-explains-why-urls-blocked-by-robotstxt-can-still-be-indexed-b9f741d-768x403.jpg 768w, https://originalweb.ru/wp-content/uploads/2026/06/google-explains-why-urls-blocked-by-robotstxt-can-still-be-indexed-b9f741d-600x315.jpg 600w" sizes="auto, (max-width: 800px) 100vw, 800px" /> </div> </a> <div class="mt-cats-list"> <span class="cat-links"> <a href="https://originalweb.ru/category/news/" rel="category tag">Новости</a></span> </div> <header class="entry-header"> <h3 class="entry-title"><a href="https://originalweb.ru/google-obiasniaet-pochemy-url-adresa-zablokirovannye-failom-robots-txt-vse-eshe-mojno-proindeksirovat/" rel="bookmark">Google объясняет, почему URL-адреса, заблокированные файлом robots.txt, все еще можно проиндексировать</a></h3> </header> <div class="entry-meta"> <span class="posted-on"><a href="https://originalweb.ru/google-obiasniaet-pochemy-url-adresa-zablokirovannye-failom-robots-txt-vse-eshe-mojno-proindeksirovat/" rel="bookmark"><time class="entry-date published updated" datetime="2026-06-18T05:57:21+03:00">18.06.2026</time></a></span> </div> <footer class="entry-footer"> </footer> </article> <article id="post-6061" class="has-thumbnail wow fadeInUp post-6061 post type-post status-publish format-standard has-post-thumbnail hentry category-news"> <a class="post-thumbnail" href="https://originalweb.ru/google-obiasniaet-pochemy-url-adresa-zablokirovannye-failom-robots-txt-vse-eshe-mojno-proindeksirovat-2/" aria-hidden="true" tabindex="-1"> <div class="post-thumbnail"> <img width="800" height="420" src="https://originalweb.ru/wp-content/uploads/2026/06/google-explains-why-urls-blocked-by-robotstxt-can-still-be-indexed-41d5266.jpg" class="attachment-wp-diary-full-width size-wp-diary-full-width wp-post-image" alt="" decoding="async" loading="lazy" srcset="https://originalweb.ru/wp-content/uploads/2026/06/google-explains-why-urls-blocked-by-robotstxt-can-still-be-indexed-41d5266.jpg 800w, https://originalweb.ru/wp-content/uploads/2026/06/google-explains-why-urls-blocked-by-robotstxt-can-still-be-indexed-41d5266-300x158.jpg 300w, https://originalweb.ru/wp-content/uploads/2026/06/google-explains-why-urls-blocked-by-robotstxt-can-still-be-indexed-41d5266-768x403.jpg 768w, https://originalweb.ru/wp-content/uploads/2026/06/google-explains-why-urls-blocked-by-robotstxt-can-still-be-indexed-41d5266-600x315.jpg 600w" sizes="auto, (max-width: 800px) 100vw, 800px" /> </div> </a> <div class="mt-cats-list"> <span class="cat-links"> <a href="https://originalweb.ru/category/news/" rel="category tag">Новости</a></span> </div> <header class="entry-header"> <h3 class="entry-title"><a href="https://originalweb.ru/google-obiasniaet-pochemy-url-adresa-zablokirovannye-failom-robots-txt-vse-eshe-mojno-proindeksirovat-2/" rel="bookmark">Google объясняет, почему URL-адреса, заблокированные файлом robots.txt, все еще можно проиндексировать</a></h3> </header> <div class="entry-meta"> <span class="posted-on"><a href="https://originalweb.ru/google-obiasniaet-pochemy-url-adresa-zablokirovannye-failom-robots-txt-vse-eshe-mojno-proindeksirovat-2/" rel="bookmark"><time class="entry-date published updated" datetime="2026-06-18T05:57:21+03:00">18.06.2026</time></a></span> </div> <footer class="entry-footer"> </footer> </article> </div> </section> </main> </div> </div>  </div> <footer id="colophon" class="site-footer"> <div id="bottom-footer"> <div class="mt-container"> <nav id="footer-navigation" class="footer-navigation"> </nav> <div class="site-info"> <span class="mt-copyright-text"> Original Web - все права защищены! </span> </div> </div> </div> </footer> <div class="blogger-diary-background-animation" ><ul class="blogger-diary-circles"> <li></li> <li></li> <li></li> <li></li> <li></li> <li></li> <li></li> <li></li> </ul> </div > <div id="mt-scrollup" class="animated arrow-hide">Back To Top</div> </div> <script type="speculationrules"> {"prefetch":[{"source":"document","where":{"and":[{"href_matches":"/*"},{"not":{"href_matches":["/wp-*.php","/wp-admin/*","/wp-content/uploads/*","/wp-content/*","/wp-content/plugins/*","/wp-content/themes/blogger-diary/*","/wp-content/themes/wp-diary/*","/*\\?(.+)"]}},{"not":{"selector_matches":"a[rel~=\"nofollow\"]"}},{"not":{"selector_matches":".no-prefetch, .no-prefetch a"}}]},"eagerness":"conservative"}]} </script> <script id="swv-js" src="https://originalweb.ru/wp-content/plugins/contact-form-7/includes/swv/js/index.js?ver=5.9"></script> <script id="contact-form-7-js-extra"> var wpcf7 = {"api":{"root":"https://originalweb.ru/wp-json/","namespace":"contact-form-7/v1"}}; //# sourceURL=contact-form-7-js-extra </script> <script id="contact-form-7-js" src="https://originalweb.ru/wp-content/plugins/contact-form-7/includes/js/index.js?ver=5.9"></script> <script id="envo-extra-js-js" src="https://originalweb.ru/wp-content/plugins/envo-extra/js/envo.js?ver=1.8.10"></script> <script id="wp-diary-combine-scripts-js" src="https://originalweb.ru/wp-content/themes/wp-diary/assets/js/mt-combine-scripts.js?ver=1.0.3"></script> <script id="wp-diary-navigation-js" src="https://originalweb.ru/wp-content/themes/wp-diary/assets/js/navigation.js?ver=20151215"></script> <script id="wp-diary-skip-link-focus-fix-js" src="https://originalweb.ru/wp-content/themes/wp-diary/assets/js/skip-link-focus-fix.js?ver=20151215"></script> <script id="wp-diary-custom-scripts-js-extra"> var wpdiaryObject = {"menu_sticky":"on","wow_effect":"on","pretty_photo":"on"}; //# sourceURL=wp-diary-custom-scripts-js-extra </script> <script id="wp-diary-custom-scripts-js" src="https://originalweb.ru/wp-content/themes/wp-diary/assets/js/mt-custom-scripts.js?ver=1.0.3"></script> <script id="blogger-diary-sticky-sidebar-js" src="https://originalweb.ru/wp-content/themes/blogger-diary/assets/library/sticky-sidebar/theia-sticky-sidebar.min.js?ver=1.0.3"></script> <script id="blogger-diary-custom-scripts-js" src="https://originalweb.ru/wp-content/themes/blogger-diary/assets/js/bd-custom-scripts.js?ver=1.0.3"></script> <script id="wp-emoji-settings" type="application/json"> {"baseUrl":"https://s.w.org/images/core/emoji/17.0.2/72x72/","ext":".png","svgUrl":"https://s.w.org/images/core/emoji/17.0.2/svg/","svgExt":".svg","source":{"concatemoji":"https://originalweb.ru/wp-includes/js/wp-emoji-release.min.js?ver=7.0"}} </script> <script type="module"> /*! This file is auto-generated */ const a=JSON.parse(document.getElementById("wp-emoji-settings").textContent),o=(window._wpemojiSettings=a,"wpEmojiSettingsSupports"),s=["flag","emoji"];function i(e){try{var t={supportTests:e,timestamp:(new Date).valueOf()};sessionStorage.setItem(o,JSON.stringify(t))}catch(e){}}function c(e,t,n){e.clearRect(0,0,e.canvas.width,e.canvas.height),e.fillText(t,0,0);t=new Uint32Array(e.getImageData(0,0,e.canvas.width,e.canvas.height).data);e.clearRect(0,0,e.canvas.width,e.canvas.height),e.fillText(n,0,0);const a=new Uint32Array(e.getImageData(0,0,e.canvas.width,e.canvas.height).data);return t.every((e,t)=>e===a[t])}function p(e,t){e.clearRect(0,0,e.canvas.width,e.canvas.height),e.fillText(t,0,0);var n=e.getImageData(16,16,1,1);for(let e=0;e<n.data.length;e++)if(0!==n.data[e])return!1;return!0}function u(e,t,n,a){switch(t){case"flag":return n(e,"\ud83c\udff3\ufe0f\u200d\u26a7\ufe0f","\ud83c\udff3\ufe0f\u200b\u26a7\ufe0f")?!1:!n(e,"\ud83c\udde8\ud83c\uddf6","\ud83c\udde8\u200b\ud83c\uddf6")&&!n(e,"\ud83c\udff4\udb40\udc67\udb40\udc62\udb40\udc65\udb40\udc6e\udb40\udc67\udb40\udc7f","\ud83c\udff4\u200b\udb40\udc67\u200b\udb40\udc62\u200b\udb40\udc65\u200b\udb40\udc6e\u200b\udb40\udc67\u200b\udb40\udc7f");case"emoji":return!a(e,"\ud83e\u1fac8")}return!1}function f(e,t,n,a){let r;const o=(r="undefined"!=typeof WorkerGlobalScope&&self instanceof WorkerGlobalScope?new OffscreenCanvas(300,150):document.createElement("canvas")).getContext("2d",{willReadFrequently:!0}),s=(o.textBaseline="top",o.font="600 32px Arial",{});return e.forEach(e=>{s[e]=t(o,e,n,a)}),s}function r(e){var t=document.createElement("script");t.src=e,t.defer=!0,document.head.appendChild(t)}a.supports={everything:!0,everythingExceptFlag:!0},new Promise(t=>{let n=function(){try{var e=JSON.parse(sessionStorage.getItem(o));if("object"==typeof e&&"number"==typeof e.timestamp&&(new Date).valueOf()<e.timestamp+604800&&"object"==typeof e.supportTests)return e.supportTests}catch(e){}return null}();if(!n){if("undefined"!=typeof Worker&&"undefined"!=typeof OffscreenCanvas&&"undefined"!=typeof URL&&URL.createObjectURL&&"undefined"!=typeof Blob)try{var e="postMessage("+f.toString()+"("+[JSON.stringify(s),u.toString(),c.toString(),p.toString()].join(",")+"));",a=new Blob([e],{type:"text/javascript"});const r=new Worker(URL.createObjectURL(a),{name:"wpTestEmojiSupports"});return void(r.onmessage=e=>{i(n=e.data),r.terminate(),t(n)})}catch(e){}i(n=f(s,u,c,p))}t(n)}).then(e=>{for(const n in e)a.supports[n]=e[n],a.supports.everything=a.supports.everything&&a.supports[n],"flag"!==n&&(a.supports.everythingExceptFlag=a.supports.everythingExceptFlag&&a.supports[n]);var t;a.supports.everythingExceptFlag=a.supports.everythingExceptFlag&&!a.supports.flag,a.supports.everything||((t=a.source||{}).concatemoji?r(t.concatemoji):t.wpemoji&&t.twemoji&&(r(t.twemoji),r(t.wpemoji)))}); //# sourceURL=https://originalweb.ru/wp-includes/js/wp-emoji-loader.min.js </script> </body> </html>