Google говорит, что уценка для AI SEO удаляет важные части

Markdown рассматривается как задел для веб-сайтов на будущее. Google заявляет, что, возможно, удаляет информацию, используемую поисковыми системами.

В недавнем подкасте Search Off the Record ведущие Джон Мюллер и Мартин Сплитт опровергли идею, продвигаемую AI-специалистами по поисковой оптимизации, о том, что урезанные версии, содержащие только контент, являются лучшим способом оптимизации для поиска AI. Они доказали, что все, что ИИ-оптимизаторы хотят удалить, на самом деле полезно для ранжирования.

Несодержательные части веб-страниц имеют значение

Смысл этой части заключается в том, что HTML предназначен для браузеров, чтобы отображать страницу, видимую для людей, а также для чтения с помощью программ чтения с экрана.

<п>Мартин Сплитт начинает дискуссию с объяснения, почему простой HTML не является идеальным способом предоставления контента агентам искусственного интеллекта и LLM. Идея состоит в том, что помимо контента в HTML есть много другого кода, который не имеет значения для агента LLM или AI, который может посещать сайт ради контента.

Привлекательность уценки заключается в том, что она может предоставить контент таким образом, чтобы освободиться от всего HTML, который предназначен для того, чтобы сделать веб-страницу видимой для людей или читаемой программой чтения с экрана.

Сплитт объясняет:

<блоковая цитата><п>«И я думаю, что именно поэтому люди думают, что это хорошо для LLM, потому что у вас меньше вещей, меньше жетонов. И если вы посмотрите на HTML-файл без его обработки в браузере, если вы просто посмотрите на простой HTML в текстовом редакторе, по сути, то будет трудно прочитать его содержимое, потому что в нем так много мусора, так много всякой всячины. Там все эти HTML-теги и все эти, может быть, даже встроенные стили и все такое.”

Он также хвалит уценку за возможность передать суть контента:

<блоковая цитата><п>“Но если рендеринг Markdown завершится неудачей и вы посмотрите на файл Markdown в текстовом редакторе, он все равно будет структурирован и читаем. Как ссылка — это слово текста ссылки, как и текст привязки, а затем в квадратных скобках, а затем в обычных скобках. Наверное, я бы так и сделал, если бы у меня был только текст.

<стр>Если бы я писал электронное письмо без возможности связать что-либо, я бы, вероятно, разметил какой-нибудь текст ссылки, а затем добавил бы что-то вроде того, например, и именно сюда вам нужно зайти, чтобы действительно это увидеть.

И я думаю, что именно этот минимализм, вероятно, и заставляет людей думать: да, это отлично подходит для машины, которой нужно понимать этот контент, в отличие от HTML.”

<х2>Преобразование HTML в текст тривиально

Мюллер и Сплитт отметили, что, несмотря на то, насколько сложным выглядит HTML, сканировать его и разобраться в нем тривиально и очень легко. Преимущество использования уценки для LLM, заключающееся в том, что это упрощает сканирование и индексацию контента, на этом этапе полностью теряет смысл.

Джон Мюллер объясняет:

“Я думаю, самое главное то, что Интернет с HTML и всем остальным существует уже очень давно, дольше, чем Markdown. И все сканеры практиковались в HTML. А конвертировать HTML в текст тривиально. Существует множество библиотек, которые могут сделать это за вас. Итак, если вы подумаете о том, что среднестатистический веб-сканер может искать или должен найти на странице, чтобы понять ее, то, вероятно, это всего лишь HTML.

Markdown не работает при обнаружении контента

Обнаружение — это когда любой сканер посещает веб-страницу и обнаруживает другие веб-страницы на одном веб-сайте, а также на разных веб-сайтах.

Сплитт сказал, что уценка ориентирована только на одну часть контента: сам контент. Он объяснил, что из-за этого поисковым системам сложнее увидеть веб-страницу в контексте того, как она соединяется с остальным содержимым веб-сайта через ссылки, которые помогают поиску.

Он объяснил:

“Да, и я имею в виду другое: да, приятно, что Markdown обычно сосредотачивается на части контента, но HTML со всеми ссылками, навигацией, заголовками и всем подобным материалом, который как бы удаляется из файлов Markdown, которые составляют веб-сайт, важен для понимания структуры и того, как это связано с остальной частью сайта.

Так что, думаю, это тоже плохо. Если бы мы потеряли это, то, вероятно, это было бы не очень хорошо для ползания по Дискавери, да? “

<ч2>На вынос

Читая патенты и исследовательские работы, становится ясно, что поисковые системы видят веб-сайт не только как набор отдельных веб-страниц, но и как группы веб-страниц, принадлежащих разделам и категориям, а также как сам веб-сайт в целом. Уменьшите масштаб, и веб-сайт станет лишь одним из тысяч и тысяч других веб-сайтов в окружении веб-сайтов, самоорганизованных по ссылкам по категориям и уровням качества.

Для SEO мы должны понимать сайт как в уменьшенном, так и в увеличенном виде, чтобы понять, как все его части сочетаются друг с другом. Причина в том, что именно это и делают поисковые системы.

<п>SEO на основе искусственного интеллекта, похоже, нацелено на то, чтобы LLM и агентам искусственного интеллекта было проще сканировать и индексировать контент. Сканирование и индексирование являются обоснованными проблемами. Но, настаивая на файлах уценки, они не принимают во внимание основы обнаружения и то, насколько тривиально извлекать контент с веб-страницы HTML, что делает файлы уценки ненужными.

Помимо вышеперечисленных вопросов, есть еще вопрос, связанный с надежностью. Раньше существовала так называемая мета-тег ключевого слова, которую некоторые поисковые системы использовали, чтобы получить подсказку о том, о чем веб-страница. Естественно, владельцы сайтов и оптимизаторы использовали его, чтобы сбросить все ключевые слова, по которым они хотели ранжироваться, независимо от содержания.

Я не говорю, что SEO-специалисты и владельцы веб-сайтов не заслуживают доверия, но поисковый трафик — это деньги, и люди будут делать то, что собираются делать. Итак, последнее соображение заключается в том, что поисковые системы никогда не будут доверять контенту с уценкой и использовать его как канонический, когда сканирование и извлечение исходного контента из HTML является тривиальной задачей.

<стр>Вернувшись к тому, что обсуждали Мюллер и Сплитт, Google настаивает на том, что настойчивость AI SEO в уценке лишает значительной части важного контекста.

Смотрите 111 серию Search Off The Record здесь:

</div>  <footer class="entry-footer"> </footer> <div class="mt-author-box"> <div class="mt-author__avatar"> <img alt='' src='https://secure.gravatar.com/avatar/b985507d7dad0cd1e1fcf1d4593642539fa9b3955938ace836e2e3535923035f?s=96&d=mm&r=g' srcset='https://secure.gravatar.com/avatar/b985507d7dad0cd1e1fcf1d4593642539fa9b3955938ace836e2e3535923035f?s=96&d=mm&r=g 2x' class='avatar avatar-96 photo' height='96' width='96' decoding='async'/> </div> <div class="mt-author-info"> <h5 class="mt-author-name"><a href="https://originalweb.ru/author/admin/" rel="author">admin</a></h5> <div class="mt-author-meta"> <div class="mt-author-website"> <span>Website</span> <a href="https://originalweb.ru" target="_blank">https://originalweb.ru</a> </div> </div> </div> </div> </article> <nav class="navigation post-navigation" aria-label="Записи"> <h2 class="screen-reader-text">Навигация по записям</h2> <div class="nav-links"><div class="nav-previous"><a href="https://originalweb.ru/neojidannyi-vzgliad-google-na-stryktyry-papok-saita-i-seo/" rel="prev">Неожиданный взгляд Google на структуру папок сайта и SEO</a></div><div class="nav-next"><a href="https://originalweb.ru/pochemy-pokazy-gsc-rastyt-no-trafik-padaet-4-veshi-na-kotorye-sledyet-obratit-vnimanie-v-pervyu-ochered-sprosite-seo-specialista/" rel="next">Почему показы GSC растут, но трафик падает: 4 вещи, на которые следует обратить внимание в первую очередь – спросите SEO-специалиста</a></div></div> </nav> <section class="mt-single-related-posts"> <h2 class="mt-related-post-title">Related Posts</h2> <div class="mt-related-posts-wrapper"> <article id="post-6060" class="has-thumbnail wow fadeInUp post-6060 post type-post status-publish format-standard has-post-thumbnail hentry category-news"> <a class="post-thumbnail" href="https://originalweb.ru/google-obiasniaet-pochemy-url-adresa-zablokirovannye-failom-robots-txt-vse-eshe-mojno-proindeksirovat/" aria-hidden="true" tabindex="-1"> <div class="post-thumbnail"> <img width="800" height="420" src="https://originalweb.ru/wp-content/uploads/2026/06/google-explains-why-urls-blocked-by-robotstxt-can-still-be-indexed-b9f741d.jpg" class="attachment-wp-diary-full-width size-wp-diary-full-width wp-post-image" alt="" decoding="async" loading="lazy" srcset="https://originalweb.ru/wp-content/uploads/2026/06/google-explains-why-urls-blocked-by-robotstxt-can-still-be-indexed-b9f741d.jpg 800w, https://originalweb.ru/wp-content/uploads/2026/06/google-explains-why-urls-blocked-by-robotstxt-can-still-be-indexed-b9f741d-300x158.jpg 300w, https://originalweb.ru/wp-content/uploads/2026/06/google-explains-why-urls-blocked-by-robotstxt-can-still-be-indexed-b9f741d-768x403.jpg 768w, https://originalweb.ru/wp-content/uploads/2026/06/google-explains-why-urls-blocked-by-robotstxt-can-still-be-indexed-b9f741d-600x315.jpg 600w" sizes="auto, (max-width: 800px) 100vw, 800px" /> </div> </a> <div class="mt-cats-list"> <span class="cat-links"> <a href="https://originalweb.ru/category/news/" rel="category tag">Новости</a></span> </div> <header class="entry-header"> <h3 class="entry-title"><a href="https://originalweb.ru/google-obiasniaet-pochemy-url-adresa-zablokirovannye-failom-robots-txt-vse-eshe-mojno-proindeksirovat/" rel="bookmark">Google объясняет, почему URL-адреса, заблокированные файлом robots.txt, все еще можно проиндексировать</a></h3> </header> <div class="entry-meta"> <span class="posted-on"><a href="https://originalweb.ru/google-obiasniaet-pochemy-url-adresa-zablokirovannye-failom-robots-txt-vse-eshe-mojno-proindeksirovat/" rel="bookmark"><time class="entry-date published updated" datetime="2026-06-18T05:57:21+03:00">18.06.2026</time></a></span> </div> <footer class="entry-footer"> </footer> </article> <article id="post-6061" class="has-thumbnail wow fadeInUp post-6061 post type-post status-publish format-standard has-post-thumbnail hentry category-news"> <a class="post-thumbnail" href="https://originalweb.ru/google-obiasniaet-pochemy-url-adresa-zablokirovannye-failom-robots-txt-vse-eshe-mojno-proindeksirovat-2/" aria-hidden="true" tabindex="-1"> <div class="post-thumbnail"> <img width="800" height="420" src="https://originalweb.ru/wp-content/uploads/2026/06/google-explains-why-urls-blocked-by-robotstxt-can-still-be-indexed-41d5266.jpg" class="attachment-wp-diary-full-width size-wp-diary-full-width wp-post-image" alt="" decoding="async" loading="lazy" srcset="https://originalweb.ru/wp-content/uploads/2026/06/google-explains-why-urls-blocked-by-robotstxt-can-still-be-indexed-41d5266.jpg 800w, https://originalweb.ru/wp-content/uploads/2026/06/google-explains-why-urls-blocked-by-robotstxt-can-still-be-indexed-41d5266-300x158.jpg 300w, https://originalweb.ru/wp-content/uploads/2026/06/google-explains-why-urls-blocked-by-robotstxt-can-still-be-indexed-41d5266-768x403.jpg 768w, https://originalweb.ru/wp-content/uploads/2026/06/google-explains-why-urls-blocked-by-robotstxt-can-still-be-indexed-41d5266-600x315.jpg 600w" sizes="auto, (max-width: 800px) 100vw, 800px" /> </div> </a> <div class="mt-cats-list"> <span class="cat-links"> <a href="https://originalweb.ru/category/news/" rel="category tag">Новости</a></span> </div> <header class="entry-header"> <h3 class="entry-title"><a href="https://originalweb.ru/google-obiasniaet-pochemy-url-adresa-zablokirovannye-failom-robots-txt-vse-eshe-mojno-proindeksirovat-2/" rel="bookmark">Google объясняет, почему URL-адреса, заблокированные файлом robots.txt, все еще можно проиндексировать</a></h3> </header> <div class="entry-meta"> <span class="posted-on"><a href="https://originalweb.ru/google-obiasniaet-pochemy-url-adresa-zablokirovannye-failom-robots-txt-vse-eshe-mojno-proindeksirovat-2/" rel="bookmark"><time class="entry-date published updated" datetime="2026-06-18T05:57:21+03:00">18.06.2026</time></a></span> </div> <footer class="entry-footer"> </footer> </article> <article id="post-6055" class="has-thumbnail wow fadeInUp post-6055 post type-post status-publish format-standard has-post-thumbnail hentry category-news"> <a class="post-thumbnail" href="https://originalweb.ru/napisano-dlia-chitatelei-kotorye-ne-chitaut/" aria-hidden="true" tabindex="-1"> <div class="post-thumbnail"> <img width="800" height="420" src="https://originalweb.ru/wp-content/uploads/2026/06/written-for-readers-who-dont-read-cc0d303.png" class="attachment-wp-diary-full-width size-wp-diary-full-width wp-post-image" alt="" decoding="async" loading="lazy" srcset="https://originalweb.ru/wp-content/uploads/2026/06/written-for-readers-who-dont-read-cc0d303.png 800w, https://originalweb.ru/wp-content/uploads/2026/06/written-for-readers-who-dont-read-cc0d303-300x158.png 300w, https://originalweb.ru/wp-content/uploads/2026/06/written-for-readers-who-dont-read-cc0d303-768x403.png 768w, https://originalweb.ru/wp-content/uploads/2026/06/written-for-readers-who-dont-read-cc0d303-600x315.png 600w" sizes="auto, (max-width: 800px) 100vw, 800px" /> </div> </a> <div class="mt-cats-list"> <span class="cat-links"> <a href="https://originalweb.ru/category/news/" rel="category tag">Новости</a></span> </div> <header class="entry-header"> <h3 class="entry-title"><a href="https://originalweb.ru/napisano-dlia-chitatelei-kotorye-ne-chitaut/" rel="bookmark">Написано для читателей, которые не читают.</a></h3> </header> <div class="entry-meta"> <span class="posted-on"><a href="https://originalweb.ru/napisano-dlia-chitatelei-kotorye-ne-chitaut/" rel="bookmark"><time class="entry-date published updated" datetime="2026-06-18T05:56:46+03:00">18.06.2026</time></a></span> </div> <footer class="entry-footer"> </footer> </article> </div> </section> </main> </div> </div>  </div> <footer id="colophon" class="site-footer"> <div id="bottom-footer"> <div class="mt-container"> <nav id="footer-navigation" class="footer-navigation"> </nav> <div class="site-info"> <span class="mt-copyright-text"> Original Web - все права защищены! </span> </div> </div> </div> </footer> <div class="blogger-diary-background-animation" ><ul class="blogger-diary-circles"> <li></li> <li></li> <li></li> <li></li> <li></li> <li></li> <li></li> <li></li> </ul> </div > <div id="mt-scrollup" class="animated arrow-hide">Back To Top</div> </div> <script type="speculationrules"> {"prefetch":[{"source":"document","where":{"and":[{"href_matches":"/*"},{"not":{"href_matches":["/wp-*.php","/wp-admin/*","/wp-content/uploads/*","/wp-content/*","/wp-content/plugins/*","/wp-content/themes/blogger-diary/*","/wp-content/themes/wp-diary/*","/*\\?(.+)"]}},{"not":{"selector_matches":"a[rel~=\"nofollow\"]"}},{"not":{"selector_matches":".no-prefetch, .no-prefetch a"}}]},"eagerness":"conservative"}]} </script> <script id="swv-js" src="https://originalweb.ru/wp-content/plugins/contact-form-7/includes/swv/js/index.js?ver=5.9"></script> <script id="contact-form-7-js-extra"> var wpcf7 = {"api":{"root":"https://originalweb.ru/wp-json/","namespace":"contact-form-7/v1"}}; //# sourceURL=contact-form-7-js-extra </script> <script id="contact-form-7-js" src="https://originalweb.ru/wp-content/plugins/contact-form-7/includes/js/index.js?ver=5.9"></script> <script id="envo-extra-js-js" src="https://originalweb.ru/wp-content/plugins/envo-extra/js/envo.js?ver=1.8.10"></script> <script id="wp-diary-combine-scripts-js" src="https://originalweb.ru/wp-content/themes/wp-diary/assets/js/mt-combine-scripts.js?ver=1.0.3"></script> <script id="wp-diary-navigation-js" src="https://originalweb.ru/wp-content/themes/wp-diary/assets/js/navigation.js?ver=20151215"></script> <script id="wp-diary-skip-link-focus-fix-js" src="https://originalweb.ru/wp-content/themes/wp-diary/assets/js/skip-link-focus-fix.js?ver=20151215"></script> <script id="wp-diary-custom-scripts-js-extra"> var wpdiaryObject = {"menu_sticky":"on","wow_effect":"on","pretty_photo":"on"}; //# sourceURL=wp-diary-custom-scripts-js-extra </script> <script id="wp-diary-custom-scripts-js" src="https://originalweb.ru/wp-content/themes/wp-diary/assets/js/mt-custom-scripts.js?ver=1.0.3"></script> <script id="blogger-diary-sticky-sidebar-js" src="https://originalweb.ru/wp-content/themes/blogger-diary/assets/library/sticky-sidebar/theia-sticky-sidebar.min.js?ver=1.0.3"></script> <script id="blogger-diary-custom-scripts-js" src="https://originalweb.ru/wp-content/themes/blogger-diary/assets/js/bd-custom-scripts.js?ver=1.0.3"></script> <script id="wp-emoji-settings" type="application/json"> {"baseUrl":"https://s.w.org/images/core/emoji/17.0.2/72x72/","ext":".png","svgUrl":"https://s.w.org/images/core/emoji/17.0.2/svg/","svgExt":".svg","source":{"concatemoji":"https://originalweb.ru/wp-includes/js/wp-emoji-release.min.js?ver=7.0"}} </script> <script type="module"> /*! This file is auto-generated */ const a=JSON.parse(document.getElementById("wp-emoji-settings").textContent),o=(window._wpemojiSettings=a,"wpEmojiSettingsSupports"),s=["flag","emoji"];function i(e){try{var t={supportTests:e,timestamp:(new Date).valueOf()};sessionStorage.setItem(o,JSON.stringify(t))}catch(e){}}function c(e,t,n){e.clearRect(0,0,e.canvas.width,e.canvas.height),e.fillText(t,0,0);t=new Uint32Array(e.getImageData(0,0,e.canvas.width,e.canvas.height).data);e.clearRect(0,0,e.canvas.width,e.canvas.height),e.fillText(n,0,0);const a=new Uint32Array(e.getImageData(0,0,e.canvas.width,e.canvas.height).data);return t.every((e,t)=>e===a[t])}function p(e,t){e.clearRect(0,0,e.canvas.width,e.canvas.height),e.fillText(t,0,0);var n=e.getImageData(16,16,1,1);for(let e=0;e<n.data.length;e++)if(0!==n.data[e])return!1;return!0}function u(e,t,n,a){switch(t){case"flag":return n(e,"\ud83c\udff3\ufe0f\u200d\u26a7\ufe0f","\ud83c\udff3\ufe0f\u200b\u26a7\ufe0f")?!1:!n(e,"\ud83c\udde8\ud83c\uddf6","\ud83c\udde8\u200b\ud83c\uddf6")&&!n(e,"\ud83c\udff4\udb40\udc67\udb40\udc62\udb40\udc65\udb40\udc6e\udb40\udc67\udb40\udc7f","\ud83c\udff4\u200b\udb40\udc67\u200b\udb40\udc62\u200b\udb40\udc65\u200b\udb40\udc6e\u200b\udb40\udc67\u200b\udb40\udc7f");case"emoji":return!a(e,"\ud83e\u1fac8")}return!1}function f(e,t,n,a){let r;const o=(r="undefined"!=typeof WorkerGlobalScope&&self instanceof WorkerGlobalScope?new OffscreenCanvas(300,150):document.createElement("canvas")).getContext("2d",{willReadFrequently:!0}),s=(o.textBaseline="top",o.font="600 32px Arial",{});return e.forEach(e=>{s[e]=t(o,e,n,a)}),s}function r(e){var t=document.createElement("script");t.src=e,t.defer=!0,document.head.appendChild(t)}a.supports={everything:!0,everythingExceptFlag:!0},new Promise(t=>{let n=function(){try{var e=JSON.parse(sessionStorage.getItem(o));if("object"==typeof e&&"number"==typeof e.timestamp&&(new Date).valueOf()<e.timestamp+604800&&"object"==typeof e.supportTests)return e.supportTests}catch(e){}return null}();if(!n){if("undefined"!=typeof Worker&&"undefined"!=typeof OffscreenCanvas&&"undefined"!=typeof URL&&URL.createObjectURL&&"undefined"!=typeof Blob)try{var e="postMessage("+f.toString()+"("+[JSON.stringify(s),u.toString(),c.toString(),p.toString()].join(",")+"));",a=new Blob([e],{type:"text/javascript"});const r=new Worker(URL.createObjectURL(a),{name:"wpTestEmojiSupports"});return void(r.onmessage=e=>{i(n=e.data),r.terminate(),t(n)})}catch(e){}i(n=f(s,u,c,p))}t(n)}).then(e=>{for(const n in e)a.supports[n]=e[n],a.supports.everything=a.supports.everything&&a.supports[n],"flag"!==n&&(a.supports.everythingExceptFlag=a.supports.everythingExceptFlag&&a.supports[n]);var t;a.supports.everythingExceptFlag=a.supports.everythingExceptFlag&&!a.supports.flag,a.supports.everything||((t=a.source||{}).concatemoji?r(t.concatemoji):t.wpemoji&&t.twemoji&&(r(t.twemoji),r(t.wpemoji)))}); //# sourceURL=https://originalweb.ru/wp-includes/js/wp-emoji-loader.min.js </script> </body> </html>