Google объясняет, почему не имеет значения, что веб-сайты становятся больше

Google объясняет, почему не имеет значения, что веб-сайты становятся тяжелее, и причина во многом связана с SEO.

<п>Недавний подкаст Google привлек внимание к тому факту, что веб-сайты становятся больше, чем когда-либо прежде. Гэри Иллис и Мартин Сплитт из Google объяснили, что идея о том, что веб-сайты становятся «крупнее»; это плохо, это не обязательно правда. Вывод для издателей и специалистов по поисковой оптимизации заключается в том, что вес страницы не является заслуживающим доверия показателем, поскольку причина “избыточного” вес вполне может быть чем-то полезным.

Размер страницы зависит от того, что измеряется

Мартин Сплитт из Google объяснил, что то, что многие люди понимают под размером страницы, зависит от того, что измеряется.

<ул>

Это измеряется только HTML?

Или вы имеете в виду общий размер страницы, включая изображения, CSS и JavaScript?

<п>Это различие важно. Например, многие оптимизаторы были в шоке, когда узнали, что Googlebot ограничивает сканирование страниц до 2 мегабайт HTML на страницу. Для сравнения: два мегабайта HTML равны примерно двум миллионам символов (букв, цифр и символов). Это эквивалент одной HTML-страницы с таким же количеством букв, как в двух книгах о Гарри Поттере.

Но когда вы включаете CSS, изображения и JavaScript вместе с HTML, теперь у нас возникает другой разговор, связанный со скоростью страницы для пользователей, а не для сканера Googlebot.

Мартин обсуждал статью о веб-альманахе HTTPArchive, которая представляет собой обзор тенденций веб-сайтов. В статье, похоже, смешиваются разные типы веса страницы, и это сбивает с толку, поскольку существует как минимум две версии веса страницы.

Он отметил:

<блоковая цитата><п>“Видите, здесь я не совсем ясно понимаю определение веса страницы.

…у них есть абзац, в котором они пытаются объяснить, что они подразумевают под весом страницы. …Я не понимаю разницы в том, что это за вещи. Поэтому они говорят, что вес страницы (также называемый размером страницы) — это общий объем данных, измеряемый в килобайтах или мегабайтах, которые пользователь должен загрузить для просмотра определенной страницы. В моей книге есть изображения и все такое, потому что мне нужно это скачать, чтобы увидеть.

И именно поэтому я был удивлен, узнав, что в 2015 году этот размер составлял 845 килобайт. Для меня это было удивительно. …Потому что я предполагал, что с изображениями он будет больше 800 килобайт.

… В июле 2025 года медианный размер той же страницы теперь составляет 2,3 мегабайта.”

Данные сжимаются

<п>Но это только один из способов понять размер страницы. Другой способ учитывать размер страницы — сосредоточиться на том, что передается по сети, что может быть меньше из-за сжатия. Сжатие — это алгоритм на стороне сервера, который минимизирует размер файла, отправляемого с сервера и загружаемого браузером. Большинство серверов используют алгоритм сжатия Brotli.

Мартин Сплитт объясняет:

<блоковая цитата><п>«Я задал этот вопрос публично, потому что у разных людей очень разные представления о том, как они понимают размер страницы. В зависимости от слоя, на который вы смотрите, это тоже может сбивать с толку
потому что есть еще сжатие.

…Итак, некоторые люди говорят: ах, но этот сайт загружает 10 мегабайт на мой диск.

И я такой, да. …но, возможно, если вы посмотрите на то, что на самом деле передается по проводу, вы обнаружите, что это пять или шесть мегабайт, а не все 10 мегабайт. Потому что вы можете сжимать данные на сетевом уровне, а затем распаковывать их на уровне клиента…”

<п>Технически размер страницы в примере Мартина на самом деле составляет пять или шесть мегабайт из-за сжатия, и она может загружаться быстрее. Но со стороны пользователя эти пять или шесть мегабайт распаковываются и снова превращаются в десять мегабайт, которые занимают столько же места на телефоне, компьютере или где-то еще.

И это вносит двусмысленность. Размер вашей веб-страницы — десять или пять мегабайт ?

<стр>Это иллюстрирует более широкую проблему: разные люди говорят о разных вещах, когда говорят о размере страницы.

Даже широко используемые определения не полностью устраняют двусмысленность. Вес страницы описывается как «общий объем данных, измеряемый в килобайтах или мегабайтах, которые пользователь должен загрузить». но, как становится ясно из обсуждения, единого четкого определения не существует.

Мартин утверждает:

<блоковая цитата><п>“Когда вы спрашиваете людей, что они думают, большой это размер или нет, вы начинаете получать очень разные ответы в зависимости от того, как они думают о размере страницы. И не существует единственного верного определения.”

А как насчет соотношения разметки к контенту?

Одно из самых интересных отличий, сделанных в подкасте, заключается в том, что большая страница не обязательно неэффективна. Например, HTML-документ размером 15 МБ считается приемлемым, поскольку «почти большая часть этих 15 мегабайт на самом деле представляет собой полезный контент». Размер соответствует доставляемой ценности.

<п>Напротив, что, если бы соотношение контента и разметки было противоположным, где контента было немного, но подавляющую часть веса страницы составляла разметка.

Мартин обсудил пример соотношения:

“…а что, если разметка – это единственные накладные расходы? И я имею в виду, что вы имеете в виду? Это типа, ну, вы знаете, если это около пяти мегабайт, но контента очень мало, разве это плохо? Разве это хуже, чем в этом случае, 15 мегабайт.

И мне кажется, это сложно, потому что тогда мы попадаем на эту странную территорию взаимоотношений между контентом и разметкой. Да. <п>И я сказал: ну, а что, если по большей части это разметка, представляющая собой метаданные для какого-то стороннего инструмента, или для какой-то службы, или по нормативным причинам, или по причинам лицензирования, или что-то еще. Тогда это полезный контент, но не обязательно для конечного пользователя, но он все равно должен быть у вас.

Было бы странно сказать, что это хуже, чем страница, вес которой в основном приходится на контент.”

Здесь Мартин меняет представление о весе страницы от необработанного размера к тому, что на самом деле представляют данные.

Почему страницы содержат данные, которые пользователи никогда не видят

Основной вклад в вес страницы вносит контент, который пользователи никогда не видят.

<п>Гэри Иллиес указывает на структурированные данные как на пример контента, который специально предназначен для машин, а не для пользователей. Хотя это может быть полезно для поисковых систем, оно также увеличивает общий размер страницы. Если издатель добавляет на свою страницу много структурированных данных, чтобы воспользоваться всеми доступными опциями, это приведет к увеличению размера страницы, даже если пользователь ее никогда не увидит.

Это обращает внимание на структурную реальность Интернета: страницы создаются не только для читателей-людей. Они также созданы для поисковых систем, инструментов, агентов искусственного интеллекта и других систем, каждая из которых добавляет свои собственные требования к весу веб-страницы.

Когда накладные расходы оправданы

<стр>Не весь контент, не предназначенный для пользователя, является ненужным. <п>Мартин рассказал о том, как разметка может включать “метаданные” или инструмент, нормативная или лицензионная цель, создавая своего рода серую зону. Даже если дополнительные данные не улучшают работу пользователя напрямую, они служат определенной цели, в том числе помогают пользователю найти страницу через поисковую систему.

Суть, которую имел в виду Мартин, заключается в том, что эти соображения относительно веса страницы усложняют попытки обозначить вес страницы как хороший, если он ниже этого порога, или плохой, если вес страницы превышает его.

Почему разделение контента и метаданных не работает

Одно из возможных решений, которое обсуждал Гэри Иллис, — это отделение контента, предназначенного для человека, от данных, передаваемых компьютером. Хотя Гэри не упомянул конкретно предложение LLMs.txt, то, что он обсуждал, отчасти напоминает его в том смысле, что оно передает контент машине за вычетом всех других накладных расходов, связанных с контентом, доступным пользователю.

<п>На самом деле он обсуждал способ отделить все машинные данные от того, что пользователь будет загружать, тем самым теоретически уменьшая пользовательскую версию веб-страницы.

Гэри быстро отвергает эту идею как “утопическую” потому что всегда найдутся толпы спамеров, которые найдут способ этим воспользоваться.

Он объяснил:

“Но, к сожалению, это утопия. Потому что не все в Интернете играют хорошо.

<п>Мы знаем, с каким количеством спама нам приходится иметь дело. В нашем блоге мы где-то говорим, что ловим около 40 миллиардов URL-адресов в день, которые являются спамом или какой-то безумной цифрой, я точно не помню, но это какая-то безумная цифра и определенно миллиарды. Это только увеличит количество спама, который получают поисковые системы и другие машины, возможно, я бы поставил 1 и 5 центов, что фактически увеличит количество спама, который поглощают поисковые системы, LLM и другие.”

<п>Гэри также сказал, что опыт Google показывает, что исторически, когда у вас есть разные виды контента, между ними всегда будут различия. Он привел пример, когда веб-сайты имели страницы для мобильных устройств и настольных компьютеров, где две версии контента, как правило, различались, что, в свою очередь, вызывало проблемы с поиском, а также с удобством использования, когда сайт оценивает веб-страницу по содержанию в одной версии страницы, а затем отправляет пользователя на другую версию страницы, где этот контент не существует.

Хотя он не упомянул об этом прямо, такое объяснение опыта Google может пролить больше света на то, почему Google не будет использовать LLMS.txt.

В результате поисковые системы в основном остановились на однодокументной модели, даже если она неэффективна.

Размер веб-сайта и размер страницы – это реальный мир

<с>Дискуссия в конечном итоге бросает вызов первоначальной концепции проблемы: тяжелые веб-страницы — это плохо.

Гэри замечает:

“Первый вопрос: становятся ли веб-сайты толстыми? Я думаю, что этот вопрос даже не имеет смысла.

<п>Потому что в контексте веб-сайта не имеет значения, толстый ли он. В контексте одной страницы да.

Но в контексте веб-сайта это действительно не имеет значения.”

<стр>Итак, теперь Гэри и Мартин переключают внимание на веб-страницы, которые становятся тяжелее, и это более содержательный способ взглянуть на проблему развития веб-страниц и веб-сайтов. <стр>Это переводит обсуждение с абстрактной идеи на нечто более измеримое и действенное.

Более тяжелые страницы по-прежнему требуют реальных затрат

Даже при более быстром соединении и лучшей инфраструктуре страницы большего размера по-прежнему имеют последствия, а страницы с меньшим весом имеют положительные преимущества.

Мартин объясняет:

“Я думаю, что мы тратим много ресурсов. И я имею в виду, что у нас это было в другом эпизоде, где мы сказали, что знаем, что существуют исследования, которые показывают, что более быстрые веб-сайты имеют лучшее удержание и лучшие показатели конверсии. Ага. И скорость частично также зависит от размера. Потому что чем больше данных я отправляю, тем больше времени требуется сети для фактической передачи этих данных и тем больше времени требуется процессору любого устройства, на котором вы используете, для их фактической обработки и отображения вам.”

В более широкой перспективе проблема заключается не только в производительности, но и в эффективности. По словам Иллиеса, «мы тратим впустую много ресурсов».

Сеть, возможно, становится тяжелее, но более важный вывод – почему. Страницы содержат больше, чем просто контент, ориентированный на пользователя, и выбор дизайна определяет как их размер, так и их влияние.