Новые данные показывают, что размер большинства веб-страниц не превышает лимит сканирования Googlebot в 2 мегабайта, что определенно доказывает, что об этом не стоит беспокоиться.
Новые данные, основанные на реальных веб-страницах, показывают, что лимит сканирования Googlebot в два мегабайта более чем достаточен. Новые инструменты SEO предоставляют простой способ проверить, сколько весит HTML-код веб-страницы.
Данные показывают, что 2 мегабайта достаточно
<п>Необработанный HTML — это, по сути, просто текстовый файл. Чтобы текстовый файл достиг двух мегабайт, ему потребовалось бы более двух миллионов символов.
В HTTPArchive объясняется, что такое измерение веса в HTML:
“HTML-байты относятся к чистому текстовому весу всей разметки на странице. Обычно он включает определение документа и обычно используется в тегах страниц, таких как <div> или <span>. Однако он также содержит встроенные элементы, такие как содержимое тегов скрипта или стили, добавленные к другим тегам. Это может быстро привести к раздуванию HTML-документа.”
Это то же самое, что робот Googlebot загружает в формате HTML, только разметку на странице, а не ссылки на JavaScript или CSS.
Согласно последнему отчету HTTPArchive, реальный средний размер необработанного HTML-кода составляет 33 килобайта. Самый тяжелый вес страницы в 90-м процентиле составляет 155 килобайт. Это означает, что размер HTML для 90% сайтов меньше или примерно равен 155 килобайтам. Только на 100-м процентиле размер HTML превышает два мегабайта, а это означает, что страницы весом два мегабайта и более представляют собой крайние отклонения.
В отчете HTTPArchive объясняется:
<блоковая цитата><п>“Размер HTML оставался одинаковым для разных типов устройств для 10-го и 25-го процентилей. Начиная с 50-го процентиля, HTML-код настольного компьютера был немного больше.
Значительной разницы не будет до тех пор, пока не будет достигнут 100-й процентиль, когда настольный компьютер достигнет 401,6 МБ, а мобильный — 389,2 МБ.”
Данные отделяют измерения домашней страницы от измерений внутренней страницы и неожиданно показывают, что разница между весами обеих страниц незначительна. Данные объяснены:
<блоковая цитата><п>“Между внутренними страницами и домашней страницей по размеру HTML существует небольшая разница, которая действительно становится очевидной только на 75-м процентиле и выше.
На 100-м процентиле разница значительна. HTML-код внутренней страницы достиг невероятных 624,4 МБ и на 375 % больше, чем HTML-код домашней страницы (166,5 МБ).”
Размеры HTML для мобильных и настольных компьютеров одинаковы
Интересно, что размеры страниц мобильной и настольной версий были удивительно похожи, независимо от того, измерял ли HTTPArchive домашнюю страницу или одну из внутренних страниц.
HTTPArchive объясняет:
“Разница в размерах мобильных и настольных компьютеров крайне незначительна, это означает, что большинство веб-сайтов отображают одну и ту же страницу как для мобильных, так и для настольных компьютеров.
<п>Такой подход значительно сокращает объем обслуживания для разработчиков, но означает, что общий вес страницы, вероятно, будет выше, поскольку фактически две версии сайта развертываются на одной странице.”
Хотя общий вес страницы может быть выше, поскольку HTML-код для мобильных и настольных компьютеров существует одновременно в коде, как отмечалось ранее, фактический вес все еще намного ниже порога в два мегабайта вплоть до 100-го процентиля.
<п>Учитывая, что для увеличения HTML-кода веб-сайта до двух мегабайт требуется около двух миллионов символов, и что данные HTTPArchive, основанные на реальных веб-сайтах, показывают, что подавляющее большинство сайтов значительно меньше ограничения Googlebot в 2 МБ, можно с уверенностью сказать, что можно вычеркнуть размер HTML из списка SEO-вещей, о которых стоит беспокоиться.
Приручить ботов
Дэйв Смарт из Tame The Bots недавно сообщил, что они обновили свой инструмент так, что теперь он перестанет сканировать при лимите в два мегабайта для тех, чьи сайты сильно выделяются, показывая, в какой момент Googlebot перестанет сканировать страницу.
Умное сообщение:
“Рискуя преувеличить, насколько это реальная проблема (на самом деле это не для 99,99% сайтов, как я себе представляю), я добавил функциональность в tamethebots.com/tools/fetch-… чтобы ограничить размер текстовых файлов до 2 МБ, чтобы имитировать это.”
Скриншот интерфейса Tame The Bots
<п>

<п>Инструмент покажет, как страница будет выглядеть для Google, если сканирование будет ограничено двумя мегабайтами HTML. Но он не показывает, превышает ли тестируемая страница два мегабайта, а также не показывает, сколько весит веб-страница. Для этого есть другие инструменты.
Инструменты для проверки размера веб-страницы
Есть несколько сайтов с инструментами, которые показывают размер HTML, но есть два, которые показывают только размер веб-страницы. Я тестировал одну и ту же страницу на каждом инструменте, и они оба показали примерно одинаковый вес страницы, плюс-минус несколько килобайт.
Проверка размера веб-страницы Toolsaday
Программа проверки размера веб-страницы Toolsaday с интересным названием позволяет пользователям проверять один URL-адрес за раз. Этот конкретный инструмент делает только одну вещь: позволяет легко быстро узнать, сколько весит веб-страница в килобайтах (или больше, если страница находится в 100-м процентиле).
Скриншот результатов теста Toolsaday

Небольшие инструменты SEO Проверка размера страницы веб-сайта
Проверка размера страницы сайта Small SEO Tools отличается от инструмента Toolsaday тем, что Small SEO Tools позволяет пользователям тестировать десять URL-адресов одновременно.
Не о чем беспокоиться
Суть в двухмегабайтном лимите сканирования робота Google заключается в том, что среднестатистическому SEO-специалисту не о чем беспокоиться. Это буквально затрагивает очень небольшой процент выбросов. Но если вам от этого станет легче, попробуйте один из вышеперечисленных SEO-инструментов, чтобы успокоить себя или своих клиентов.
