Почему проблема со спамом в Google становится все хуже

Алгоритмы Google, похоже, вознаграждают те самые злоупотребления, для предотвращения которых они были созданы, в самых простых формах.

<п>Спам снова в поиске. И в широком смысле.

Честно говоря, я не думаю, что Google вообще справится с этим. Масштаб беспрецедентный. Они вручную преследовали издателей, выпустив обновление о нарушении репутации сайта. Больше злоупотреблений в отношении просроченных доменов достигает вершин поисковой выдачи, чем когда-либо за всю новейшую историю. Они ведут проигрышную битву и отвлеклись от мяча.

В микромире вот что происходит (Изображение предоставлено: Гарри) Кларксон-Беннетт)

Несколько лет назад поиск стал первым среди различных проблем со спамом “творческого” SEO-специалисты проходили испытания. Перспектива получить спам-обновление и готовность Google инвестировать и заботиться о качестве поиска, казалось, выиграли войну. Попытка оправиться от этих наказаний является не чем иным, как катастрофой. Просто спросите любого, кого затронуло обновление «Полезный контент».

Но всё изменилось. ИИ бессистемно переписывает правила, и крупным технологическим компаниям приходится жарить более крупную и ядовитую рыбу. Сейчас не лучшее время для белого SEO-специалиста.

TL;DR

<ол>

Google в настоящее время проигрывает войну со спамом, беспрецедентные масштабы которого обусловлены ошибками, создаваемыми искусственным интеллектом, а также просроченным доменом и злоупотреблением PBN.

Система обнаружения спама Google отслеживает четыре ключевые группы сигналов – – контент, ссылки, репутация и поведение.

Данные из Google Leak показывают, что наиболее эффективное обнаружение сосредоточено на скорости ссылки и тексте привязки.

<ли>ИИ “поиск” в десятки раз дороже традиционного поиска. Эти огромные затраты и сосредоточенность на новых продуктах искусственного интеллекта приводят к недостаточным инвестициям в основную борьбу со спамом.

Как работает система обнаружения спама Google?

Через SpamBrain. Ранее поисковый гигант запустил Penguin, Panda, и RankBrain , чтобы принимать более обоснованные решения на основе ссылок и ключевых слов.

<п>И сейчас плохо. <п>SpamBrain предназначен для выявления контента и веб-сайтов, занимающихся спамом, с очевидно “шокирующим” точность.точность. Я не знаю, подразумевается ли шокирование в этом смысле в положительном или отрицательном смысле сейчас, но я могу только повторять сказанное.

Со временем алгоритм узнает, что является спамом, а что нет. Как только он четко установит сигналы, связанные со спам-сайтами, он сможет создать нейронную сеть.

Так же, как и в случае с исходными сайтами: если у вас есть список самых спам-сайтов, вы можете точно сопоставить с ними всех остальных. Затем вы сможете анализировать сигналы в масштабе – контент, ссылки, поведенческие и репутационные сигналы – – группировать сайты вместе.

<ул>

Входы (содержание, связь репутационных и поведенческих сигналов).

Скрытый слой (кластеризация и сравнение каждого сайта с известными спам-сайтами).

<сильный>Выходы(спам или не спам).

Если ваш сайт попадает в ту же группу, что и сайты, явно рассылающие спам, когда дело доходит до любого из вышеперечисленных пунктов, это плохой знак. Алгоритм работает на порогах. Полагаю, вам нужно плыть достаточно близко к ветру и достаточно долго, чтобы на вас не напали спам-обновления.

<п>Но если ваш контент относительно невелик и имеет низкую добавленную стоимость, вы, вероятно, уже на полпути. Добавьте сюда несколько опасных ссылок, несколько плохих бизнес-решений (наиболее очевидным примером является паразитическое SEO) и масштабное злоупотребление контентом, и вы обречены.

О каком спаме мы здесь говорим?

Google отмечает здесь самые вопиющие действия. Мы говорим:

<ул> <ли>Маскировка.

Нарушение порога.

Злоупотребление доменом с истекшим сроком действия.

Взломанный контент.

Скрытый текст и содержимое.

Наполнение ключевыми словами.

Ссылочный спам.

Масштабное злоупотребление контентом.

Злоупотребление репутацией сайта.

Тонкий партнерский контент.

UGC-спам.

Многие из них сильно переплетены. Злоупотребление доменами с истекшим сроком действия и PBN. Наполнение ключевыми словами — это немного устаревшая практика, но ссылочный спам все еще жив и здоров. Масштабное злоупотребление контентом в Интернете достигло рекордно высокого уровня.

Чем больше контента вы разместите на нескольких семантически схожих веб-сайтах, тем эффективнее вы сможете работать. Использование якорей точного и частичного соответствия, чтобы повысить свой авторитет в отношении “денег” страницы, тем богаче вы станете. <стр>Давайте углубимся в самые важные из них ниже. <ч3>Фейковые новости

Миллионы просмотров страниц были отправлены злоумышленникам просроченных и удаленных доменов (Изображение предоставлено Гарри Кларксоном-Беннеттом)

От изменения пенсионного возраста до бесплатных проездных на автобусе и лицензий на телевидение – спамеры знают рынок. Они умеют стимулировать эмоции. В аду нет такой ярости, как у презираемого пенсионера, и хотя вы можете простить странную оплошность, никто не может быть таким щедрым. <стр>Люди, которые работали по книге, отодвигаются на второй план. Но возможности в мире черной шляпы стремительно растут. Честно говоря, это довольно весело.

Масштабное злоупотребление контентом

<п>На момент написания более 50% контента в Интернете — это отстой ИИ. Некоторые говорят больше. По данным Ahrefs, из почти миллиона страниц, проанализированных в этом году, 74% содержат контент с искусственным интеллектом. То, что мы видим, — это лишь то, что ускользает сквозь гигантские трещины.

Нетрудно понять, в чем проблема… (Изображение предоставлено: Гарри Кларксон-Беннетт)

Согласно исследованию удостоенного наград журналиста Жана-Марка Манаша, он обнаружил более 8300 созданных искусственным интеллектом новостных веб-сайтов на французском языке и более 300 на английском языке (верхушка айсберга, поверьте мне).

По его оценкам, двое из этих владельцев сайтов стали миллионерами.

<п>Используя авторитетные домены с истекшим сроком действия и PBN (подробнее об этом далее), оптимизаторы – люди, которые все еще разрушают Интернет – знать, как обыграть систему. Подделывая клики, манипулируя сигналами взаимодействия и эффективно используя прошлые ссылки.

Злоупотребление доменом с истекшим сроком действия

<стр>Большой папочка. У черных нулевая точка.

Если вы хотя бы немного общаетесь с сообществом «черных шляп», вы поймете, насколько легко сейчас использовать домены с истекшим сроком действия. В приведенном ниже примере кто-то купил веб-сайт London Road Safety (некогда весьма авторитетный домен) и превратил его в одностраничный сайт “лучшие сайты для ставок, которых нет на GamStop” сайт.

Это лишь один пример из многих (Изображение предоставлено Гарри Кларксоном-Беннеттом)

Ставки и криптовалюта – это эпицентр всего, что связано с черной шляпой, просто потому, что здесь задействовано так много денег.

Я здесь не эксперт, но думаю, что процесс выглядит следующим образом:

<ол> <ли>Купите ценный домен с истекшим сроком действия и чистой историей обратных ссылок (без ручных штрафов). В идеале несколько штук.

Затем вы можете начать создавать свой собственный PBN с уникальными хостинг-провайдерами, серверами имен и IP-адресами, а также с множеством авторитетных, старых и новых доменов.

Этот домен(ы) становится вашим оплотом справедливости/авторитета.

Развернуть несколько вариантов домена TLD, т. е. вместо .com он становится .org.uk.

Добавьте сочетание привязок точного и частичного соответствия из PBN к денежному сайту, чтобы обозначить его новую направленность.

Либо добавьте редирект 301 на короткий период времени к денежному варианту домена, либо канонизируйте этот вариант.

Эти аферы всегда краткосрочные. Но если все сделано хорошо, они могут стоить десятки сотен тысяч фунтов. И они вернулись, и я считаю, что они более ценны, чем когда-либо.

Сейчас я думаю, что это так же просто, как купить старый благотворительный домен, добавить быстрый рескин и вуаля. Тактика 301 или передачи капитала и ваш одностраничный сайт о «лучших казино, которых нет на gamstop»; печатает деньги. Даже на англоязычном рынке.

<п>По словам печально известного парня в черной шляпе Чарльза Флоата, некоторые из этих компаний отмывают сотни тысяч фунтов в месяц.

PBNs

A PBN (или сеть частных блогов) — это сеть веб-сайтов, которые кто-то контролирует и ссылается на денежный сайт. Вариант сайта, предназначенный для получения обычно рекламного или партнерского дохода.

Сеть частных блогов должна быть совершенно уникальной друг от друга. Они не могут делиться хлебными крошками, которые Google может отследить. Каждому сайту нужен отдельный:

<ул>

Хостинг-провайдер.

IP-адрес.

Серверы имен.

<п>Причина, по которой PBN так ценны, заключается в том, что вы можете накопить огромную долю ссылочной массы и фальсифицировать тематический авторитет для снижения риска. Домены с истекшим сроком действия опасны, потому что они дорогие, и как только на них налагается штраф, они обречены. PBN распределяют риск. Подобно голове гидры, человек умирает; другой поднимается.

Защита актива уровня 1 (купленного устаревшего или просроченного домена) имеет первостепенное значение. Вместо того, чтобы указывать ссылки непосредственно на сайт денег, вы можете ссылаться на сайты, которые ссылаются на сайт денег.

Это косвенно повышает ценность денежного сайта, защищая его от любопытных глаз Google.

Что говорит утечка Google о спаме?

Как всегда, это неточная наука. На самом деле это даже не псевдонаука. Чтобы все заработало, на мне есть шапочка из фольги и куча веревочек, соединяющих разрозненные фрагменты информации по комнате. Вы должны подписаться на Шона Андерсона здесь.

Если я приму каждое упоминание слова “спам” в названиях и описаниях модулей их около 115, как только я убрал всякую ерунду. Затем мы можем разделить их на контент, ссылки, репутационные и поведенческие сигналы.

<п>Если сделать еще один шаг вперед, эти модули можно классифицировать как относящиеся к таким вещам, как построение ссылок, якорный текст, качество контента и т. д. Это дает нам примерное представление о том, что важно с точки зрения масштаба .

Якорный текст составляет львиную долю спам-модулей на основе данных Google Leak (и моя собственная ошибочная категоризация) (Изображение предоставлено Гарри Кларксон-Беннеттом)

Несколько примеров:

<ул>

spambrainTotalDocSpamScore вычисляет общий спам-рейтинг документа.

IndexingDocjoinerAnchorPhraseSpamInfo and IndexingDocjoinerAnchorSpamInfo модули определяют спам-якорные фразы, просматривая число, скорость, дни, когда были обнаружены ссылки, и время окончания всплеска.

GeostoreSourceTrustProto помогает оценить достоверность источника.

Действительно, главный вывод заключается в том, насколько важны ссылки с точки зрения спама. В частности, анкорный текст. Скорость, с которой вы получаете ссылки, имеет значение. Как и текст и окружающий его контент. Похоже, что связывание — это то место, где алгоритм Google наиболее способен идентифицировать красные и желтые флажки.

<п>Если на вашем графике скорости ссылок отмечены привязки с точным соответствием высококоммерческим страницам, это признак. Как только сайт проверяется на наличие такого типа контента или нарушений, связанных со ссылками, поведенческие и репутационные сигналы анализируются в рамках SpamBrain.

Если эти данные подтверждаются и ваш сайт превышает определенные пороговые значения, вы обречены. Вот почему это (до недавнего времени) считалось относительно изящным искусством.

В конечном итоге они просто меньше вкладывают в традиционный поиск

Как заметил Мартин МакГарри, их просто меньше волнует … У них есть более крупная и галлюциногенная рыба, которую можно жарить.

Изображение предоставлено: Гарри Кларксон-Беннетт

В 2025 году у нас было четыре обновления продолжительностью ок. 70 дней. В 2024 году их было семь, которые длились почти 130 дней. Уровень производительности, к которому мы все можем стремиться.

Нетрудно догадаться, почему…

<п>Опыт передового поиска меняется. Google распространяет предпочтительные источники издателей по всему миру и повышает эффективность встроенных ссылок в своих продуктах искусственного интеллекта. Столь необходимые изменения.

Я думаю, что мы наблюдаем формирование в реальном времени нового поискового опыта в форме Веб-руководства Google. Персонализированное сочетание надежных источников, режима AI, более классического интерфейса поиска и чего-то вдохновляющего. Я подозреваю, что это может быть немного похоже на канал Discover-lite. Место в традиционном интерфейсе поиска, где контент, который вам почти наверняка понравится, будет подаваться вам, чтобы поддерживать вашу заинтересованность.

<п>Неподтверждено, но, судя по всему, Google, среди прочего, добавил сигналы рекомендаций, основанные на персоне, и уровень частного издателя. Я считаю, что группировка пользователей в когорты является фундаментальной частью Discover. Именно это позволяет контенту становиться вирусным.

Как только вы поймете достаточно о пользователе, чтобы распределить его по определенным группам, вы сможете насытить рынок в течение нескольких дней. Откройте для себя. Даже меньше. Но проблема в экономике всего этого. Десять синих ссылок стоят дешево. ИИ нет. На любом уровне.

По данным Google, когда кто-то выбирает предпочтительный источник, он переходит на этот сайт в среднем в два раза чаще. Так что я подозреваю, что к этому стоит отнестись серьезно.

Почему поиск с помощью ИИ намного дороже?

Google собирается потратить в этом году на 10 миллиардов долларов больше, чем ожидалось, из-за растущего спроса на облачные сервисы. В годовом исчислении капитальные затраты Google почти вдвое превышают показатели 2024 года (52,5 миллиарда долларов).

<п>Это не только Гугл. Это гонка на дно Кремниевой долины.

2025 было экстраполировано, но в этом году ожидается 92 миллиарда долларов (Изображение предоставлено: Гарри Кларксон-Беннетт)

Хотя Google не опубликовал общедоступную информацию по этому поводу, не секрет, что поиск с использованием ИИ значительно дороже, чем классические 10 синих ссылок. Традиционный поиск в основном статичен и основан на поиске. Он использует предварительно проиндексированные страницы для предоставления списка ссылок, и его эксплуатация очень дешева.

<п>Обзор AI является генеративным. Google должен запустить большую языковую модель, чтобы обобщить и сгенерировать ответ на естественном языке. Режим AI значительно хуже. Многоходовой диалоговый интерфейс обрабатывает весь диалог дополнительно к новому запросу.

Учитывая метод разветвления запроса – где параллельно выполняются десятки поисковых запросов – этот процесс требует значительно большей вычислительной мощности.

Пользовательские чипы, эффективность и кэширование могут снизить стоимость этого. Но это одна из самых больших проблем Google. Я подозреваю, что именно поэтому Барри считает, что режим AI не будет поиском по умолчанию. Я был бы удивлен, если бы это не применялось только на уровне поиска/персонализации. Существует множество брендовых и навигационных запросов, где это будет огромной тратой денег.

<стр>И эти парни действительно любят деньги. <блоковая цитата>

У LLM уже есть проблема со спамом

<п>Это довольно хорошо документировано. Похоже, что количество LLM, по крайней мере частично, обусловлено огромным количеством упоминаний в данных обучения. Все принимается как прочитанное.

Изображение предоставлено: Гарри Кларксон-Беннетт <п>В идеале мы не жили бы в мире, где низкопробное дерьмо превосходит по эффективности надлежащие маркетинговые усилия. Но мы здесь.

Как и в 2012 году, “лучший” списки у всех на языке. Базовое SEO возвращается, потому что это то, что сейчас работает в LLM. Платные размещения, взаимный обмен ссылками. Назовите это сами.

Изображение предоставлено: Гарри Кларксон-Беннетт

Если он полузадран, значит, он возвращается.

Поскольку эти модели полагаются на индекс Google для поисковых запросов, на которые модель не может с уверенностью ответить (RAG), спам-система Google имеет большее значение, чем когда-либо. Точно так же, как я думаю, издателям необходимо выступить против крупных технологий и искусственного интеллекта, так и Google необходимо сделать шаг вперед и отнестись к этому серьезно.

Я не уверен, что кто-нибудь пойдет сюда…

Я даже не уверен, что они хотят этого прямо сейчас. OpenAI подписала несколько довольно необычных контрактов, и ее доходы далеки от ожидаемых. А капитальные затраты Google зашкаливают.

<п>Таким образом, такие вещи, как качество и точность, не находятся на первом месте в списке. Доверие потребителей и инвесторов не так уж и велико. Им нужно заработать немного денег. А частные компании могут проявлять некоторую невмешательство, когда дело доходит до отчетности о доходах и прибыли.

По данным HSBC, OpenAI необходимо привлечь не менее $207 миллиардов к 2030 году, чтобы она могла продолжать терять деньги. Его описывают как «денежную яму с веб-сайтом наверху»; выглядит не очень хорошо.

Новое финансирование необходимо вложить в центры обработки данных (Изображение предоставлено Гарри Кларксоном-Беннеттом)

Давайте посмотрим, как они постфактум рационализируют свой выход из этой ситуации. Вот и все. Спасибо, что прочитали и подписались на мое последнее обновление в этом году. Конечно, прошел год.

Этот пост был первоначально опубликован на сайте Leadership in SEO.

Почему проблема со спамом в Google становится все хуже

TL;DR

Как работает система обнаружения спама Google?

О каком спаме мы здесь говорим?

Масштабное злоупотребление контентом

Злоупотребление доменом с истекшим сроком действия

PBNs

Что говорит утечка Google о спаме?

В конечном итоге они просто меньше вкладывают в традиционный поиск

Нетрудно догадаться, почему…

Почему поиск с помощью ИИ намного дороже?

У LLM уже есть проблема со спамом

Я не уверен, что кто-нибудь пойдет сюда…

admin

Related Posts