- Лучший результат Google по запросу «NanoClaw» ставит поддельный сайт выше настоящего. ли>
- Разработчик отправил настоящий URL в Search Console, но не удалил самозванца. ли>
- Этот же фейковый сайт ранжируется в DuckDuckGo, Bing, Brave и других поисковых системах.
мл>
Создатель NanoClaw говорит, что Google оценивает поддельный веб-сайт выше реального сайта его проекта, несмотря на 18 тысяч звезд GitHub, освещение в прессе и настройку структурированных данных.
<п>Создатель NanoClaw, платформы агентов искусственного интеллекта с открытым исходным кодом, имеющей более 18 000 звезд GitHub, говорит, что Google оценивает поддельный веб-сайт выше реального сайта его проекта.
В тестах, проведенных 5 марта, сайт-самозванец занял первое место в рейтинге Google по собственному названию проекта. Настоящий веб-сайт nanoclaw.dev не появлялся на первых нескольких страницах результатов.
<ч2>Что происходитч2>
Гавриэль Коэн, инженер-программист и бывший разработчик Wix, разместил на X ветку с описанием проблемы.
Коэн запустил NanoClaw в начале февраля как ориентированную на безопасность альтернативу OpenClaw, вирусной платформе агентов искусственного интеллекта с открытым исходным кодом. Проект быстро рос. VentureBeat рассказал об этом, The Register рассказал о Коэне, а исследователь искусственного интеллекта Андрей Карпати публично похвалил архитектуру проекта.
<п>Примерно 8 февраля кто-то зарегистрировал nanoclaw.net и создал автоматически сгенерированный сайт, взятый из README проекта на GitHub. Коэн сказал, что в то время у него не было веб-сайта, потому что проектом был репозиторий GitHub.
По мере того, как проект получал освещение в прессе, люди продолжали связываться с ним по поводу проблем с “его” веб-сайт. Это было не его.
Он создал настоящий сайт nanoclaw.dev, а затем предпринял несколько стандартных шагов по SEO и исправлению. Он связал его из репозитория GitHub. Он добавил структурированные данные. Он отправил запрос в Google Search Console. Он подал уведомления об удалении в Google, Cloudflare и регистратору доменов. Публикации, посвященные проекту, связаны с nanoclaw.dev.
По состоянию на 5 марта сайт-самозванец по-прежнему занимал более высокое место в рейтинге, чем настоящий.
В своей теме Коэн написал, что фейковый сайт «показывает фактически неверную информацию о проекте и фальсифицирует даты его публикации». Он назвал ситуацию «живой, активной угрозой безопасности». потому что человек, управляющий nanoclaw.net, может в любой момент подменить содержимое страницы вредоносными ссылками для скачивания или фишинговой страницей.
Ветка Hacker News о жалобе Коэна набрала 315 баллов и более 150 комментариев за считанные часы.
Одна и та же проблема в поисковых системах
Комментаторы Hacker News протестировали тот же поиск на других системах и обнаружили, что проблема выходит за рамки Google.
Один комментатор сообщил, что фейковый сайт занял первое место на DuckDuckGo и третье место на Kagi, а настоящий сайт вообще не появился на DuckDuckGo. Другой обнаружил, что Bing, Brave, Ecosia и Qwant показали фейковый сайт на верхних позициях. Mojeek был единственным протестированным движком, который оценил настоящий сайт и исключил поддельный.
Почему это важно
<п>Ранее Джон Мюллер из Google говорил, что скопированный контент, постоянно занимающий более высокий рейтинг, чем оригинал, может указывать на проблему с качеством сайта. Мюллер предложил владельцам сайтов переоценить их общее качество, если такое будет продолжаться.
Случай Коэна проверяет эту логику. Его проект имеет 18 000 звезд GitHub, освещение на каналах CNBC, VentureBeat и The Register, одобрение Karpathy и сообщение в блоге, которое заняло первое место в Hacker News. Каждый профиль в социальных сетях и сам репозиторий GitHub указывают на nanoclaw.dev. На первый взгляд, многие видимые сигналы говорят в пользу настоящего сайта.
Тот факт, что комментаторы Hacker News сообщили об аналогичных результатах в нескольких поисковых системах, предполагает нечто большее, чем ошибка, специфичная для Google. Одним из возможных факторов является время, поскольку фейковый сайт, судя по всему, был проиндексирован до запуска настоящего сайта.
Для тех, кто создает новый продукт, ключевой вывод здесь — пересмотреть подходящее время для регистрации домена. Коэн сосредоточился на коде доставки, прежде чем создавать веб-сайт. Это стандартная практика открытого исходного кода, но поисковые системы сначала проиндексировали самозванца, а исправить его постфактум оказалось труднее, чем предполагает любой из рекомендуемых шагов.
<ч2>Взгляд в будущееч2>
Коэн не сообщил, ответил ли Google на его запросы об удалении. Один специалист по SEO в теме Hacker News дал конкретные советы, в том числе сопоставил обратные ссылки фейкового сайта и связался с публикациями, которые случайно ссылались на неправильный домен.
Ситуация остаётся неразрешённой. Google не дал комментариев на момент публикации.
