<стр>Используйте журналы сервера, строки пользовательского агента и проверку IP-адреса для управления GPT, Claude, Gemini и т. д., одновременно защищая полосу пропускания и поддерживая участие в обнаружении ИИ.
<п>Видимость ИИ играет решающую роль для оптимизаторов, и это начинается с контроля сканеров ИИ. Если сканеры ИИ не могут получить доступ к вашим страницам, вы невидимы для механизмов обнаружения ИИ.
С другой стороны, неконтролируемые ИИ-сканеры могут перегружать серверы чрезмерными запросами, вызывая сбои и непредвиденные счета за хостинг.
Строки пользовательского агента необходимы для контроля того, какие ИИ-сканеры могут получить доступ к вашему веб-сайту, но официальная документация часто устарела, неполна или вообще отсутствует. Итак, мы составили проверенный список ИИ-сканеров на основе журналов наших реальных серверов в качестве полезного справочного материала.
Каждый пользовательский агент проверяется на соответствие официальным спискам IP-адресов, если они доступны, что обеспечивает точность. Мы будем поддерживать и обновлять этот список, чтобы отслеживать появление новых сканеров и вносить изменения в существующие.
Полный список проверенных ИИ-сканеров (декабрь 2025 г.)
| Имя | Purpose | Скорость сканирования SEJ (страниц/час) | Список проверенных IP | Robots.txt disallow | Полный пользовательский агент | ||||||
|---|---|---|---|---|---|---|---|---|---|---|---|
| GPTBot | Сбор данных обучения ИИ для моделей GPT (ChatGPT, GPT-4o) | 100 | Официальный список IP | Пользовательский агент: GPTBot Разрешить: / Запретить: /private-folder |
Mozilla/5.0 AppleWebKit/537.36 (KHTML, как Gecko; совместимо; GPTBot/1.3; +https://openai.com/gptbot) | ||||||
| ChatGPT-User | AI-агент для просмотра веб-страниц в реальном времени, когда пользователи взаимодействуют с ChatGPT | 2400 | Официальный список IP | Пользовательский агент: ChatGPT-User Разрешить: / Запретить: /private-folder |
Mozilla/5.0 AppleWebKit/537.36 (KHTML, например Gecko); совместимый; Пользователь ChatGPT/1.0; +https://openai.com/bot | ||||||
| OAI SearchBot | Индексация поиска AI для функций поиска ChatGPT (не для обучения) | 150 | Официальный список IP | Пользовательский агент: OAI-SearchBot Разрешить: / Запретить: /private-folder |
Mozilla/5.0 (Macintosh; совместимость с Intel Mac OS; OAI SearchBot/1.3; +https://openai.com/searchbot | ||||||
| ClaudeBot | Сбор данных обучения ИИ для моделей Claude | 500время> | Официальный список IP | Пользовательский агент: ClaudeBot Разрешить: / Запретить: /private-folder |
Mozilla/5.0 AppleWebKit/537.36 (KHTML, как Gecko; совместимо; ClaudeBot/1.0; +claudebot@anthropic.com) | ||||||
| Claude-User | AI-агент для доступа в Интернет в режиме реального времени, когда пользователи Claude просматривают страницы | <10 | Недоступно | Пользовательский агент: Claude-User Запретить: /sample-folder |
Mozilla/5.0 AppleWebKit/537.36 (KHTML, как Gecko; совместимый; Claude-User/1.0; +Claude-User@anthropic.com) | ||||||
| Claude-SearchBot | Индексирование поиска AI для возможностей поиска Claude | <10 | Недоступно | Пользовательский агент: Claude-SearchBot Разрешить: / Запретить: /private-folder |
Mozilla/5.0 AppleWebKit/537.36 (KHTML, как Gecko; совместимо; Claude-SearchBot/1.0; +https://www.anthropic.com) | ||||||
| Google-CloudVertexBot | AI-агент для Vertex AI Agent Builder (только по запросу владельцев сайтов) | <10 | Официальный список IP | Пользовательский агент: Google-CloudVertexBot Разрешить: / Запретить: /private-folder |
Mozilla/5.0 (Linux; Android 6.0.1; сборка Nexus 5X/MMB29P) AppleWebKit/537.36 (KHTML, например Gecko) Chrome/141.0.7390.122 Mobile Safari/537.36 (совместимо; Google CloudVertexBot; +https://cloud.google.com/enterprise-search) | Google-Extended | Токен, контролирующий использование обучения ИИ контента, просканированного роботом Googlebot. | Пользовательский агент: Google-Extended Разрешить: / Запретить: /private-folder |
|||
| Gemini-Deep-Research | Агент по исследованию искусственного интеллекта для функции Deep Research в Google Gemini | <10 | Официальный список IP | Пользовательский агент: Gemini-Deep-Research Разрешить: / Запретить: /private-folder |
Mozilla/5.0 AppleWebKit/537.36 (KHTML, как Gecko; совместимо; Gemini-Deep-Research; +https://gemini.google/overview/deep-research/) Chrome/135.0.0.0 Safari/537.36 | ||||||
| Чат Gemini, когда пользователь просит открыть веб-страницу | <10 | ||||||||||
| Bingbot | Управляет поиском Bing и чатом Bing (второй пилот) ответы ИИ | 1300 | Официальный список IP | Пользовательский агент: BingBot Разрешить: / Запретить: /private-folder |
Mozilla/5.0 AppleWebKit/537.36 (KHTML, например Gecko; совместимо; bingbot/2.0; +http://www.bing.com/bingbot.htm) Chrome/116.0.1938.76 Сафари/537.36 | ||||||
| Applebot-Extended | Не сканирует, но контролирует, как Apple использует данные Applebot. | <10 | Официальный список IP | Пользовательский агент: Applebot-Extended Разрешить: / Запретить: /private-folder |
Mozilla/5.0 (Macintosh; Intel Mac OS) тр> | ||||||
| PerplexityBot | Индексация поиска AI для системы ответов Perplexity | 150 | Официальный список IP | Пользовательский агент: PerplexityBot Разрешить: / Запретить: /private-folder |
Mozilla/5.0 AppleWebKit/537.36 (KHTML, например Gecko; совместимо; PerplexityBot/1.0; +https://perplexity.ai/perplexitybot) | ||||||
| Perplexity-User | ИИ-агент для просмотра в режиме реального времени, когда пользователи Perplexity запрашивают информацию | <10 | Официальный список IP | Пользовательский агент: Perplexity-User Разрешить: / Запретить: /private-folder |
Mozilla/5.0 AppleWebKit/537.36 (KHTML, как Gecko; совместимо; Perplexity-User/1.0; +https://perplexity.ai/perplexity-user) | ||||||
| Meta-ExternalAgent | Сбор данных обучения ИИ для LLM Meta (лама и т. д.) | 1100 | Недоступно | Пользовательский агент: мета-внешний агент Разрешить: / Запретить: /private-folder |
meta-externalagent/1.1 (+https://developers.facebook.com/docs/sharing/webmasters/crawler) | ||||||
| Meta-WebIndexer | Используется для улучшения мета-поиска AI. | <10 | Недоступно | Пользовательский агент: Meta-WebIndexer Разрешить: / Запретить: /private-folder |
мета-webindexer/1.1 (+https://developers.facebook.com/docs/sharing/webmasters/crawler) | ||||||
| Bytespider | данные обучения искусственного интеллекта для LLM ByteDance для таких продуктов, как TikTok | <10 | Недоступно | Пользовательский агент: Bytespider Разрешить: / Запретить: /private-folder |
Mozilla/5.0 (Linux; Android 5.0) AppleWebKit/537.36 (KHTML, например Gecko) Mobile Safari/537.36 (совместимый; Bytespider; https://zhanzhang.toutiao.com/) | ||||||
| Amazonbot | Обучение искусственному интеллекту для Alexa и других AI-сервисов Amazon | 1050 | Недоступно | Пользовательский агент: Amazonbot Разрешить: / Запретить: /private-folder |
Mozilla/5.0 AppleWebKit/537.36 (KHTML, например Gecko; совместимо; Amazonbot/0.1; +https://developer.amazon.com/support/amazonbot) Chrome/119.0.6045.214 Сафари/537.36 | ||||||
| DuckAssistBot | Индексация поиска AI для поисковой системы DuckDuckGo | 20 | Официальный список IP | Пользовательский агент: DuckAssistBot Разрешить: / Запретить: /private-folder |
DuckAssistBot/1.2; (+http://duckduckgo.com/duckassistbot.html) | ||||||
| MistralAI-User | Сборщик цитирования Mistral в реальном времени для “Le Chat” помощник | <10 | Недоступно | Пользовательский агент: MistralAI-User Разрешить: / Запретить: /private-folder |
Mozilla/5.0 AppleWebKit/537.36 (KHTML, как Gecko; совместимо; MistralAI-User/1.0; +https://docs.mistral.ai/robots) | ||||||
| Webz.io | Извлечение данных и парсинг веб-страниц, используемые другими компаниями по обучению искусственному интеллекту. Ранее известный как Омгили. | <10 | Недоступно | Пользовательский агент: webzio Разрешить: / Запретить: /private-folder |
webzio (+https://webz.io/bot.html) | ||||||
| Diffbot | Извлечение данных и парсинг веб-страниц, используемые компаниями по всему миру. | <10 | Недоступно | Агент пользователя: Diffbot Разрешить: / Запретить: /private-folder |
Mozilla/5.0 (Windows; U; Windows NT 5.1; en-US; rv:1.9.1.2) Gecko/20090729 Firefox/3.5.2 (.NET CLR 3.5.30729; Diffbot/0.1; +http://www.diffbot.com) | ||||||
| сканер ICC | Сбор данных искусственного интеллекта и машинного обучения | <10 | Недоступно | Пользовательский агент: ICC-Crawler Разрешить: / Запретить: /private-folder |
ICC-Crawler/3.0 (совместим с Mozilla; ; https://ucri.nict.go.jp/en/icccrawler.html) | ||||||
| CCBot | Веб-архив с открытым исходным кодом, используемый в качестве обучающих данных несколькими компаниями, занимающимися искусственным интеллектом | <10 | Официальный список IP | Пользовательский агент: CCBot Разрешить: / Запретить: /private-folder |
CCBot/2.0 (https://commoncrawl.org/faq/) |

![Complete Crawler List For AI User-Agents [Dec 2025]](/wp-content/uploads/2025/12/complete-crawler-list-for-ai-user-agents-dec-2025-7164d32.png)
![Complete Crawler List For AI User-Agents [Dec 2025]](/wp-content/uploads/2025/12/complete-crawler-list-for-ai-user-agents-dec-2025-e6ffb78.png)
![Complete Crawler List For AI User-Agents [Dec 2025]](/wp-content/uploads/2025/12/complete-crawler-list-for-ai-user-agents-dec-2025-f8aff97.png)
![Complete Crawler List For AI User-Agents [Dec 2025]](/wp-content/uploads/2025/12/complete-crawler-list-for-ai-user-agents-dec-2025-dc52e4a.png)