Google Local Search Research Gaper об извлечении типа бизнеса

Google Local Search Research Gaper об извлечении типа бизнеса

< P > Детали Google Research Paper об алгоритме, который извлекает информацию типа работы с бизнес -сайтов для использования в картах Google и поиске.

< img Width = "1600" Height = "840" SRC = "https://www.searchenginejournal.com/wp-content/uploads/2025/06/google-local-search-355.jpg" class = "Attachment-fe-full size wp-post-image" old = " Local Search Research Paper on Business Type Extraction "fetchpriority =" High "Decoding =" async "srcset =" https://www.searchenginejournal.com/wp-content/uploads/2025/06/google-search-355.jpg 1600W, https://www.searchenginejournal.com/wp-content/uploads/2025/06/google-local-search-355-480x252.jpg 480w, https://www.searchenginejournal.com/wp-content/uploads/2025/06/google-local-search-355-680x357.jpg 680w, https://www.searchenginejournal.com/wp-content/uploads/2025/06/google-local-search-384x202.jpg 384w, https://www.searchenginejournal.com/wp-content/uploads/2025/06/google-local-search-355-768x403.jpg 768W https://www.searchenginejournal.com/wp-content/2025/06/google-kryn5.journal.com/wp-content/2025/06/google-kearch-355.journal.com/wp-content/2025/06/google-local-search-355.journalnam 1024W "размеры =" (максимальная ширина: 1600px, 1600px "/> < p >Google опубликовал исследовательский документ, описывающий, как он извлекает & Ldquo; Услуги предлагаются & rdquo; Информация с местных бизнес -сайтов, чтобы добавить его в бизнес -профили в картах Google и поиске. Алгоритм описывает конкретные факторы релевантности и подтверждает, что система успешно использовалась в течение года.

< P > Что примечательно исследовательская работа заключается в том, что одним из авторов является Марк Наджорк, выдающийся научный сотрудник Google, который связан со многими вехами в поиске информации, обработке естественного языка и искусственном интеллекте.

< P > Цель этой системы состоит в том, чтобы упростить пользователям поиск местных предприятий, которые предоставляют услуги, которые они ищут. Документ был опубликован в 2024 году (согласно интернет -архиву) и датируется 2023 г.

~ 60 >~ 60 > Научная статья объясняет:

< Цитата блока >< P >& ldquo; & Хеллип; Чтобы уменьшить усилия пользователей, мы разработали и развернули конвейер для автоматического извлечения типов заданий с бизнес -сайтов. Например, если веб -страница, принадлежащая сантехническому бизнесу, утверждает: & ldquo; Мы предоставляем установку туалета и ремонт смесителей и amp; rdquo;, наш трубопровод выводит установку туалета и ремонт крана в качестве типов заданий для этого бизнеса. & Amp; rdquo;

< H2 > Система использует Bert < p >Google использовал модель языка BERT, чтобы классифицировать, описывают ли фразы, извлеченные с бизнес -сайтов реальные типы работы. Берт был точно настроен на маркированные примеры и дал дополнительный поиск в контексте в качестве структуры веб-сайта, шаблонов URL и бизнес-категории, чтобы не проявить неточность с жертвоприношением масштабируемости.

< H3 > Разработка локальной системы поиска < P > Первым шагом для создания системы для ползания и извлечения информации о типе работы было создание данных обучения с нуля. Они выбрали миллиарды домашних страниц, которые перечислены в профилях Google Business, и извлекали информацию типа работы из таблиц и форматированных списков на домашних страницах или страницах, которые находились на один клик от домашних страниц. Данные типа работы стали набором семян типов заданий.

< P > Извлеченные данные типа задания использовались в качестве поисковых запросов, дополненных расширением запроса (синонимы) для расширения списка типов заданий, чтобы включить все возможные вариации фраз типа задания.

< H2 > Второй шаг: исправление задачи релевантности

< p >Google & Исследователь применил свою систему на миллиардах страниц, и это сделало & T Работайте, как и предполагалось, потому что на многих страницах были фразы типа работы, которые не описали услуги, предлагающие

~ 60 >~ 60 > Научная статья объясняет:

< Цитата блока >> 62 ~ & Ldquo; Мы обнаружили, что многие страницы упоминают название типа работы для других целей, таких как давление советов. Например, веб -страница, которая учит читателей справляться с Bed Gest, может содержать предложение, подобное решению, – это позвонить в службы очистки дома, если вы найдете ошибки BET в вашем доме. Они обычно предоставляют такие услуги, как контроль постельных клопок. Хотя эта страница Menon Make Make Type Type Type, страница не подтверждается бизнесом по уборке дома. & Amp; rdquo;

< p >Ограничение ползания и индексации на идентификацию фраз типа задания приводит к ложноположительно. Решением состояло в том, чтобы включить предложения, которые окружали фразы ключевых слов, чтобы они могли лучше понять контекст фраз типа работы.

~ 60 >~ 60 > Успех использования окружающего текста объясняется: ~/p > < blockquote >> 62 ~ & Ldquo; Как показано в таблице 2, Jobmodelsurround работает лучше, чем Jobmodel, что говорит о том, что окружающие слова действительно могут объяснить намерение типа работы семян. Это успешно улучшает семантическое понимание без обработки текста Enttire каждой страницы, сохраняя эффективность наших моделей. & Amp; rdquo;

~/Цитата блока > < p > 60 > SEO Insight ~ 60 >Описанный локальный алгоритм поиска преднамеренно исключает всю информацию на странице и сосредоточен на фразах ключевых слов типа работы, а также окружающими словами и фразами вокруг этих ключевых слов. Это показывает важность того, как слова вокруг важных фраз ключевых слов могут предоставить контекст для фраз ключевых слов и облегчить его для Google & Скаулеры, чтобы понять, о чем предназначена страница, не обрабатывая всю веб -страницу.

< p > 60 > SEO Insight ~ 60 >Другое понимание – это то, что Google не индексирует веб -страницу Enttire с ограниченной целью определения фраз типа задания. Алгоритм – это охота на фразу ключевого слова и окружающие фразы ключевых слов.

< p > 60 > SEO Insight ~ 60 > Концепция анализа только части страницы аналогична Google & rsquo; S -центральная аннотация, где раздел контента идентифицируется как основная тема страницы. Я & rsquo; Я не говорю, что они связаны. Я & rsquo; M Просто указываю на одну функцию из многих, где алгоритм Google Zeros Zeros только на разделе страницы.

~ 60 > < Стронг > См.: Google Советы по оптимизации работ

Система извлечения может быть обобщена на другие контексты

< P > Интересная находка, подробно описанная в исследовательской работе, заключается в том, что разработанная ими система может использоваться в областях (домены). Другие локальные предприятия, поиск как & Ldquo; Поиск экспертизы, юридическая и медицинская добыча. & Ampt;

~ 60 >~ 60 > Они пишут:

< Цитата блока >< P >& ldquo; Уроки, которые мы поделились в разработке трубопровода извлечения LARSCALE с нуля, могут обобщать другие задачи извлечения информации или машинного обучения. Они имеют прямые заявления о задачах добычи, в которых изображены выявление экспертизы, добыча юридической и медицинской информации.

< p > Три наиболее важных урока:

< p > (1) Использование поиска свойств данных в качестве структурированного контента может облегчить проблему аннотации данных холодного начала;

< P > (2) Сформулирование задачи в качестве проблемы поиска может помочь исследователям и практикующим справиться с большим набором данных;

< P > (3) Информация о контексте может улучшить качество модели, принося жертву его масштабируемостью. & Ampt;

< H2 > Экстракт типа работы – это успех

< p >Исследовательская работа гласит, что их система является успешной, она имеет высокий уровень точности (точность) и что она масштабируется. Исследовательская работа гласит, что она уже используется в течение года. Исследование датировано 2023 году, но, согласно интернет -архиву (Machine Wayback), оно было опубликовано в июле 2024 года.

~ 60 >~ 60 > Исследователи пишут:

< Цитата блока > ~ p > & ldquo; Наш трубопровод выполняется периодическим, чтобы поддерживать извлеченный контент в курсе. Это в настоящее время развернуто в производстве, а типы работ выводится на миллионы пользователей Google Search и Maps. & Ampt;

< h2 > вынос

< ul > < li > ~ Strong > Google & S -алгоритм, который извлекает типы заданий из веб -страниц ~ 60 >Google разработан для алгоритма, который извлекает & Ldquo; Типы работы & rdquo; (Т.е. предлагаемые услуги) от бизнес -сайтов для отображения в картах Google и поиске.

< li > ~ Стронг > Трубопроводные экстракты из неструктурированного содержания ~ 60 > Вместо того, чтобы полагаться на структурированные элементы HTML, алгоритм читает бесплатный текстовый контент, что делает его эффективным, даже когда услуги похоронены в параграфах.

< li > 60 > Контекстуальная значимость важна ~ 60 > Система оценивает окружающие слова, чтобы подтвердить, что термины, связанные с обслуживанием, фактически имеют отношение к бизнесу, повышая точность.

~ 60 >~ 60 > Потенциал обобщения модели < br > Подход может применяться к другим областям, таким как юридическая или медицинская информация, показывая, как его можно применять к другим видам знаний.

~ 60 >~ 60 > Высокая точность и масштабируемость ~ 60 > Система была развернута более года и обеспечивает масштабируемые, высокие результаты на миллиардах веб-страниц.

< P > Google опубликовал исследовательский документ об алгоритме, который автоматически извлекает описания услуг с локальных бизнес-сайтов, анализируя фразы ключевых слов и окружающий контекст, позволяя более точным и современным спискам в картах Google и поиске. Этот метод избегает зависимости от структуры HTML и может быть адаптирован для использования в других отраслях, где необходима извлечение информации из неструктурированного текста.

Back To Top