Патент Google «Получение информации» для ранжирования веб-страниц

На ранжирование обзоров AI может влиять показатель прироста информации, описанный в недавно выданном патенте Google

Недавно компания Google получила патент на ранжирование веб-страниц, который может дать представление о том, как AI Reviews ранжирует контент. В патенте описан метод ранжирования страниц на основе того, что может заинтересовать пользователя в дальнейшем.

Контекстная оценка прироста информации о канале

Название патента — «Контекстная оценка прироста информации о ссылках», он был подан в 2018 году и выдан в июне 2024 года. Речь идет о расчете рейтинговой оценки, называемой «прирост информации», которая используется для ранжирования второй набор веб-страниц, которые могут быть интересны пользователю как несколько другая дополнительная тема, связанная с предыдущим вопросом.

Патент начинается с общего описания, а затем по ходу абзацев добавляется конкретика. Можно провести аналогию с пиццей. Сначала это пицца с моцареллой, затем добавляют грибы, и теперь это пицца с грибами. Потом добавляют лук, и теперь это пицца с грибами и луком. Есть слои специфики, которые составляют весь контекст.

Так что, если вы прочитаете хотя бы один раздел, легко сказать: “Это явно пицца с грибами” и совершенно заблуждаться относительно того, что это такое на самом деле.

<р><сильный>Существуют слои контекста, но они складываются в следующее:

<ул>

Рейтинг веб-страницы, соответствующей тому, что может заинтересовать пользователя next.

Контекстом изобретения является автоматизированный помощник или чат-бот

Роль поисковой системы похожа на обзоры искусственного интеллекта Google

Получение информации и SEO: что происходит на самом деле?

<п>Пару месяцев назад я прочитал в социальных сетях комментарий, в котором утверждалось, что “Information Gain” стал важным фактором в недавнем обновлении основного алгоритма Google. Это упоминание меня удивило, потому что я никогда раньше не слышал о получении информации. Я спросил об этом некоторых друзей-оптимизаторов, и они тоже никогда о нем не слышали.

То, что утверждал человек в социальной сети, было чем-то вроде того, что Google использует метод “Прирост информации” оценка, чтобы повысить рейтинг веб-страниц, на которых было больше информации, чем на других веб-страницах. Итак, идея заключалась в том, что важно создавать страницы, на которых будет больше информации, чем на других страницах, что-то в этом роде.

<п>Итак, я прочитал патент и обнаружил, что “Information Gain” Речь идет не о ранжировании страниц, содержащих больше информации, чем другие страницы. На самом деле речь идет о чем-то более глубоком для SEO, поскольку это может помочь понять одно измерение того, как AI-обзоры могут ранжировать веб-страницы.

TL/DR патента на получение информации

То, что на самом деле представляет собой патент на получение информации, еще более интересно, поскольку оно может дать представление о том, как обзоры ИИ (AIO) ранжируют веб-страницы, которые могут заинтересовать пользователя в следующий раз. nbsp; Это что-то вроде внедрения персонализации путем предугадывания того, что заинтересует пользователя в следующий раз.

<п>В патенте описан сценарий, в котором пользователь вводит поисковый запрос, а автоматический помощник или чат-бот предоставляет ответ, соответствующий вопросу. Система оценки получения информации работает в фоновом режиме, чтобы ранжировать второй набор веб-страниц, которые имеют отношение к тому, что может заинтересовать пользователя в дальнейшем. Это новое измерение ранжирования веб-страниц.

В патенте особое внимание уделяется автоматизированным помощникам

<п>Существует несколько версий патента на получение информации, датированных периодом с 2018 по 2024 год. Первая версия похожа на последнюю версию, причем наиболее существенным отличием является добавление чат-ботов в качестве контекста использования изобретения для получения информации.

В патенте используется фраза “автоматизированный помощник” 69 раз и использует фразу “поисковая система” всего 25 раз. Как и в случае с обзорами искусственного интеллекта, поисковые системы играют роль в этом патенте, но обычно это касается автоматизированных помощников.

Как станет очевидно, ничто не указывает на то, что веб-страница, содержащая больше информации, чем у конкурентов, с большей вероятностью будет иметь более высокий рейтинг в результатах обычного поиска. В патенте говорится не об этом.

Общее описание контекста

Все версии патента описывают представление результатов поиска в контексте автоматизированного помощника и ответа на вопросы на естественном языке. Патент начинается с общего описания и постепенно становится более конкретным. Это особенность патентов, заключающаяся в том, что они претендуют на охрану в самых широких контекстах, в которых изобретение может быть использовано, и становятся все более конкретными.

Весь первый раздел (Резюме) даже не упоминает веб-страницы или ссылки. Речь идет лишь об оценке получения информации в очень общем контексте:

<блоковая цитата><п>“Оценка прироста информации для данного документа указывает на дополнительную информацию, которая включена в документ помимо информации, содержащейся в документах, которые ранее просматривались пользователем.”

Это краткое описание патента, основная идея которого заключается в том, что оценка прироста информации происходит на страницах после того, как пользователь увидел первые результаты поиска.

<ч2>Более конкретный контекст: Автоматические помощники <п>Второй абзац раздела “Справочная информация” является немного более конкретным и добавляет дополнительный уровень контекста изобретения, поскольку в нем упоминается левый. В частности, речь идет о пользователе, который делает поисковый запрос и получает ссылки на результаты поиска – оценка получения информации еще не рассчитана.

В разделе «Фон» написано:

“Например, пользователь может отправить поисковый запрос и получить набор документов и/или ссылок на документы, которые отвечают на отправленный поисковый запрос. .”

Следующая часть основана на том, что пользователь сделал поисковый запрос:

“Также, например, пользователю может быть предоставлен документ на основе выявленных интересов пользователя, ранее просмотренных документов пользователя и/или других критерии, которые могут быть использованы для идентификации и предоставления интересующего документа. Информация из документов может быть предоставлена, например, через автоматизированный помощник и/или в виде результатов в поисковой системе. Кроме того, информация из документов может быть предоставлена пользователю в ответ на поисковый запрос и/или может быть автоматически предоставлена пользователю на основании продолжения поиска после того, как пользователь завершил сеанс поиска.”

<п>Последнее предложение плохо сформулировано.

Вот исходное предложение:

“Кроме того, информация из документов может быть предоставлена пользователю в ответ на поисковый запрос и/или может быть автоматически предоставлена пользователю на основе продолжения поиска после того, как пользователь завершил сеанс поиска.”

Вот как это имеет смысл:

<п>“Далее информация из документов может быть предоставлена пользователю… на основе продолжения поиска после того, как пользователь завершил сеанс поиска.”

Информация, предоставляемая пользователю, “в ответ на поисковый запрос и/или может быть автоматически предоставлена пользователю”

Будет понятнее, если заключить его в круглые скобки:

Кроме того, информация из документов может быть предоставлена пользователю (в ответ на поисковый запрос и/или может быть автоматически передана пользователю) на основании продолжения поиска после того, как пользователь завершил сеанс поиска.

Вывод:

<ул>

В патенте описаны идентифицирующие документы, которые имеют отношение к «интересам пользователя». на основе “ранее просмотренных документов” “и/или другие критерии.”

Он устанавливает общий контекст автоматического помощника “и/или” поисковая система

Информация из документов, основанная на “ранее просмотренных документах” “и/или другие критерии” может отображаться после того, как пользователь продолжит поиск.

<ч2>Более конкретный контекст: Чат-бот <п>Далее патент добавляет дополнительный уровень контекста и специфики, упоминая, как чат-боты могут «извлекать» информацию; ответ с веб-страницы (“документ”) и покажите его как ответ. Речь идет о показе сводки, содержащей ответ, вроде избранных фрагментов, но в контексте чат-бота.

В патенте объясняется:

<блоковая цитата><п>“В некоторых случаях подмножество информации может быть извлечено из документа для представления пользователю. Например, когда пользователь участвует в устном диалоге между человеком и компьютером с помощью программного обеспечения автоматизированного помощника (также называемого “чат-ботами” “интерактивными персональными помощниками” ” ” «интеллектуальные персональные помощники», «персональные голосовые помощники», «диалоговые агенты», «автоматические помощники» могут выполнять различные типы обработки для извлечения важной информации из документа, чтобы автоматизированный помощник мог представить информацию в сокращенном виде.

В качестве другого примера, некоторые поисковые системы предоставляют сводную информацию из одного или нескольких отвечающих и/или релевантных документов в дополнение или вместо ссылок на отвечающие и/или релевантные документы в ответ на запрос пользователя& поисковый запрос.”

<п>Последнее предложение звучит так, будто оно описывает что-то вроде избранного фрагмента или обзора ИИ, где содержится краткое изложение. Предложение очень общее и двусмысленное, поскольку в нем используются “and/or” и “в дополнение к или вместо” и не так конкретно, как предыдущие предложения. Это пример патента, который является общим по юридическим причинам.

Рейтинг следующего набора результатов поиска

Следующий раздел называется «Сводка», и в нем более подробно описывается, как показатель «Прирост информации» отражает вероятность того, что пользователь будет заинтересован в следующем наборе документов. Речь идет не о ранжировании результатов поиска, а о ранжировании следующего набора результатов поиска (на основе связанной темы).< /p >

В нем указано:

<блоковая цитата><п>“Оценка прироста информации для данного документа указывает на дополнительную информацию, включенную в данный документ, помимо информации, содержащейся в других документах, которые уже были представлены пользователю.”

Рейтинг на основе темы веб-страниц

Затем речь идет о представлении веб-страницы в браузере, о чтении соответствующей части документа вслух или о звуковом/визуальном представлении краткого содержания документа (“аудио/визуальном представлении важной информации, извлеченной из документ пользователю и т. д.”)

Но что действительно интересно, так это то, что далее объясняется использование темы веб-страницы в качестве представления контента, который используется для расчета оценки прироста информации.< /p> <п>Он описывает множество различных способов получения представления о том, о чем страница. Но что важно, так это то, что здесь описывается расчет показателя прироста информации на основе представления о том, о чем контент, например, темы.

“В некоторых реализациях оценки прироста информации могут быть определены для одного или нескольких документов путем применения данных, характерных для документов, таких как все их содержимое, значимая извлеченная информация , семантическое представление (например, внедрение, вектор признаков, представление набора слов, гистограмма, сгенерированная из слов/фраз в документе и т. д.) в модели машинного обучения для генерации оценки прироста информации.& rdquo;

Далее в патенте описывается ранжирование первого набора документов и использование показателей прироста информации для ранжирования дополнительных наборов документов, которые предполагают последующие вопросы или развитие в диалоге того, что интересует пользователя. <п>В некоторых реализациях автоматизированный помощник может запрашивать поисковую систему, а затем применять рейтинг прироста информации к множеству наборов результатов поиска (которые имеют отношение к связанным поисковым запросам).

Есть несколько вариантов выполнения одного и того же действия, но в общих чертах это то, что оно описывает:

“На основании оценок прироста информации информация, содержащаяся в одном или нескольких новых документах, может выборочно предоставляться пользователю таким образом, чтобы он отражал вероятную информацию. выигрыш, которого может достичь пользователь, если ему будет представлена информация из выбранных документов.”

Что общего во всех версиях патента

<п>Все версии патента имеют общие черты, к которым со временем добавляется больше деталей (например, добавление лука в пиццу с грибами). Ниже приведены общие черты всех версий.

Применение оценки получения информации

Все версии патента описывают применение показателя прироста информации ко второму набору документов, которые содержат дополнительную информацию помимо первого набора документов. Очевидно, что не существует критериев или информации, позволяющей угадать, что будет искать пользователь, когда он начинает сеанс поиска. Таким образом, показатели прироста информации не применяются к первым результатам поиска.

Примеры отрывков, одинаковых для всех версий:

<блоковая цитата> <ул>

Идентифицирован второй набор документов, который также относится к теме первого набора документов, но еще не был просмотрен пользователем.

<ли>Для каждого нового документа во втором наборе документов определяется показатель прироста информации, который указывает для нового документа, включает ли новый документ информацию, которая не содержалась в документах первого набора документов… <ч3>Автоматические помощники

Все четыре версии патента относятся к автоматическим помощникам, которые показывают результаты поиска в ответ на запросы на естественном языке.

В версиях патента 2018 и 2023 годов поисковые системы упоминаются по 25 раз. В версии 2o18 упоминается «автоматический помощник». 74 раза, а в последней версии это упоминается 69 раз.

<п>Все они ссылаются на «диалоговых агентов». “интерактивные персональные помощники” “интеллектуальные персональные помощники” “персональные голосовые помощники” и «виртуальные помощники».

<стр>Очевидно, что акцент в патенте делается на автоматических помощниках, а не на результатах органического поиска.

Повороты диалогов

Примечание: В повседневном языке мы используем слово диалог. При вычислениях они пишут это dialog.

Все версии патентов относятся к способу взаимодействия с системой в форме диалога, а именно поворота диалога. Поворот диалога — это движение вперед и назад, которое происходит, когда пользователь задает вопрос, используя естественный язык, получает ответ, а затем задает дополнительный вопрос или вообще другой вопрос. Это может быть естественный язык в тексте, преобразование текста в речь (TTS) или звуковой сигнал.

<п>Главный аспект, общий для всех патентов, — это движение вперед и назад, так называемое «поворот диалога». Во всех версиях патента это является контекстом.

Вот пример того, как работает ход диалога:

“Клиент 106 автоматизированного помощника и удаленный автоматизированный помощник 115 могут обрабатывать ввод пользователя на естественном языке и предоставлять ответы в форме диалогового окна, которое включает в себя одно или несколько диалоговых окон. поворачивается. Поворот диалога может включать, например, ввод данных на естественном языке, вводимый пользователем, и ответ автоматизированного помощника на ввод естественного языка.

Таким образом, может быть сгенерирован диалог между пользователем и автоматизированным помощником, который позволяет пользователю взаимодействовать с автоматизированным помощником …в разговорной манере”

Проблемы, которые решаются с помощью информационных очков

<п>Основная особенность патента — улучшение пользовательского опыта за счет понимания дополнительной ценности, которую представляет новый документ по сравнению с документами, которые пользователь уже видел. Эта дополнительная ценность и есть то, что подразумевается под фразой «Получение информации».

Есть несколько способов получения информации, и один из способов, который описан во всех версиях патента, находится в контексте аудио ответ и насколько многословный звуковой ответ нехорош, в том числе в контексте TTS (текст в речь).

Патент объясняет проблему многословного ответа:

<блоковая цитата><п>“…и поэтому пользователь может дождаться вывода практически всего ответа, прежде чем продолжить. По сравнению с чтением, пользователь может пассивно получать аудиоинформацию, однако время, необходимое для вывода, увеличивается, а возможности сканирования или прокрутки/пропуска информации ограничены.”

Затем в патенте объясняется, как получение информации может ускорить ответы за счет устранения повторяющихся (повторяющихся) ответов или, если ответа недостаточно, и вынуждает пользователя перейти к следующему диалогу.

Эта часть патента относится к плотности информации раздела веб-страницы, раздела, который отвечает на вопрос с наименьшим количеством ответов. слов. Плотность информации зависит от того, насколько “точно” “краткий” и “соответствующие”‘ ответ – актуальность и избежание повторяемости. Плотность информации важна для аудио/речевых ответов.

Вот что написано в патенте:

<блоковая цитата><п>“Поэтому в контексте аудиовыхода важно, чтобы выходная информация была актуальной, точной и краткой, чтобы избежать излишне длинного вывода, избыточного вывода или дополнительного диалога.< /п>

Информационная плотность выходной информации становится особенно важной для повышения эффективности сеанса диалога. Описанные здесь методы решают эти проблемы путем уменьшения и/или исключения представления информации, которая уже была предоставлена пользователю, в том числе в контексте аудиодиалога между человеком и компьютером.”

<п>Идея “плотности информации” важно в общем смысле, потому что оно лучше общается с пользователями, но, вероятно, оно особенно важно в контексте отображения в результатах поиска чат-ботов, независимо от того, произносится оно вслух или нет. Обзоры Google AI отображают фрагменты веб-страницы, но, что, возможно, более важно, краткое изложение информации — лучший способ быть в теме и облегчить поисковым системам понимание контента.

Интерфейс результатов поиска

Все версии патента Information Gain ясно показывают, что изобретение не находится в контексте органических результатов поиска. Это явно связано с ранжированием веб-страниц в естественном языковом интерфейсе автоматизированного помощника и чат-бота с искусственным интеллектом.

Однако есть часть патента, описывающая способ показа пользователям второго набора результатов в «интерфейсе результатов поиска». Сценарий таков: пользователь видит ответ, а затем интересуется соответствующей темой. Второй набор ранжированных веб-страниц отображается в “интерфейсе результатов поиска”

.

В патенте объясняется:

<блоковая цитата>

“В некоторых реализациях один или несколько новых документов второго набора могут быть представлены способом, который выбирается на основе хранилищ прироста информации. Например, один или несколько новых документов могут быть отображены как часть интерфейса результатов поиска, который представляется пользователю в ответ на запрос, включающий тему документов, например ссылки на один или несколько документов. В некоторых реализациях эти результаты поиска могут быть ранжированы, по крайней мере частично, на основе их соответствующих оценок прироста информации.”

<п>…Затем пользователь может выбрать одну из ссылок, и информация, содержащаяся в конкретном документе, может быть представлена пользователю. Впоследствии пользователь может вернуться к результатам поиска, и ссылки на документ могут быть снова предоставлены пользователю, но обновлены на основе новых оценок прироста информации для документов, на которые имеются ссылки.

В некоторых реализациях ссылки могут быть переранжированы и/или один или несколько документов могут быть исключены (или значительно понижены в должности) из результатов поиска на основе новых оценок прироста информации, которые были определены на основе документа, который пользователь уже просматривал”

Что такое интерфейс результатов поиска? Я думаю, что это просто интерфейс, который показывает результаты поиска.

Давайте остановимся здесь, чтобы подчеркнуть, что на данный момент должно быть ясно, что суть патента не заключается в ранжировании веб-страниц, подробно освещающих определенную тему. Общий контекст изобретения — отображение документов в автоматизированном помощнике.

<п>Интерфейс результатов поиска — это всего лишь интерфейс, его никогда не называют обычными результатами поиска, это всего лишь интерфейс.

<стр>Есть нечто общее во всех версиях патента, но вышеизложенное представляет собой важные общие принципы и контекст.

Патентная заявка

В разделе формулы изобретения описывается объем фактического изобретения и в отношении которого они испрашивают правовую охрану. Основное внимание уделяется изобретению, а не контексту. Таким образом, в разделе «Претензии» не упоминаются поисковые системы, автоматизированные помощники, звуковые ответы или TTS (текст в речь). Остаётся контекст интерфейса результатов поиска, который предположительно охватывает все контексты.

Контекст: Первый комплект документов

<п>Оно начинается с описания контекста изобретения. Этот контекст получает запрос, определяет тему, ранжирует первую группу соответствующих веб-страниц (документов), выбирает хотя бы одну из них как релевантную и либо показывает документ, либо передает информацию из документа (например, краткое изложение). . <блоковая цитата><п>«1. Способ, реализованный с использованием одного или более процессоров, включающий: прием запроса от пользователя, при этом запрос включает в себя тему; идентификация первого набора документов, которые отвечают на запрос, при этом документы из набора документов ранжируются, и при этом ранжирование данного документа из первого набора документов указывает на релевантность информации, включенной в данный документ, для тема; выбор на основе ранжирования и документов первого набора документов наиболее релевантного документа, предоставляющего пользователю по крайней мере часть информации из наиболее релевантного документа;”

Контекст: Второй комплект документов

Затем сразу следует ранжирование второго набора документов, содержащих дополнительную информацию. Этот второй набор документов ранжируется с использованием показателей прироста информации, чтобы показать больше информации после показа соответствующего документа из первой группы.

Вот как это объясняется:

<блоковая цитата><п>“…в ответ на предоставление пользователю наиболее релевантного документа, получение от пользователя запроса на дополнительную информацию, связанную с темой; идентификацию второго набора документов, при этом второй набор документов включает в себя один или несколько документов из первого набора документов и не включает в себя наиболее релевантный документ; определение для каждого документа второго набора показателя прироста информации, причем показатель прироста информации для соответствующего документа второго набора основан на количестве новой информации, включенной в соответствующий документ второго набора, которая отличается от включенной информации в наиболее актуальном документе; ранжирование второго набора документов на основе оценок прироста информации; и обеспечение представления пользователю, по меньшей мере, части информации из одного или нескольких документов второго набора документов, при этом информация представляется на основе оценок прироста информации.”

Детализация

<п>Остальная часть раздела претензий содержит подробные сведения о концепции получения информации, которая представляет собой ранжирование документов на основе того, что пользователь уже видел, и представляет собой связанную тему, которая может быть интересна пользователю. Целью этих подробностей является заблокируйте их для юридической защиты как часть изобретения.

Вот пример:

Способ по п.1, в котором идентификация первого набора включает:
вызывает отображение как часть интерфейса результатов поиска, который представляется пользователю в ответ на предыдущий запрос, включающий тему, ссылки на один или несколько документов из первого набора;
получение пользовательского ввода, который указывает выбор одной из ссылок на конкретный документ из первого набора из интерфейса результатов поиска, при этом по меньшей мере часть конкретного документа предоставляется пользователю в ответ на выбор;

Для аналогии, здесь описывается, как приготовить тесто для пиццы, очистить и нарезать грибы и т. д. Для наших целей не так уж важно понимать это. общий взгляд на суть патента.

Патент на получение информации

В социальных сетях было распространено мнение, что этот патент как-то связан с ранжированием веб-страниц в результатах обычного поиска. Я увидел это, прочитал патент и обнаружил, что патент работает не так. . Это хороший патент и важно его правильно понять. Я проанализировал несколько версий патента, чтобы увидеть, что они было общее и что отличалось.

Внимательное прочтение патента показывает, что он явно ориентирован на то, чтобы предвидеть то, что пользователь может захотеть увидеть, основываясь на том, что он уже видел. Для достижения этой цели в патенте описано использование показателя прироста информации для ранжирования веб-страниц, посвященных темам, которые связаны с первым поисковым запросом, но не имеют конкретного отношения к этому первому запросу.

Контекстом изобретения обычно являются автоматизированные помощники, включая чат-ботов. Поисковую систему можно использовать для поиска соответствующих документов, но контекст — это не только органическая поисковая система.

Этот патент может быть применим в контексте обзоров ИИ. Я бы не стал ограничивать контекст обзорами ИИ, поскольку существуют дополнительные контексты, такие как разговорная речь, в которых может применяться оценка прироста информации. Может ли это применяться в дополнительных контекстах, таких как Избранные фрагменты? В самом патенте об этом не говорится.

Патент Google «Получение информации» для ранжирования веб-страниц

Контекстная оценка прироста информации о канале

Получение информации и SEO: что происходит на самом деле?

TL/DR патента на получение информации

В патенте особое внимание уделяется автоматизированным помощникам

Общее описание контекста

Рейтинг следующего набора результатов поиска

Рейтинг на основе темы веб-страниц

Что общего во всех версиях патента

Применение оценки получения информации

Повороты диалогов

Проблемы, которые решаются с помощью информационных очков

Интерфейс результатов поиска

Патентная заявка

Контекст: Первый комплект документов

Контекст: Второй комплект документов

Детализация

Патент на получение информации

admin

Related Posts