关系的接近度记录在知识图谱等语义数据库中。最相关的实体类型或媒体格式将会在搜索结果中得到优先呈现。
除了用户行为之外,还可以基于文档中的共现来中的关键字和/或元数据来识别与第一实体相关的实体,这些关键字和/或元数据指示与实体相对应的主题和/或类型。作为更具体的示例,在第一实体是虚构人物的名称的情况下,关键字和/或元数据可以指定该人物出现的内容的类型(例如,书籍、电视节目、电影和/或其他适当内容)(例如,犯罪、动作、惊悚片和/或其他适当类型)、该人物出现的内容的名称、该人物出现的内中的共现来容的创作者和/或其他适当的信息。然后可以使用关键字和/或元数据来识别与类似关键字和/或元数据相关联的其他实体(例如,与相同内容类型相关联的角色、具有相同角色的内容、由相同内容创建者创建的内容……
- 主要实体与某些实体类型联系在一起时提及的次数越多,这些实体类型对于主要主题或主要实体而言就越重要。
关系的接近度记录在知识图谱等语义 手机数据 数据库中。最相关的实体类型将会在搜索结果中得到优先呈现。
用于识别关系的(半)结构化数据库
第三种可能性是识别维基百科等(半)结构化数据库的分层信息结构中的关系。作为更具体的示例,在第一主题或主要实体为“意大利菜”的情况下,结构化数据可以包括“食物/菜系/厨师”(表示“厨师”是“意大利菜”的属性)、“食物/菜系/菜肴中的共现来”(表示中的共现来“菜肴”是“意大利菜”的属性)、“食物/菜系/原产地”(表示“原产地”是“意大利菜”的属性)和/或任何其他适当的数据。
其他可能的来源可能是特殊数据库,例 购买后使用促销代码和奖金 如记录中的共现来演员及其电影的目录或已经手动将菜肴分配到某些类别的目录。针对示例“意大利食物”和属性“食物/菜系/菜肴”,结构化数据可以指定与“食物/菜系/菜肴”相对应的实体包括“千层面”、“披萨”、“意式冰淇淋”和/或任何其他适当的元素。在文章 “谷歌如何处理来自维基百科的知识图谱信息?”中阅读有关中的共现来此主题的更多信息。
实践总结
该专利的发现如下:
专利中描述的方法和流程表明,谷 人工智慧文本 歌希望以实体为基础对互联网上免费提供的信息进行索引和分类,并识别和评估实体之间的关系,以便为用户提供更相关的搜索结果。有关基于实体的索引的更多详细信息,请参阅文章 基于实体的索引:从内容索引到实体索引。
正如本博客中已经部分讨论和详细描述的那样,以下来源对此很重要:
- 以重复搜索查询模式表现的用户行为
- 用户在消费某些媒体形式时的行为模式
- 通过频道订阅者数量和社交媒体分享量来衡量受欢迎程度
- 文档中同时出现的频率
- (半)结构化数据库中的信息结构
Google 希望 SERP 能够呈现有用的结果,显示出多种多样的媒体格式,具体取决于用户的偏好和主要实体。内容、来源和主体实体之间的关系的接近性起着至关重要的作用。
Suggest 建议还明确指出,Google 的基于实体的索引已经非常先进,至少就短尾实体而言。所有已在知识图谱中正式记录并因此具有知识面板的实体都会通过建议明确建议。针对搜索查询“超人”的 Google 自动建议
一旦 Google 意识到搜索查询与已知实体直接相关,就会启动基于实体的 SERP 交付,至少就通用搜索框、知识面板和实体相关域以及维基百科而言。这也阻止了谷歌将来自更远来源的实体推到前面并捕获品牌流量,至少就经典搜索结果而言。
如果你看看当前的 SERP,这些趋势就会变得越来越明显。以下是一些示例:詹姆斯邦德的 SERP
詹姆斯邦德 (James Bond) 实体的 SERP 显示以下内容:
- 维基百科是主要实体最喜欢的来源
- 来源附近的实体 jamesbond.de 是来源附近的实体
- 用户希望看到与实体相关的新闻
- 最喜欢的实体类型是演员(演员阵容)、电影……詹姆斯邦德的 SERP
实体 Jay-Z 的 SERP 显示以下内容:
- 维基百科是主要实体最喜欢的来源
- 出生日期、身高、配偶、子女、兄弟姐妹是用户对 JAY-Z 或实体类型说唱歌手感兴趣的属性
- 用户喜欢观看与实体相关的视频
- 最喜欢的实体类型或类别是音乐曲目、专辑