用户案例
美团:美食知识图谱平台建设及应用
本文来自于 美团技术专家 在 #nLive vol.001 的分享
公司简介
美团的使命是“帮大家吃得更好,生活更好”,公司聚焦“零售 + 科技”战略,推动商品零售和服务零售在需求侧和供给侧的数字化转型。目前在国内拥有450万合作商户,200+业务品类和2800+市区县覆盖,总用户量高达6.5亿;2018年9月20日,美团正式在港交所挂牌上市。
随着UGC、PGC内容的爆发,美团APP上的数据资产每天都在大量增长。公司业务需要一个统一的知识图谱平台来容纳数据集的内在关系,并通过使用图技术来提高信息访问能力,帮助亿万客户在搜索及浏览过程中快速找到他们最需要的产品或服务。
业务挑战
1、公司对图数据存储查询有强烈需求:公司有美食图谱、商品图谱在内的近十个领域知识图谱,约千亿级别数据,亟需对图谱数据进行统一管理
2、传统的关系型数据库、NoSQL数据库虽然可以用来存储图数据,但是不能很好处理图上多跳查询这一高频操作
解决方案
经过多重对比选型,美团的大数据团队最终选择基于国产分布式图数据库厂商 NebulaGraph 搭建图数据库平台——主要由支撑平台、数据生产、数据存储和数据应用四层架构,有需求的业务方可以在这个平台上自助地进行创建图数据库集群、创建图的 Schema、导入图数据、配置导入数据的执行计划、引入平台提供的 SDK 对数据进行操作。
目前,美团有三、四十个业务在这个平台上真正落地,基本实现了对图数据一站式自助管理。
场景1:智能助理
基于美团商户数据、用户评论构建的餐饮娱乐知识图谱,覆盖美食、酒店、旅游等领域,包含 poi、category、dish 等13 类实体和 22 类关系。主要用于解决搜索或者智能助理里 KBQA(基于知识库问答)的问题。
应用场景2:搜索召回
基于医美商家信息构建医美知识图谱,主要用于大搜底层实时召回,返回与查询相关的商户、产品或医生信息,解决医美类搜索词少结果、无结果问题。
例如,某个用户搜“啤酒肚”这种症状、或者“润百颜”这类品牌,系统都能给他召回相关的医美门店。
应用场景3:推荐理由
基于用户画像信息、商户特征信息、用户半年内收藏/购买行为构建知识图谱,给出美食列表推荐商户的可解释理由。
例如,基于用户的协同过滤算法来生成推荐理由 - 在家乡、消费水平、偏好类目、偏好菜系等多种组合维度中找出多条路径,然后给这些路径打分,选出一条分值较高的路径,即可产出推荐理由。
通过上述方式,就可以获得“在北京喜欢北京菜的山东老乡都说这家店很赞”,或者“广州老乡都中意他家的正宗北京炸酱面”这类有很强互动性理由。
使用收益
1、图数据处理能力显著提升:基于 NebulaGraph 可以实现每小时百亿量级数据导入,实时写入多集群,过程中可同步生成全量数据版本并做平滑切换,确保数据不重不漏不延时
2、开箱可用的图可视化模块:具备子图探索能力和友好的交互设计,可以提供邻居信息快速探索子图,并且支持图查看和图编辑,便于不懂技术的业务人员快速上手
3、用户浏览体验更友好:深度学习模型生成的商户推荐列表缺少可解释性,而图谱中用户商户间的连通路径具有天然可解释性,用户得到更有互动感的推荐理由,转化效率也更高