当前位置:首页 > 网站建设

深解京东个性化推荐系统演进史

时间:2018-07-13 19:10:00来源:网站建设作者:seo实验室小编阅读:64次「手机版」
 

个性化推荐

个性化推荐架构

在起步初期,推荐产品比较简单,每个推荐产品都是独立服务实现。新版推荐系统是一个系统性工程,其依赖数据、架构、算法人机交互等环节的有机结合。新版推荐系统的目标,是通过个性化数据挖掘机器学习技术,将“千人一面”变为“千人千面”,提高用户忠诚度用户体验,提高用户购物决策的质量和效率;提高网站交叉销售能力,缩短用户购物路径,提高流量转化率(CVR)。目前新版推荐系统支持多类型个性化推荐,包括商品、店铺、品牌、活动、优惠券、楼层等。新版个性化推荐系统架构如图 4 所示。

图4 新版个性化推荐系统架构

个性化推荐系统架构图中不同的颜色代表不同的业务处理场景:数据处理部分(最底层绿色模块),包括离线数据预处理、机器学习模型训练,以及在线实时行为的接入、实时特征计算。推荐平台(蓝色模块),主要体现响应用户请求时推荐系统的各服务模块之间的交互关系。推荐系统核心模块:

    推荐网关。推荐服务的入口,负责推荐请求的合法性检查、请求分发、在线Debug以及组装请求响应的结果。

    调度引擎。负责推荐服务按策略调度及流量分发,主要根据配置中心的推荐产品的实验配置策略进行分流,支持按用户分流、随机分流和按关键参数分流。支持自定义埋 点,收集实时数据;支持应急预案功能,处理紧急情况,秒级生效。

    推荐引擎。负责推荐在线算法逻辑实现,主要包括召回、过滤、特征计算、排序、 多样化等处理过程。

    个性化基础服务。目前主要个性化基础服务有用户画像、商品画像、用户行为、 预测服务。用户画像包括用户的长期兴趣、短期兴趣、实时兴趣。兴趣主要有性别、品牌 偏好、品类偏好、购买力等级、自营偏好、尺码颜色偏好、促销敏感度、家庭情况等。商品画像主要包括商品的产品词、修饰词、品牌词、质量分、价格等级、性别、年龄、标签等。用户行为主要获取用户近期行为,包括用户的搜索、点击、关注、加入购车、下单等。预测服务主要是基于用户的历史行为,使用机器学习训练模型,用于调整召回候选集的权重

    特征服务平台。负责为个性服务提供特征数据和特征计算,特征服务平台主要针对 特征数据,进行有效的声明、管理,进而达到特征资源的共享,快速支持针对不同的特征进行有效的声明、上线、测试以及A/B实验效果对比。

    个性化技术(橙色模块),个性化主要通过特征和算法训练模型来进行重排序,达到精准推荐的目的。特征服务平台主要用于提供大量多维度的特征信息,推荐场景回放技术是指通过用户实时场景特征信息反馈到推荐排序,在线学习(Online-Learning)和深度学习都是大规模特征计算的个性化服务

    个性化推荐系统的主要优势体现为支持多类型推荐和多屏产品形态,支持算法模型A/B实验快速迭代,支持系统架构与算法解耦,支持存储资源与推荐引擎计算的解耦,支持预测召回与推荐引擎计算的解耦,支持自定义埋点功能;推荐特征数据服务平台化,支持推荐场景回放。

    数据平台

    京东拥有庞大的用户量和全品类的商品以及多种促销活动,可以根据用户在京东平台上的行为记录积累数据,如浏览、加购物车、关注、搜索、购买、评论等行为数据,以及商品本身的品牌、品类、描述、价格等属性数据的积累,活动、素材等资源的数据积累。这些数据是大规模机器学习的基础,也是更精确地进行个性化推荐的前提。

    数据收集

    用户行为数据收集流程一般是用户在京东平台(京东APP、京东PC网站、微信手Q)上相关操作,都会触发埋点请求点击流系统(专门用于收集行为数据的平台系统)。点击流系统接到请求后,进行实时消息发送(用于实时计算业务消费)和落本地日志(用于离线模型计算),定时自动抽取行为日志到大数据平台中心。算法人员在数据集市上通过机器学习训练模型,这些算法模型应用于推荐服务,推荐服务辅助用户决策,进一步影响用户的购物行为,购物行为数据再发送到点击流,从而达到数据收集闭环。

    离线计算

    目前离线计算平台涉及的计算内容主要有离线模型、离线特征、用户画像、商品画像、用户行为,离线计算主要在Hadoop上运行mapreduce,也有部分在Spark平台上计算,计算的结果通过公共导数工具导入存储库。团队考虑到业务种类繁多、类型复杂以及存储类型多样,开发插件化导数工具,降低离线数据开发及维护的成本。数据离线计算架构如图 5 所示。

    图5 数据离线计算架构

    在线计算

    目前在线计算的范围主要有用户实时行为、用户实时画像、用户实时反馈、实时交互特征计算等。在线计算是根据业务需求,快速捕捉用户的兴趣和场景特征,从而实时反馈 到用户的推荐结果及排序,给用户专属的个性化体验。在线计算的实现消息主要来源于Kafka集群的消息订阅和JMQ消息订阅,通过Storm集群或Spark集群实时消费,推送到Redis集群和HBase集群存储。数据在线计算框架如图 6 所示。

    图6 数据在线计算架构

    相关阅读

    京东拒收会全额退款吗?取消订单后如何退款?

    京东网上商城在国内电商行业一直有着不错的成绩,特别是京东的自营式物流覆盖了我国大部分地区,同时在多个地方成立了物流集散中心和

    京东白条储蓄卡激活失败是怎么原因?

    京东白条储蓄卡激活失败是很多京东消费者在激活白条时遇到的问题,这是为什么呢?京东白条支持哪些银行卡类型呢,下面小编为大家总结

    没有京东自提点怎么办?京东无法自提怎么办?

    没有京东自提点怎么办?自己去京东自提点哪去快递,就可以免运费,但是自提点覆盖面并不是很广,那么没有京东自提点怎么办?京东无法自提

    京东全球购是正品吗?为什么京东全球购便宜?

    随着互联网的普及,电商行业得到了快速的发展,足不出户就可以买到全球各地的产品,而且喜欢海购的朋友们也经常会在淘宝或者是京东全球

    自己如何把京东白条套出来(白条二维码秒回款)

    【商家微信号:21585 】专业从事信用消费额度提现业务4年之久;主要操作:蚂蚁花呗套现、京东白条套现、苏宁任性付套现等信用额度套

分享到:

栏目导航

推荐阅读

热门阅读