11月17, 2020

端上智能在快手上下滑推荐取得APP时长+1%的应用实践

1.背景

1.1.端上智能

端上智能是相对于云计算人工智能应用(如推荐、搜索)的概念:如工业界成熟的推荐系统方案,几乎都是通过云计算的算力,在海量候选集中搜索用户感兴趣的Feed,并通过复杂的精排模型(百亿至千亿级参数规模)将排序Top的Feeds列表发送给智能手机终端。智能手机终端在这个过程中,只是对云端下发的Feeds列表进行渲染,收集用户反馈进行上报,并没有执行推荐算法。所有AI算法全都部署在云端,智能手机通过网络请求才能获得云端AI计算的结果。

近些年智能手机等终端设备的算力有了显著提升,这些算力足以支持一些中等规模的DNN模型进行推理与训练,一些原本只能在云端运行的AI模块,可以部署在智能手机终端上,从而使得智能手机终端,在不依赖云端的情况下,也可以进行独立的AI计算。

目前业内,手淘猜你喜欢在端上智能落地方面已有实践,并取得较为显著收益(EdgeRec[1, 2], 双十一ipv+10%, gmv+5%)。

1.2.上下滑推荐

上下滑推荐,相对于传统的Feeds流推荐,不再向用户展示Feeds封面列表,每一屏直接展示一个Feeds详情页内容,用户不能预知接下去展示的Feeds(见图一)。

image

图一: 封面瀑布流与上下滑

点击查看原文>

本文链接:https://blog.jnliok.com/post/a0qzkSLY1ajtDDRNrYX6.html

-- EOF --

Comments