首页
产品系列
行业应用
渠道合作
新闻中心
研究院
投资者关系
技术支持
关于竞博JBO中心
| En
 
  当前位置:首页 > 新闻资讯 > 机器人知识 > 微信提出推荐中的深度反馈网络,在“看一看”数据集上达到SOTA  
 

微信提出推荐中的深度反馈网络,在“看一看”数据集上达到SOTA

来源:AI科技大本营      编辑:竞博JBO中心      时间:2020/5/22      主题:其他   [加盟]

在推荐系统中,用户的显式反馈、隐式反馈、正反馈和负反馈都能够反映用户对于被推荐物品的偏好。这些反馈信息在推荐系统中十分有用。然而,现在的大规模深度推荐模型往往以点击为目标,只看重以用户点击行为为代表的隐式正反馈,而忽略了其它有效的用户反馈信息。

作者在本文中关注用户多种显式/隐式和正/负反馈信息,学习用户的无偏兴趣偏好。具体地,作者提出了一个Deep Feedback Network (DFN)模型,综合使用了用户的隐式正反馈(点击行为)、隐式负反馈(曝光但未点击的行为)以及显式负反馈(点击不感兴趣按钮行为)等信息。

DFN模型使用了internal feedback interaction component抓住用户行为序列中的细粒度的行为级别的交互,然后通过external feedback interaction component,使用精确但稀少的隐式正反馈和显式负反馈作为监督,从噪音较多的隐式负反馈中进一步抽取用户的正负反馈信息。在实验中,作者基于微信看一看的数据,进行了丰富的离线和在线实验,模型与baseline相比均取得显著提升。


1、模型背景与简介

推荐系统在日常生活中被广泛使用,为用户获取信息与娱乐提供便利。推荐系统算法往往基于用户与系统的交互,这些交互行为可以大致分为以下两类:显式反馈与隐式反馈。显式反馈从用户对于物品的直接态度中获取,例如评论中的一星到五星,或者微信看一看系统中的“不感兴趣”按钮。这类反馈能够直接表达用户的正向以及负向偏好,但是这类反馈的数量往往不多。隐式反馈从用户的行为中间接获得,例如用户的点击/不点击行为。这些信息在推荐系统中往往是海量的,但是这些信息有着较多噪声(用户点击的并不一定是他真正喜欢的)。另外,隐式反馈通常是以正反馈的形式出现,推荐中的隐式负反馈存在巨大噪声(未展现信息或者未点击信息并不一定意味着用户不喜欢这些内容)。

在近期的深度推荐系统中,CTR导向的目标受到极大关注。因此,模型不可避免地只关注和目标紧密相关的用户点击行为,忽略了其它用户行为中蕴含的丰富信息。仅考虑CTR导向目标的推荐模型往往会遇到以下两个问题:(1)CTR导向目标只关注用户喜欢什么,没有关注用户不喜欢什么。这样,模型的推荐结果容易同质化和趋热化,损害用户体验。因此,负反馈信息是必要的。(2)用户除了被动地接受系统推荐的物品,有时也需要能够主动和即时的反馈机制。用户希望能够高效和准确地告知系统自己喜欢或者不喜欢什么。另外,用户的显式和隐式反馈之间也会存在割裂(用户点击的并不一定是他真正喜欢的)。因此,显式反馈也是必要的。显式信息和隐式信息能够作为彼此的补充,相辅相成。已有工作通过使用用户的未点击/未曝光行为作为用户的隐式负反馈,这样会引入极大的噪声。另外一些工作尝试使用用户的显式负反馈信息。这些信息固然精确,但是也往往比较稀疏。

为了解决这些问题,综合使用用户多种显式/隐式和正/负反馈信息学习更好的无偏用户表示,作者提出了一个Deep Feedback Network (DFN)模型。图1中给出了在微信看一看场景中的三种用户反馈。DFN通过internal feedback interaction component抓住用户行为序列中的细粒度行为级别的交互,然后通过external feedback interaction component,使用精确但稀少的隐式正反馈和显式负反馈作为监督,从噪音较多的隐式负反馈中进一步抽取用户的正负反馈信息。这些反馈特征会和其他用户/物品特征混合,并行使用FM、Deep和Wide层进行特征交互,最后进行CTR预估。

作者基于微信看一看推荐系统,设计了离线和线上实验,在多个指标上具有显著提升。这篇工作的主要贡献如下:

1、作者第一次融合隐式正反馈(点击行为)、隐式负反馈(曝光但未点击的行为)、显式负反馈(点击不感兴趣按钮行为)和它们之间的交互信息进行用户行为建模;

2、作者提出了一个全新的Deep Feedback Network (DFN)模型,能够学习到用户无偏的兴趣偏好;

3、模型在离线和在线任务上都得到了显著提升,具有工业级实用价值。论文中也提出了一个feed流中的显式负反馈预测任务。

 

2、模型结构

DFN模型主要分为三个阶段:首先,deep feedback interaction module以用户的多种反馈行为作为输入,输出用户的反馈特征。然后,Feature Interaction Module进一步考虑用户的其它特征和物品特征,使用FM、Deep和Wide层进行特征交互。最后,输出层使用CTR作为训练目标。图2给出了DFN的整体结构。

deep feedback interaction module是模型的主要创新点。它包括了两个组成部分:Internal Feedback Interaction Component和External Feedback Interaction Component。图3给出了deep feedback interaction module的结构。

首先,在Internal Feedback Interaction Component中,用户的隐式正反馈、隐式负反馈和显式负反馈序列和target item一起,通过一个transformer层,得到了在各个序列内部细粒度的item-level的交互信息,然后经过average层得到三种反馈的特征表示,其中隐式正反馈特征中蕴含高质量的用户正向偏好,显式负反馈特征中蕴含高质量的用户负向偏好。

第二步,在External Feedback Interaction Component中,隐式负反馈序列往往是三种行为中最多的行为,但也是噪声最大的行为。作者把高质量的和target item交互后的隐式正反馈特征和显式负反馈特征看作一种高质量指导,从用户未点击序列中挖掘用户或许喜欢/不喜欢的物品,补充用户的正向负向偏好。作者使用了一个attention层得到了两种用户弱正向/负向反馈特征。这两种弱反馈特征和第一步的三种反馈特征拼接后成为最终的用户反馈特征。

第三步,在Feature Interaction Module中,作者使用了FM、Wide和Deep层,对用户其它特征、物品特征和用户反馈特征等进行低阶/高阶特征交互。这一个模块是为了充分利用各种特征辅助推荐,使得模型在真实工业级任务上达到最好的效果。使用Wide层主要是为了给潜在的特征工程留下接口。

最后,作者基于CTR loss进行训练。除去传统的正例和未点击负例,作者还增加了一项预测用户负反馈点击的loss。由于在实际推荐系统中,用户给出主动显式负反馈的次数极少,显式负反馈中的负向信息也极其强烈,所以作者单独在loss中强调了这一项,并且给予了较大的训练权值。

3、实验结果

离线和线上实验均在微信看一看上进行,离线数据集包含千万级用户在百万级物品上的亿级行为。模型离线CTR预估结果如图4:

4、总结

在本文中,作者初步研究了推荐系统中的多种显式/隐式和正/负反馈之间的协同合作机制。DFN模型能够基于多种反馈信息即时学习到用户的无偏的正负向兴趣,在点击预估和不感兴趣预估等多个任务上均有提升效果。直观而有效的模型也使得DFN能成功在工业级推荐系统中得到部署和验证。我们预测用户的显式反馈,特别是显式负反馈的信息将会未来推荐系统中起到更加重要的作用,在发掘推荐系统可解释性同时提升用户体验。





基于脑肌融合的软体康复手研究

软体机械手充分利用和发挥各种柔性材料的柔顺性,及其非线性、粘弹性和迟滞特性等在软体手运动和控制中潜在的“机械智能”作用,降低控制的复杂度,实现高灵活性、强适应性和良好交互性,在医疗康复领域有重要应用价值

情感分析技术:让智能客服更懂人类情感

智能客服系统中人机结合的服务形式,从五个维度总结和介绍情感分析技术在智能客服系统中的应用场景,包括情感分析算法模型的原理及实际落地使用方式和效果分析

AI也会遭遇瓶颈 解析人工智能技术的存储性能需求

AI人工智能技术需要构建强有力的IT基础设施,人工智能的工作主要由采集、准备、训练和推理四部分组成,每个部分需要读写不同类型的数据,工作负载也不尽相同,将给存储设备带来较大的挑战。

自动化所提出神经元群体间侧向交互的卷积脉冲神经网络模型

基于梯度反向传播的脉冲神经网络(SNN)训练方法逐渐兴起。在这种训练方法下,SNN能够在保留神经元内部动力学的同时获得较好的性能

基于激光雷达的SLAM(激光SLAM)研究

Cartographer跨平台和传感器配置,MC2SLAM实时激光里程计系统,LeGO-LOAM种轻量级和地面优化的激光雷达里程计和建图方法,SUMA++开源的基于语义信息的激光雷达SLAM系统

学一个忘一个?人工智能遭遇“灾难性遗忘”,克服“失忆”有何良策

人工智能为什么会产生“灾难性遗忘”?目前,解决灾难性遗忘的方案有哪些?难点在哪?来看看专家怎么说

迎宾机器人企业【推荐】

2022年迎宾机器人企业:优必选、穿山甲、竞博JBO中心智能、慧闻科技、杭州艾米、广州卡伊瓦、勇艺达、睿博天米、锐曼智能、康力优蓝、云迹科技、南大电子、猎户星空、瞳步智能

人与机器人交互时代的社会认知

与机器人互动时研究人的大脑将有助于更清晰、更深入地了解人机交互,从而为社交机器人的春天奠定基础,将社会维度整合到人与这些机器的交流中来加速人与机器人的交互研究,有助于推动创造真正的社交机器人

腾讯优图30页AI生成内容报告详解步入商业化元年的深度合成技术

腾讯研究院腾讯优图实验室共同完成报告《AI生成内容发展报告2020——“深度合成”(deep synthesis)商业化元年》总结出了人们对该技术的十个误解,帮助人们更全面地了解深度合成技术的发展和应用情况

关于做好《5G应用场景300例》宣传推广工作的通知

山东联通、山东移动、山东电信在全国范围内筛选了解决方案,编制了《5G应用场景300例》加快5G在重点产业领域的推广应用,推动山东省省5G产业发展

自动驾驶网络解决方案白皮书

白皮书系统阐述未来网络架构、运维架构和其关键技术,通过网元、网络和云端的三层AI能力协同,使能网络走向极简超宽、运维迈向人机协同,为运营商和产业伙伴的数字化转型提供实践参考

政府工作报告:加强新基建,拓展5G应用,发展工业互联网

对于 “新基建” 投资,工业互联网建设,以及为企业提供金融支持、帮助企业渡过难关

钱锋院士:人工智能赋能流程制造

智能、自主、可控是未来流程制造智能化的前沿研究方向,需要通过人工智能等现代信息技术与流程制造业的深度融合,拓展“智能+”,研究面向复杂系统的多时空尺度的优化调控方法和技术

日照市垃圾分类排出时间表

2020年, 日照市实现公共机构生活垃圾分类全覆盖,东港区基本建成生活垃圾分类示范片区,2022年,东港区实现生活垃圾分类全覆盖,其他区县至少各有1个街道基本建成生活垃圾分类示范片区。2025年,我市基本建成生活垃圾分类处理系统

电子皮肤和机器学习在智能软体机器人的应用

基于电子皮肤的软体机器人传感、机器学习在柔性电子皮肤上的应用、形状感知、面向软体机器人的反馈控制和机器人的操作

基于多任务学习和负反馈的深度召回模型

基于行为序列的深度学习推荐模型搭配高性能的近似检索算法可以实现既准又快的召回性能,如何利用这些丰富的反馈信息改进召回模型的性能

机器人常用避障传感器

避障使用的传感器各种各样,其特点和适用范围也不同。根据不同的原理,可分为:超声波传感器、红外传感器、激光传感器和视觉传感器等

关于2019年北京冬奥服务型机器人创新产品测评比选大赛第二轮测评结果的公示

北京冬奥入选机器人产品名单:豹小秘,移动售货机器人,移动零售机器人 ,无人配送中车,心得,豹小递,豹小秘,ANDI-安防巡检机器人

迎宾机器人企业【推荐】

2022年迎宾机器人企业:优必选、穿山甲、竞博JBO中心智能、慧闻科技、杭州艾米、广州卡伊瓦、勇艺达、睿博天米、锐曼智能、康力优蓝、云迹科技、南大电子、猎户星空、瞳步智能

山东机器人公司准独角兽企业-竞博JBO中心智能

山东机器人公司,竞博JBO中心机器人荣获山东省工信厅人工智能领域的准独角兽的称号,是中国工信部人工智能产业创新重点任务揭榜优胜单位

消毒机器人优势、技术及未来发展趋势

消毒机器人有哪些优势,未来发展趋势

家庭陪护机器人

家庭陪护机器人能在家中起到监控安全陪护具有人机互动交互服务多媒体娱乐价格查询等

儿童陪护机器人

儿童陪护机器人与孩子互动陪伴玩耍学习价格问询等功能说明使用指南介绍

展馆智能机器人

展馆智能机器人可讲解自主行走语音交互咨询互动价格咨询等功能介绍以及表情展现能力

智能讲解机器人

智能讲解机器人正在剑桥讲解演示咨询互动移动宣传价格问询等功能说明介绍

智能接待机器人

智能接待机器人迎宾服务来宾问询答疑价格查询

智能主持机器人

智能主持机器人参与主持了宁夏的云天大会并完成了大会的接待任务多才多艺载很受欢迎

超市智能机器人

超市智能机器人能帮助商家吸引客户道路指引导购价格查询

4s店智能机器人

4s店智能机器人迎宾销售导购数据收集分析价格问询等

展厅智能机器人

展厅智能机器人可用于接待讲解咨询互动价格查询等功能
 
资料获取
新闻资讯
== 资讯 ==
» 人形机器人未来3-5年能够实现产业化的方
» 导诊服务机器人上岗门诊大厅 助力医院智慧
» 山东省青岛市政府办公厅发布《数字青岛20
» 关于印发《青海省支持大数据产业发展政策措
» 全屋无主灯智能化规范
» 微波雷达传感技术室内照明应用规范
» 人工智能研发运营体系(ML0ps)实践指
» 四驱四转移动机器人运动模型及应用分析
» 国内细分赛道企业在 AIGC 各应用场景
» 国内科技大厂布局生成式 AI,未来有望借
» AIGC领域相关初创公司及业务场景梳理
» ChatGPT 以 GPT+RLHF 模
» AIGC提升文字 图片渗透率,视频 直播
» AI商业化空间前景广阔应用场景丰富
» AI 内容创作成本大幅降低且耗时更短 优
 
== 机器人推荐 ==
 
迎宾讲解服务机器人

服务机器人(迎宾、讲解、导诊...)

 

                              消毒机器人排名                导览机器人         
版权所有 © 竞博JBO中心智能机器人集团股份有限公司     中国运营中心:北京·清华科技园九号楼5层     中国生产中心:山东日照太原路71号
销售1:4006-935-088    销售2:4006-937-088   客服电话: 4008-128-728

广州信息科技 | 安体清 | 科技广州 |