直男届的杀手-『小冰』架构解析

点这里排版更好

19 年的第一篇水文献给瞎折腾许久的 Dialogue 领域
~~考试周还这么闲怕是要凉了下次Update应该是月底了~~

本文总结自 The Design and Implementation of XiaoIce, an Empathetic Social Chatbot. [Li Zhou et al. 18.12]

这篇论文算是很好的解读了 XiaoIce的体系架构 包括同步一下最近几年的 MSRA 小冰组 的研究成果

值得一提的是大名鼎鼎的 沈向阳 博士是这篇文章的四作

之前是从机器之心中了解到这篇文章的

但相对于长达 26页的 paper 那篇文章似乎没有 focus on key

~~(古月言兌我没有造* )~~

Current XiaoIce

直男届的杀手-『小冰』架构解析

已经9102年了 XiaoIce也已经迭代了6个版本拥有6.6亿用户超过300亿由用户发送的对话数据

现在的小冰拥有超过 230个技能比如说一些炫酷的功能『识别卡路里』,『失恋33天』

上图是一个典型用户从第一次和小冰对话的生疏到聊动漫再到之后的倾诉情感问题

在小冰的对话中我们可以发现 Reply 不仅仅是是一个陈述句

比如说 Query: 哦。一般女生喜欢什么样的男生呀, 小冰没有只回答一个描述性的语句还给出了一个引发话题的短句Reply: 贴心温柔的，不过谁也不知道会喜欢上谁，感情的事说不准

我们的直男朋友多学着点呜呜呜????

至于 XiaoIce是如何拥有这种能力的这就是我们接下来想讨论的部分

如何评价小冰这种 Open Domain Social long-term Dialogue System 的性能？

当然单次对话轮次 Conversation-turns Per Session (CPS) 是一个很重要的指标

第六代XiaoIce现在的CPS 已经能达到 23 相较于第一代只有5的CPS 确实已经是质的飞跃 (当然这里面肯定也有DataSet变大的作用)

小冰设计的目的是一个 AI Companion, 试图设计一个能通过 分时的图灵测试 的系统

小冰不同于其他的Social Chatbot 在设计之初就确定了拥有自己独特的语言风格或者称之为 '人'格

小冰是一个18岁的小仙女 她可靠 富有同情心 亲热 又不失幽默

她还具有超高的智商和情商 ~~(行了直男别活了 886)~~

IQ: 为了达到IQ的目的需要小冰具有很大的Knowledge 储备，且能做到Personality 的Memory
- 除此之外还要用一些vertical domain的知识比如说 美食鉴别 XiaoIce在这方便做了230+的Skills
EQ: 一个高情商的表现是极具同情心能站在对话的角度思考问题而且能具有一定的社交技巧能做到结合Memory做到个性化的回答
Personality: 所有Reply 必须符合小冰既有的风格

~~（我发现我连做人都不如小冰 ????）~~

Architecture

直男届的杀手-『小冰』架构解析

好我们进入这篇文章要探讨的重头

从上图我们可以看出 XiaoIce的架构大致上分为三层用户交互层 对话Engine层 数据层

其中用户交互层主要是获取用户数据主要分为 回合制(Message) 即使制(Full Duplex)

他们收集到的都是一个个Pair对 <Context, Reply> 这些Pair对会喂到后面的Conversation Engine里面进行处理

同时也会备份到Data层

Data层就是持久化单独而言没有特殊的东西

但从Data层中我们其实也能看出一些 XiaoIce用的技术

比如说Profile 是小冰通过用户对话History等资料解构出相应的画像

Paired 就是刚才从User中传入的数据而Unpaired 则是通过一些文本信息新闻、讲座等 Data用于提高生产的对话覆盖范围

Topic是主题管理索引接下来会详细分析 Knowledge Graph是用户Unpaired Data的检索使用

Conversation Engine 部分是XiaoIce Chatbot的核心部分

直男届的杀手-『小冰』架构解析

一个 Message/Full Duplex 过来先转化为Text 或者 Image

若为Text则进行Empathetic同情度计算然后把输出给到Core Chat 由Core Chat 决定分配给General Chat 还是 Domain Chat

然后调用相应的Skill模块检索出 400个候选集最后经过Rank 选取最符合风格最人性化的Reply 这样一轮对话就结束了

然后根据Topic Manager 进行判断 要不要切换主题, 切换到什么样的主题 当然主题候选集的构建也是其工作之一

如果是一个Image进来则对抽取图像的信息并做评价

详细来说

`Dialogue Manager`

对话管理器除了 记录历史对话 还包含 对话策略 管理

对话策略管理即管理Skill的终端什么时候触发skill 什么时候切换Skill等等

同时 Conversation还受到Topic 的管理

在Pre-Train阶段先对Instagram 和 Douban上的数据得到一个Topic Index

当触发一些 Topic切换的标志的时候，比如说:

Core Chat 未能生成有效的候选集
生成的响应只是用户输入的重复
用户输入变得平淡, “OK”, “I see”, “Go on”

这时候就会调用Topic 切换，切换之后的Topic根据以下几个指标选取:

上下文关联性
新鲜度
个人兴趣
热度
接受度

`Empathetic Computing`

同情度计算算是小冰Chatbot 相对独特的一点

它不是直接把Context 和 Reply进行匹配得到一个Match Score值

而是由Query, Context, Reply 及情景分析得到一个 $s=(Q_c, C, e_Q, e_R)$ 向量

再由这个向量根据Core Chat得到所要选的值

`Contextual Query Understanding`

CQU这一步主要做的是句子补全的工作

首先拿到 Context 之后做了一个 命名实体标识

把所有代词用 实体 替换, 如果句子不完整也补全

比如说 I hate it. 在上下文中 it 指的是tomato就转变为I hate tomato.

直男届的杀手-『小冰』架构解析

`User Understand`

根据Context 对用户的目的, 情感, 主题, 观点, 用户画像 进行分类

得到一个带有用户情绪的empathy vector $e_Q$

直男届的杀手-『小冰』架构解析

比如说这里的 目的 是 Request, 主题 是music

`Interpersonal response generation`

看名字可能不要好理解刚才我们生成的是带有user empathy的vector $e_Q$

现在我们要生成的是带有回答者也就是 XiaoIce的Empathy的vector $e_R$

构造方式同 $e_Q$ 只不过这里的属性值是PM讨论出来写死的

直男届的杀手-『小冰』架构解析

`Core Chat`

构造好带有用户和小冰情绪的vector $s$ 之后就到了最关键的语言生成环节 Core Chat

XiaoIce 在处理这个问题的时候用了两阶段法

先通过某种方式构造一个Reply候选集 然后根据某种方式计算得每个Reply的Score 从中选出最优的

看到这里我想大家以前跑SMN 跑 DAM 跑检索式对话模型 的疑问就消失了吧

以前一直在想检索式对话检索式对话为啥还会有候选集什么样的条件下会有这个候选集 ????

终于一切都 顺理成章了 ????

在构造候选集的过程中用到了三种方式

直男届的杀手-『小冰』架构解析

`Retrieval-based using Paired Data`

数据来源于小冰从2014年以来超过300亿轮的用户数据根据每个 $s=(Q_c, C, e_Q, e_R)$ 向量-Reply 构造Index

真正使用过程中由 $Q_c$ 利用Lucene 进行查找取前400个作为候选集

目前来看小冰超过 70% 的回答来自于之前用户的对话当中

`Neural Generate`

当然单纯靠检索来获得数据会漏掉一些最近的热点覆盖面不会太高

这个时候就会用生成式对话

目前一般使用Seq2Seq

在小冰的架构中先对前面构造的s向量做一个SIGMOD操作 $v=\sigma(W^T_Qe_Q+W^T_Re_R)$ 每一轮都喂到Neural中

这样保证了生成的Response 带有XiaoIce的'人'格

`Retrieval-based using unPaired Data`

为了提高小冰的 IQ ~~(好碾压我们)~~

除了上面的一些基本操作之外还从讲座、新闻等unPaired的Text中抽取一些候选集

但因为不是 Paired的在构造的时候为了可扩展性

除了 $Q_c$ 之外还利用Knowledge Graph 搜取相近的Topic 一起喂入

然后一样的构造 索引 一样的用Lucene得到内容

`Rank`

这其实就是多轮检索式对话的内容了

当然最简单的想法就是算算TF-IDF 但这样对于长句而言效果不会很好

就有DSSM(那个微软发的开山之作) 基于交互式的SMN DAM 甚至Bert

当然这里进行Rank的时候还必须考虑到XiaoIce的人设

这打分扎心了 直男 永远只能得0分 ????

直男届的杀手-『小冰』架构解析

Skills

当然除了最基本的Conversation之外 XiaoIce 还有很多技能

比如说你可以发图片给他

Image的回复是通过 Image-Comment 数据集训练出来的

把Facebook Weibo这种社交网络中的图片及其评论数据爬取下来通过CNN进行抽象获取一个Image的vector

然后根据这个vector 和 CNN进行索引

同样利用两阶段法先构造候选集再进行Rank

直男届的杀手-『小冰』架构解析

还能识别食物的卡路里我还特意试验了一次惊了

直男届的杀手-『小冰』架构解析

除了这些之外小冰还会创作基本套路和前面的基本一致

直男届的杀手-『小冰』架构解析

所以惭愧的我低下了头摊手????

以后有人问你工资卡给她管的时候别再说你要留后路了

Reference

. The Design and Implementation of XiaoIce, an Empathetic Social Chatbot. [Li Zhou et al. 18.12]