哈工大人工智能暑期课程实践——控制智能家居
一、项目要求
在微软讲师提供的实例程序之上,增加新的场景
典型场景:
可以通过语音下达指令。
支持自然语言的多轮对话,如“打开卧室的灯。厨房的也打开。”
通过个性化的语音(如学生自己的语音)进行反馈。
微软讲师提供:语音控制开关灯的示例程序
给学生的建议:
通过微软认知服务语音转文本、语言理解来识别声音输入。
可以尝试通过识别特定的词汇来判断是否是后几轮对话,并复用之前识别出的上下文。
通过微软认知服务文本到语音转换来实现个性化语言输出。
二、计划
采用微软认知服务——语音API,将语音转化为文本。再调用语言理解服务获取用户意图,从而下达命令,控制智能家居,并反馈语音信息。
理解语言时,训练了所有家居的组合情景,生成了对应的意图;另外,对于省略的指令对象的语句,根据上文补充出设备名称和状态(关闭or运行),从而匹配上对应意图。这是一种简单而有效的实现方式。
反馈语音信息时采用了语音合成器,在获取意图成功,并下达指令后,简单回复确认信息。
三、小组成员和源代码仓库
源代码仓库——https://github.com/pc-phoenix/LightControl.git
https://github.com/lzx0724/LightControl.git
本地运行须clone 下来的文件是“packages” “LightControl” “LightControl.sln”。
代码签入的问题:组员fork下源仓库后在各自的branch上签入代码,完成前只上传了“Form1.cs”和“Form1.Designer.cs",最后才将完整的项目文件上传。因为之前没有掌握Github的使用方法,且项目合作经验较少,所以对代码的上传,管理很混乱。例如,前后上传的“Form1.cs”合并更新时有问题,出现一些乱码。项目文件无法整体上传,尝试使用VisualStudio上的Github Extension For Visual Studio插件上传时失败,后来只能用GitBash 分部分上传,所以clone下来的项目还需在本地简单处理(添加引用等)才能运行。
小组成员
李忠旭 1160300815 score:23
彭程 1140310320 score:22
徐琪敏 1163710232 score:21
张博雯 1160300209 score:19
张明哲 1163710106 score:18
牛庆立 1163710210 score:17