介绍
这里介绍一个简单的交互式人工智能机器人对话。之前大家可能看过我的文章,是一款qq机器人(可点击传送机器人专栏)项目介绍,那个也许做起来稍微麻烦,我也有用b站一行一行代码教过。那么难的可能大家接受比较难,我们来一个超简单的操作!
无脑模块安装
个人版本:3.9.6
pip install pyttsx3
pip install requests
复制
第一步交互式对话
首先我从网上爬取了一个图灵机器人api,然后以爬虫做了一个交互式对话。 代码如下:
# coding=gbk
"""
作者:川川
时间:2021/8/21
"""
import requests
print('请输入你想说的:')
while True:
a=input()
url='https://api.ownthink.com/bot?appid=9ffcb5785ad9617bf4e64178ac64f7b1&spoken=%s'%a
te=requests.get(url).json()
data=te['data']['info']['text']
print(data)
复制
运行后我测试了以下,还是很懂事的机器人:
在这里插入图片描述
第二步让机器人说话
此时我们用到了文字转为语音的模块,代码变为如下。
# coding=gbk
"""
作者:川川
时间:2021/8/21
"""
import requests
import pyttsx3
print('请输入你想说的:')
while True:
a=input()
url='https://api.ownthink.com/bot?appid=9ffcb5785ad9617bf4e64178ac64f7b1&spoken=%s'%a
te=requests.get(url).json()
data=te['data']['info']['text']
print(data)
ini= pyttsx3.init()
shuo=ini.say(data)
ini.runAndWait()
复制
演示视频如下:
博客机器人对话演示
总结
虽然现在已经完成了人工智能机器人对话,但是我想要机器人用萝莉音跟我说啊!!!暂时先留下此问题,有空研究,忙着备数学建模。如果此文对你有帮助,你的三连是对我的莫大支持,谢谢!
1.智能客服机器人三大核心算法模型
智能客服机器人用于解决重复性客服问题,降低客服人员工作量和劳动强度,并且能够通过与客户的交互式多轮对话自动积累客服知识。
智能客服机器人主要涉及三个部分的关键技术:
(1)语音识别技术,类似于人类耳朵的功能,将声音转化为文本,并且普通话、非标普通话、部分方言均需准确识别;
(2)语义理解技术(自然语言处理),类似于人类大脑,对文本、语音等进行自然语义理解拥有记忆、识别、理解、推理等能力,支持多轮对话、拟人回答等;
(3)语音合成技术,类似于人类嘴巴,将文本转化为语音,支持自然、韵律、流畅的语音合成,以及个性化语音合成。
2.语音识别技术
语音识别分训练和解码两阶段。训练,即通过大量标注的语音数据训练声学模型,包括GMM-HMM、DNN-HMM和RNN+CTC等;解码,即通过声学模型和语言模型将训练集外的语音数据识别成文字。目前常用的开源工具有HTK ,Kaldi ASR以及基于(-to-text-)实现端到端系统。
3.语义理解技术
在智能客服机器人构建中最为重要的就是建立知识库,实现客户语义的理解并且能够调用知识库的知识解决客户关心的问题,而知识库是支持对话模型的运行的核心部分,如图所示。
4.语音合成技术
语音识别和语音合成技术是实现人机语音通信,建立一个有听和讲能力的口语系统所必需的两项关键技术。使电脑具有类似于人一样的说话和听懂人说话的能力。语言合成或者让计算机说话包含着二个方面的可能性:一是机器能再生一个预先存入的语音信号,类似于普通的录音机一样,不同之处只是采用了数字存储技术。
然而如果预先存入足够的语音单元,在合成时采用恰当的技术手段挑选出所需的语音单元拼接起来,也有可能生成高自然度的语句,这就是波形拼接的语音合成方法。
另一种可能是采用数字信号处理的方法,将人类发声过程看作是一个模拟声门状态的源,去激励一个表征声道谐振特性的时变数字滤波器,这个源可能是周期脉冲序列,它代表浊音情况下的声带振动,或者是随机噪声序列,代表不出声的清音、调整滤波器的参数等效于改变口腔及声道形状,达到控制发不同音的目的,而调整激励源脉冲序列的周期或强度,将改变合成语音的音调、重音等。
5.智能服务机器人的评价指标
(1)问题识别率:行业中普遍应用的衡量指标
问题识别率是业内主流客服机器人服务提供商或企业的工作逻辑,它指的是机器人能识别出客户的问题数与所有问题数的比例。简单理解,智能机器人的后台逻辑是通过算法把客户的问题、知识标准问法和知识标准答案三者对应匹配关联,从而实现机器人的自动应答,在这个过程中,从客户的千奇百怪的问题或者问法,机器人可以分析语义并寻找到知识标准答案,就算是问题识别对了,也就是给问题识别率加了一分。
(2)拨测准确率:更笨但更真实的问题识别率
拨测准确率采用的是一种实验的方法,即用一定的公司内部业务管理人员的人力,采取模拟客户问题的方法和机器人实际开展对话,记录结果的正确与否,人工判断机器人回答准确的数量占到总问题数的比例。
这个指标的好处在于,是人脑判断的对错,也是模拟客户的角度去看待对错,所以在样本量越大的情况下,我们认为这个指标越真实。以我们的实践来看,拨测准确率的数据比问题识别率要低3-4个点,即在90%左右的水平。而这个指标也有它的缺陷,首先要耗费大量的人力去做这个事情,其次因为是业务人员去拨测的,因为非常熟悉业务的情况,所以不能完全真实的模拟客户看到答案的感知,是否准确,是否看的懂,都存在一定的偏差。
(3)答案满意度:迅速提升回答效果的基础
客户是智能机器人的最终使用者,所以只有真实的客户是否认同机器人的回答才是更真实的数据情况,普遍意义上可以有两种典型的调研方式:
1、在机器人每回答一个问题的结束都设置一个评价小尾巴,客户对逐条问题都可以选择评价,并评价是否满意这条回答。这样做的好处是,通过大量的数据积累,可快速定位评分相对低的答案,然后回炉进行优化,以此往复,不断提升;比如支付宝就是采用这种方式;
2、在整体机器人服务完成后弹出窗口进行调研,调研客户对整通机器人服务的完整感知,是否满意;这样的好处是没有那么频繁的骚扰客户,且评价具有整体性,但是对于具体的提升帮助不够明显。
客户对机器人评分结果,都是对机器人的理解能力、答案调用速度、答案客户化程度等能力的真实评价,这个指标是监控机器人能力又一重点指标,这个指标在应用上一定要注意UIUE的设计,尽量少的骚扰到客户,所以建议不是常态化的用,最好在服务启动的初期和关键点去应用。行业内一般认为在75%的水平就是合理情况,其实应该有更高的要求。
(4)服务满足率:用脚投票的真实记录
在线客服的行业的排列模式普遍是“智能机器人 在线人工服务”,机器人在前端解决大部分简单、重复的问题,在机器人回答后则开放引导人工的入口,当客户不满意机器人的答案或者有更高的要求的时候,客户可以有两种选择:
第一,通过人工入口,点击进入人工服务;
第二,受不了了直接退出拨打同企业的人工服务热线。
“服务满足率”这个指标就是通过客户轨迹监控,客户在进入机器人服务以后,在一定时间内没有点击进入人工在线服务,且没有拨打人工热线服务的比例是多大。这个指标清晰直观的可以看到客户用脚投票的情况,也可以辅助的反映机器人的解答客户问题能力。使用机器人最终是为了替代人力劳动,降低人工成本,因此监控客户在机器人上完整解决问题的比例,对于智能机器人客服而言,意义很重大。在业内,基本上没有相关可以参考的行业平均值,我们的情况在85%左右。
(5)调研满意度:有丰富内涵的常规方法
设计一个调研问卷,用外呼的方式,针对近期接受过机器人服务的客户开展调研,这个方法很常规,这里就不赘述。在一定样本量的基础上,这个数据应该最大概率的贴近客户的真实感知,并且通过设计问卷的细项,我们可以找到具体的客户认为机器人不满的点在哪里,同时加以提升和修正。行业不同,调研的内容不同,这个数据的平均参考值也不同,但一般而言,85%会是一个较为合理的衡量标准。
20XX年的某一天,你坐进了一家温暖的小餐馆,当你在座位上完成了扫码点餐以后,收到指令的很快就端着你的食物过来了。饥肠辘辘的你很快注意到了你的热汤,与此同时,你也注意到有两个优势:1、震动频率小,端热汤热菜都不受影响,没有造成餐盘抖动、食物外溢的情况;2、无须架设专门的轨道,行动灵活。
(图片来自“摄图网”)
当顾客完成了扫码点餐以后,点餐的桌子上会自动生成一个定位点,这个定位点会自动发送信息给,收到指令以后,会根据这个定位点的位置配送食物。那么是怎么做到这一切的呢?本质上来说,是轮式机器人。那么它既然也是“人”,它也有“眼睛”、“大脑”、“耳朵”、“脚”……它的“眼睛”由两部分构成,一部分是“G4激光雷达”,另一部分是“照相机双目视觉”,根据两种完全不同的接受外界信息的渠道,综合判断外界情况。它将根据它通过它“眼睛”对周围环境进行扫描,之后再把扫描到的内容传输给它的“大脑”,然后在“大脑”里构建一个和真实环境一致的地图,这就是目前最主流的导航技术是SLAM( and ),中文意思是“即时定位与地图构建”,最后“大脑”的其他部分,负责对机器人位置进行定位,并给它规划一条正确的路径,最终引导机器人安全到达定位点(客人点餐的餐桌)。
(图片来自“摄图网”)
那么碰到客人临时变更餐桌,或者被客人的宠物小狗追逐?抑或是其他意外情况?该如何处理应急情况呢?除此之外,还可以听从人类服务员的安排工作,即按照特定的语音指令进行工作。它的“耳朵”通常是用“微音器”或录音机来做的。用压电材料做成的“耳朵”之所以能够听到声音,其原因就是压电材料在受到拉力或者压力作用的时候能产生电压,这种电压能使电路发生变化。这种特性就叫做压电效应。当它在声波的作用下不断被拉伸或压缩的时候,就产生了随声音信号变化而变化的电流,这种电流经过放大器放大后送入电子计算机(相当于人大脑的听区)进行处理,机器人就能听到声音了。
(图片来自“百度”)
的“脚”也就是它的轮式底盘,这采用先进的动力悬挂装置,有着优异的地面适应性能和最小的转弯半径。可以良好适应道路不平、道路狭窄等情况。
另外,具备自主充电的能力,当电源在耗尽之前,它会自己回到充电桩上,无须人工干预。
(图片来自“摄图网”)
机器人在餐饮业应用的前景十分美好。杭州中科先进技术研究院的物联网中心主任周江涛这样介绍:“目前,可以极大地减轻了人类服务员们的工作强度和压力,是人类服务员的好助手。未来,年轻人可能不再愿意做传菜这种简单劳动,不少饭店都可能出现不同程度的招工困难;其次,人类服务员无法避免上错菜的尴尬情况,机器人能够提高上菜速度与正确率。减少顾客的等待时间。”周江涛又解释道,“我们计划推出.0之后,还会继续升级推出.0、3.0……目前的机器服务员主要的问题是缺乏人类的那种交流情感,我们希望研发出能跟人类交流、能够表达复杂情感的机器人,在等餐过程中的顾客们甚至可以观看机器人表演的舞蹈。我个人认为,未来五十年内都是机器人发展的高速期,人类会不断挖掘机器人的作用。”