想让机器人“听懂人话”,需要必备哪些技能?【AI大咖说】第八期,走进优必选自然语言处理技术!
“我们把香蕉给猴子,因为它们饿了。”
“我们把香蕉给猴子,因为它们熟透了。”
这两句话,你读得懂是什么意思吗?然而对机器人来说,就没那么简单了。如果AI不能清晰了解猴子和香蕉的属性,就会导致无法区分。正如语音识别帮助机器人“听”,视觉技术帮助机器人“看”,想要做到机器人“听懂人话”,就需要自然语言处理(Natural Language Processing,NLP)来解决。一起来看看机器人是如何“善解人意”的:
AI因斯坦·琨带你走进机器人的NLP运用▲
机器人语音交互技术概述
语音交互是机器人最重要的交互入口之一,机器人对于人类语义的理解尤为关键。如下图所示,人类语音通过ASR(语音识别)把音频变成文本,文本经过NLU(语义理解)、DM(对话管理)以及NLG(语言生成),语言生成后再通过TTS(语音合成),完成人机对话。
NLP概述与发展
自然语言是人类智慧的结晶,机器人对语义的理解和分析能力、对自然语言的生成能力、对知识的学习能力,是AI最核心且最具挑战的技术之一。我们先来看一下NLP发展的几个阶段:
· 第一阶段:2000年之前,主要基于规则和概率统计的方法,50年代提出图灵测试概念来判断机器是否会思考,然而到目前为止,还没有出现被一致认可的通过图灵测试的对话系统。
· 第二阶段:2013年,神经网络兴起,极大提升NLP的各项能力。
· 第三阶段:基于seq2seq模型的NLP和注意力机制,文本生成和机器翻译方面获得较大进展。
· 第四阶段:2018年以来,大型预训练模型发展,NLP领域突破捷报频频,也就是现在所处的阶段。
NLP技术则分为核心应用和基础技术。它的应用非常广泛,包括情感、信息、问答、机器翻译、自动文摘、阅读理解以及文本分类等。
自然语言处理技术的核心应用
基础技术包括自动分词、词性标注、命名实体识别以及句法分析。
· 自动分词
中文分词是自然语言处理领域基础的模块,由此前的基于规则和基于概率统计,发展到今天的基于深度学习。比如“武汉市长|江大桥”还是“武汉市|长江大桥”的划分,就是通过统计模型把词分配好。
悟空机器人分词断句后,理解并执行任务
· 词性标注
在中文分词之后,预测每个词的汉语词性也是中文自然语言处理的基础模块。通常词性标注的粒度很细,如动词、副动词、趋向动词、不及物动词等。
词性分析决定句子用哪一个“de”
· 命名实体识别
识别文本中具有特定意义的实体,包括人名、地名、机构名、专有名词等,以及时间、数量、货币、比例数值等文字。
命名实体识别是一个从句中挑出实体类型的过程
· 句法分析
用于确定句子的语法结构或词汇之间的依存关系(主谓宾、定状补等句法关系),包括句法结构分析、依存关系分析。
2025-02-14 13:50
2025-02-14 13:48
2025-02-14 13:47
2025-02-13 13:49
2025-02-13 13:48
2025-02-13 13:46
2025-02-12 11:00
2025-02-12 10:55
2025-02-11 10:33
2025-02-11 10:32