· 开放式闲聊
闲聊分为匹配式闲聊与生成式闲聊。匹配式闲聊具有Q&A库,Q&A库如果足够大,能达到较好的闲聊效果;生成式闲聊不需要匹配,将根据问题生成答案。
两项闲聊技术各有优缺点,匹配式闲聊是可控的,通过语料编撰、增加、删除等方式,可以在语料库建立时把敏感词删除。生成式闲聊的对话有一定的不可控性,比如语料不干净,就会生成不太健康的内容,同时还会存在语义、语法等问题。
闲聊技术流程图
闲聊技术可以说是NLP永恒的难题,算法求的是概率,往往缺乏现实的逻辑推理,而机器不知冷暖,单凭文字无法捕获丰富的情感,这时候就需要借助视觉、语音识别、声纹信息等技术进行判断。
· 文本生成
优必选科技的NLP算法不止赋予机器人与人对话的能力,还赋予机器人的写作能力,吟诗作赋、舞文弄墨不在话下。看看输入“我是只小猪欢乐多”,生成的古诗结果竟然还押韵,这是怎么做到的?
通过采用GPT模型,首先定义格式(五言绝句、七言绝句、词牌等),用分隔符分开,把带上标点符号的诗词给到模型,通过语言模型训练后,就具备生成能力。生成后进行预处理,并定义诗词的类型,把诗词的内容拼接起来,把文本向量化输入到GPT里,一个字、一个字地生成答案。
2025-02-14 13:50
2025-02-14 13:48
2025-02-14 13:47
2025-02-13 13:49
2025-02-13 13:48
2025-02-13 13:46
2025-02-12 11:00
2025-02-12 10:55
2025-02-11 10:33
2025-02-11 10:32