导语:本期硬创公开课,雷锋网邀请了若联科技(robsense)创始人ceo金洁来为大家讲解行业无人机市场以及对应飞控的发展方向。近年来,民用无人机市场异常火爆。其中消费类无人机在过去的2016年得到了长足的发展,各家厂商纷纷发布各种尺寸和功能的无人机,而人

导语:“懂你”的客服机器人距离我们还有多远?雷锋网「新智造」按:几年之间,苹果、微软、google、百度、阿里等巨头都推出了以聊天为形式的机器人,应用在情感陪护、虚拟助理、客服、售后等场景中,同时也有诸多初创公司、投资机构杀入这一行业。但在实际使用中,用户经常发现,机器人并没有想象中那么智能,它能识别文字和语音,但却“不懂你”。这其中的关键便涉及到自然语言处理中的”深度语义技术“。

针对这个问题,本期雷锋网硬创公开课邀请到小i机器人创新中心的研究院陈培华为大家具体讲解,在客服机器人领域的深度语义技术和应用探索。陈培华,毕业于上海交通大学,工学博士,目前主要负责基于机器学习、深度学习的自然语言处理技术及其应用,参与“小i中文语义开放平台”以及贵阳人工智能大数据云平台建设,已申请相关发明专利2项。

公开课完整视频:

以下内容整理自陈培华在雷锋网硬创公开课的分享,文中略有删减,完整内容可观看上方视频。关注雷锋网(公众号:雷锋网)旗下公众号「新智造」,回复「ppt」可获取嘉宾完整ppt。

语义技术在人工智能中的应用

这个图片展示的是一个典型的人工智能对话引擎,输入的是用户的问题,引擎内部通过长期积累的知识,首先经过自然语言分析,在通过语义理解、上下文分析进行知识推理,从而生成个性化的答案,输出给用户。这里展示的就是对话引擎中的知识库和语义库。在客服机器人的知识库中,分为专业知识库和语言知识库,下面的部分是语义库中的三个模块,包括词类识别、语义表达和语言模型。我们在发展的过程中,积累了一个庞大的语言知识库,比如在“余额查询”这个查询中,就有250种表达方式。此外,在上述基础上,小i搭建了一些辅助系统,比如上图的人机协作学习体系。首先通过大数据平台,挖掘知识中的语义、实体、事实和场景信息;其次通过运营人员维护内容、审核机器挖掘的结果;最后由特定领域专家定义知识结构和运营规则。通过辅助系统,就能让对话引擎在中提升自身的能力。

深度语义技术平台

上图显示的是小i中文语义开放平台,分为三层:

基础层:为系统提供分布式储存和计算环境

功能层:提供核心的自然语言处理算法和模块

接口层:提供外部调用接

下面主要介绍功能层所包含的模块:

中文分词与词性标注

中文分词是中文自然语言处理的一个基础环节,分词的结果可以被广泛的应用于文本处理、信息提取、搜索引擎、机器翻译等方面。通过采用基于统计+规则的方法对标注语料进行训练学习,将所得到的模型应用于中文分词和词性标注中,能够支持歧义切分处理、中文词性自动标注、未登录词识别、多编码支持能力以及丰富的知识词典。

命名实体的识别

命名实体识别指的是识别文本中具有特定意义的实体,主要包括人名、地名、机构名等专有名词。命名实体识别是信息抽取技术中的重要组成部分,可以应用在自动问答、机器翻译、信息检索等自然语言处理领域,有助于提高相关的性能。语义联系用于对词语进行同义词查询检索,通过全网数据挖掘出海量同义词,并持续对数据、模型等进行迭代更新,保证同义词的效果始终与时俱进。日常生活中,用户在使用搜索引擎、智能问答时,可能会出现输入错误的情况,比如说同音别字、近音别字、形近别字、拼音等,这样搜索引擎和智能问答可能就无法正确识别,导致用户无法获取需要的信息。

自动摘要和关键词提取

关键词提取的主要功能是,从文本中提炼关键词,形成主题分析,方便用户快速了解文章主题。自动文摘技术可以分为摘要、摘录两类,摘。

  • 品牌简介
  • 品牌文化
  • 发展历程
  • 关联品牌
  • 伊派新品
  • 进口瓷砖THG
  • 伊派瓷砖
  • 实景案例
  • 招商加盟
  • 诚聘英才
  • 联系方式

导语:本期硬创公开课,雷锋网邀请到极飞地理负责人游春成,为大家带来“农业植保的精准导航——基于rtk技术的地理信息采集”的主题分享。雷锋网(公众号:雷锋网)新智造按:植保作业中,我们经常会遇到掉高升高或者飞不直的现象,不

导语:目前市面上选用的无人零售技术方案都有哪些,各自的优劣点在哪里?雷锋网新智造按:2016年12月,亚马逊在西雅图开张了一家革命性的线下便利店——amazongo。amazongo彻底抛弃了传统超市的收银结账过程,顾客们不再需要提着