(腾讯智能产品副总裁、腾讯教育副总裁李学朝)
“AI助手不仅要提供更加智能的交互体验,还需要通过自学习和自适应等来提升对于行业、应用和用户的理解能力、应变能力和表达能力。”李学朝表示,为赋予AI助手交互智能的能力,腾讯云小微整合了语音交互、自然语言理解、图像识别等AI能力,融合AI Lab前沿AI技术以及搜狗数字人团队丰富的业务模式,打造了基于新一代多模态人机交互技术的全新数智人产品矩阵,实现了从“数字人”到“数智人”的智能化升级。
谈及数智人的技术优势时,李学朝介绍道,在NLP、知识图谱、视觉等全栈AI底层能力的加持下,数智人拥有强大的形象表现力、识别力和感知理解能力,能在不同行业的多种业务场景下做到“听得清、听得懂、会表达”;而3D超写实、3D写实、3D半写实、2D真人、2D卡通五种数智人的风格,搭配可定制形象和腾讯海量IP形象授权,能让数智人拥有丰富多样的人物形象,以满足不同场景下的服务需求。
(五款数智人亮相)
“云小微数智人应用服务的两大场景,分别是企业服务和生活服务。”李学朝表示,目前数智人已经为金融、文教传媒、公共服务等行业的体验型业务场景提供解决方案,以坐席客服、审核面签、理财顾问等形象为用户提供智能交互的新体验,帮助企业在提升服务体验的同时实现降本增效的目的。
以金融行业为例,腾讯云小微数智人助力平安普惠打造了首个金融行业数字员工——平安普惠金融AI数字员工,两年间已经为500万个用户提供7x24小时的自然可视化的人机智能交互服务,在提升用户服务体验的同时,将审核成本降低60%。
“我们希望的是,通过数智人,在生活服务中为用户带来更多陪伴、更多信息交互以及更深的情感链接。”李学朝表示,未来,腾讯云小微数智人希望能够突破时间和空间的限制,打破虚拟和现实的边界,在数字化进程中为各行各业提供有温度的智能交互服务,助力各行各业的智慧化转型。
以下为演讲实录:
尊敬的各位嘉宾、媒体朋友和线上的观众朋友们:
大家好,我是腾讯李学朝,很高兴能在腾讯一年一度的数字生态大会中与大家进行交流。
今天主要跟大家分享的是,腾讯云小微数智人的全新产品,并且从技术到服务,从内到外,从现在到未来,讲一讲我们“开启有温度的数智未来“的愿景是怎样展开的。
随着人工智能、大数据、物联网等技术高速发展,各行业数字化进程加快,不同业务场景对线上用户服务都提出了更高的要求,AI助手除了要提供更加智能的交互体验,还需要通过自学习自适应等来提升对于行业、应用和用户的理解能力、应变能力和表达能力。人机交互模式从文本客服升级为语音客服再到多模态人机交互系统,也就是大家常说的数字人,沟通效率和服务温度都得到了大幅提升。
而腾讯云小微通过整合语音交互、自然语言理解、图像识别等AI能力,同时连接腾讯丰富的内容和服务生态,面向使用场景打磨平台能力,助力行业客户打造有智能、有形象、可交互的数字分身,实现了从“数字人”到“数智人”的智能化升级,也就是腾讯云小微与AI Lab联合开发的新一代多模态人机交互系统——数智人。
最近搜狗正式并入腾讯,也为数智人能力提供了助力。数智人产品深度联动了云小微、AI Lab、搜狗,汇聚云小微综合AI能力,融合AI Lab前沿AI技术,以及搜狗数字人团队丰富的业务模式、作为多模态能力的服务载体,便捷地服务于机构、企业,持续赋能行业。
这些能力从内而外赋予了产品极大的优势。
首先,通过AI技术的加持,数智人产品目前已拥有强大的形象表现力、识别力和理解能力,并且能够保证最优服务性能,在很多场景中都能做到“听得清、听得懂、会表达”。
听得清就是能够把人的声音精准转化成文本。腾讯云小微在语音识别方面深耕建模、降噪、口音与领域适应等技术能力,让数智人能够适应各种复杂的噪声环境。同时,可识别超过34种语种、方言,拥有超过46万的垂直场景热词库。
听清后还需要听得懂。腾讯云小微数智人结合知识图谱能力和垂直领域库,并充分运用全双工的能力,通过语音(ASR)+语义(NLP)双向判断,降低错误响应概率,可进行超过11个语种的机器翻译;同时,通过流式语义+语义VAD,在商用环境中,服务端推流渲染方案文本驱动首帧延迟已降低至600ms内,单台服务器并发上限,半年内提升了60%,在保障交互体验的同时,大幅提升了接待的效率。
在表达交流能力上,腾讯云小微数智人由个性化沉浸式TTS、有风格的语音合成技术、以及具备形象、情绪和动作的虚拟人合成,拥有超过28种语音合成音色,超过30个拟人化形象,在技术内测中实现了根据语义匹配肢体动作,把对话内容多模态多层次地表达出来。
此外,为了让数智人有个性、有情感、更真实生动,我们提供了3D超写实、3D写实、3D半写实、2D真人、2D卡通等5类数智人形象风格,拥有超细微面部情感表情以及数百种肢体动作,可以满足各类场景需求。同时,拥有腾讯的海量IP形象授权,让数智人的形象选择更加丰富多样。
每一位数智人都拥有着不同的形象和性格,可从事不同的职业,并且,每一位都身怀绝技,与众不同。这两天,他们也参与到了数字生态大会多个专场的主持工作中,为所有与会观众带来了他们的“职业首秀”。
云小微数智人一直在通过不断的自学习、自适应,以求为用户提供更主动、更专业的服务。目前,他们已经以不同的形象出现在金融、传媒、文旅、出行等多个行业中,践行着我们服务于人的理念。接下来让我们看看,云小微数智人的落地应用情况。
云小微数智人应用服务的两大场景,分别是企业服务和生活服务。
在企业服务方面,以往一直是以企业和服务提供者为中心,现在我们转变为以消费者和使用者为中心,通过人机交互与协创,提升服务体验的同时实现降本增效。在生活服务方面,数智人以用户体验提升为中心,通过实现“软硬结合”,给用户提供智能交互的新体验。
在企业服务场景中,数智人已优先面向金融、文教传媒、公共服务等行业的体验型业务场景提供解决方案,可担任坐席客服、审核面签、理财顾问、资讯播报、会展主持、导游导览等多种角色。
接下来大家可以通过几个案例进行更深入的了解:
在金融领域,我们助力平安普惠落地了首个金融行业数字员工——平安普惠金融AI数字员工,针对企业面临的人工成本攀升、人力缺乏、员工工作时间无法保障全时段服务等痛点,通过自然可视化的人机智能交互,打造金融数智人分身。目前已累计服务用户500万,审核成本降低60%,保障了2年间7x24h的在线服务,极大提升了用户服务体验。
在疫情期间,观众无法亲临展厅和现场,近距离参与各项活动,给很多展会活动的举办带来了困难。我们为中国(深圳)国际文化产业博览交易会打造了线上虚拟讲解员,拥有讲解服务能力、多种情绪表达能力,能够对展厅、展馆的相关问题对答如流,并配合场景作出生动的情绪动作反馈,让用户在疫情期间,突破空间限制,享受互动性极强的在线讲解游览体验。
在新闻播报领域,我们与新华社合作推出了全球首个AI合成主播。依托少量音视频数据即可快速、低成本生成主播形象,输入文本即可AI合成播报实时音视频流,主播的表情、唇动自然且专业,基本与真人无异。到目前为止AI合成主播已经累计播报新闻超过1万条,保证播报零误差,可实现对日常和突发事件的实时响应。
可以说,数智人具备降本、增效、提升服务体验、增强服务灵活性等优势,比如数字坐席不但可提供7*24小时全时段、大体量服务,成本也仅为真人坐席的1/5,可真正做到多维度提升企业服务能力。随着数智人技术的不断迭代升级,我们相信科技创新的力量也将为企业服务创造更大的价值和可能。
在生活服务场景,腾讯云小微数智人也有着很大的应用空间。数智人以交互智能增强人机互动,在智能车载、智能交通、智能家居、智能硬件等智能服务场景,为用户提供更便捷、智能的服务。
我们的核心思路是:让数智人与智能设备结合,打造以用户为中心的生活服务。
一方面,数智人可以助力提升公众服务效率。比如,数智人可及时、高效地处理用户在公共交通场景中的票务等问题,可代替人力进行政策问答,提升政策办事问答效率。同时,凭借语音交互能力优势,加强对中老年人等群体的服务关怀。
另一方面,数智人可凭借全新的视觉表达,为用户提供自然、丰富的智能交互服务。比如在智能家居中,用户通过语音指令即可随时随地与数智人交流;个性化的形象表现和动作表达能力,也能打造出更优的虚拟偶像服务。未来,数智人技术将重点向融合文字、听觉、视觉、触觉、肢体动作等多维度感知的多模态交互方式演进。
我们希望的是,通过数智人,在生活服务中为用户带来更多陪伴、更多信息交互以及更深的情感链接。首先,全天陪伴可随时呼唤,提升交互效率;其次,有问题直接问,让中老年人也可简单方便地使用,打破数字化中的科技鸿沟,高度还原人与人之间的交流,打造有温度的交流体验,拉近个人与技术的距离。
同时,数智人支持个性化自定义设置,让企业和用户都可打造属于自己独一无二的数智人。
前面说的都是我们的过去,我们过往的成就,接下来让我们说一说未来。未来,我们的数智人会向什么方向发展,又将为社会创造哪些价值呢?
正如我今天分享的主题“沟通有温度,服务新高度”,未来,腾讯云小微数智人希望能够突破时间和空间的限制,打破虚拟和现实的边界,在数字化进程中,为各行各业提供有温度的智能交互服务。
我们将不断提升平台能力,输出更优质的AI应用解决方案,与更多行业实现场景共建,以定制化的服务,助力各行各业的智慧化转型。同时,在不断进行科技创新、产品创新、模式创新的过程中,更好地服务社会,服务于人,为社会创造更大的价值,从而全面开启全新的有温度的数智未来!谢谢大家!