麦克尼尔的《世界史》被公认是全球通史开山之作,他是这样形容人类文明起源的:当文化演化超过生物演化而占据首要地位时,严格而恰当意义上的人类历史便发端了。
之所以联想到这一典故,是因为近年来虚拟人发展得如火如荼,已经不局限于如何在技术手段上更像人(生物演化),也开始呈现出文化上的生机勃勃,广告代言、举办脱口秀、时尚博主、客服主播等等诸多新身份,也造就了虚实融合的“新文化”。
近日OPPO 开发者大会上更赋予了虚拟人一个新的能力,成为业内首个具备虚拟数字技术交互体验的手机智能助手。此外,OPPO 以小布助手为入口,开放了小布生态,未来开发者可以在平台上定制专属的小布虚拟人,搭载在多个智能终端设备上。
从个体进化到群体创生,从技术概念到商业生态,从这个角度来看,虚拟人这一“新物种”的文明历史,在2021年已经正式开启了。
那么,当虚拟人“觉醒”,会给我们的生活带来哪些改变?万物互融时代,虚拟与现实,数字世界与物理世界的边界依然清晰吗?对于开发者来说,为什么虚拟人会是至关重要的一种能力、一个机会?
虚拟人觉醒年
说今年是虚拟人技术的“觉醒年”,并不为过。资本层面,许多虚拟人相关技术公司、AI公司都收获了不少来自头部互联网企业的投资。消费者层面,今年科技企业也集体亮剑,将更多虚拟人形象推送到大众面前。大致可以分为三个流派:
一、偶像派。2020年,由虚拟人技术创作完成的马丁·路德·金登上了《时代周刊》,新一波虚拟人如口红代言人的LING翎、时尚博主AYAYI等等,展现出了“带货”能力。技术上使用图形渲染、动作捕捉、语音合成等,尝试打造出逼真的拟人形象。这类虚拟人,往往需要过硬的作品和内容来延续商业价值,比如初音未来、洛天依等虚拟偶像,都有制作音乐专辑、举办演唱会等等,而不局限于一张完美写实的仿真脸及人设。
二、学术派。虚拟人要实现自然流畅的交互,模仿人类的表情动作,对技术实力要求很高,这也吸引了许多学术机构参与进来,比如清华大学计算机系知识工程实验室的虚拟学生华智冰,浙江传媒学院和厦门大学相关团队联合打造的虚拟人“西小施sisi”等,没有明确的商业化场景,主要是向大众展现虚拟人技术的最新能力。如果达不到大众预期,或者出现“换脸”之类的负面新闻,就会给虚拟人IP蒙上阴影。
三、实用派。偶像派需要作品,学术派考验技术,但企业还是需要与用户进行有温度、有情感的互动怎么办呢?于是实用派虚拟人纷纷登场了。它们大多是由企业机构与科技公司合作推出的标准化方案,代替真人进行内容生产和简单交互,比如虚拟主持人、数字航天员、虚拟导游等等。这类虚拟人并不需要高度拟真,技术难度相对较低,但也因为定制周期和成本较高,无法快速大规模推广。
听上去,似乎虚拟人只能作为一种被观赏的景观,停留在数字世界里。这就够了吗?
虚拟人走红的本质原因,是现实世界与数字世界之间,需要一种更具视觉化、沉浸式和情感温度的交互方式。因此,作为两个世界沟通的桥梁,虚拟人还有很多想象空间。
举个例子,随着智能技术的发展,手机不仅是各种数字应用服务的中心,与其他IoT设备的联动也成为常态。万物智联更需要以人为中心,围绕生活场景和行为习惯,实现智能设备间的无缝协作,让用户更便捷地获取想要的服务。
以往这种从硬件到软件,从技术能力到服务应用的服务体验,主要是依托智能语音助手来完成的。但是,语音交互更多的是简单机械化的指令,能够表达情感的地方很有限,难以撬动用户心中温柔的情绪,与智能助手形成情感上的连接。更丰富的交互方式,是人机交互的演进方向,而具备语音、语言、3D视觉效果的虚拟人,自然也就成为语音助手的进化体。
可以预见的是,接下来虚拟人将在技术、场景、产业的浇灌下,展现出更大的生机与可能性,成为人机交互的全新方式。
基于以人为本的用户洞察,OPPO思考很多,动作也很大。就在今年9月,OPPO率先推出了 “小布虚拟人”又在前不久的ODC开发者大会上,将小布升级为业界首个基于虚拟人多模态交互的手机智能助手。
一场“新人类”的进化
进化的过程并不是一蹴而就的,需要在几个关键节点上都发生正确的“突变”,才能演变出一个全新的物种。
想要让虚拟人进化成为万物智联、人机无缝交互的核心,究竟分几步?今天就以OPPO小布虚拟人为线索,看看虚拟人的“初长成”需要解开几重结界。
第一重结界,多模态融合的交互能力。
我们可以将小布助手,看作是“虚拟人”的胚胎。作为搭载在OPPO智能手机和IoT设备上的智能助手,今年2月,小布助手成为国内首个月活用户破亿的手机语音助手,而成为人机交互入口,毫无疑问,小布是一颗极具生长潜力的“种子”。
如何让这颗“胚胎”,生长出自然逼真的感知系统、感官形象、思维大脑,成了“小布虚拟人”生命的起点,依赖于语音、视觉、自然语言处理等多模态融合算法。为此,OPPO多年布局的全栈式AI技术,就成为这一生命体的温床。
首先,架设了AI整体技术架构,包括混合云基础设施、云原生数据湖、端云一体机器学习系统,以及语音、NLP、知识图谱、CV、推荐搜索等AI能力层,跨终端、多场景落地的业务应用层,为企业提供安全可信的AI安全能力层……这一基础架构能够为虚拟人所需要的AI能力提供基本的算力、算法、安全等全方位保障。
其次,针对性打造虚拟人相关能力。作为有温度的人机对话沟通载体,虚拟人需要在语言、表情、动作等方面都自然流畅,这就要求NLP、机器视觉、TTS语音合成等等多种基础AI能力都达到国际顶级水平,才能让用户不感到违和。为了让小布虚拟人达到较高的呈现效果,OPPO技术团队今年上线了基于知识图谱的NLP预训练大模型,通过自建知识图谱与对话上下文等信息嵌入,结合公共以及小布积累的大数据集,融合后进行大模型预训练,精准判断用户语言中的意图。通过UniLM统一预训练语言模型,生成更贴近上下文的对话内容,让用户在与小布助手的交互过程中,能够对答如流,满足用户闲聊的需求,目前满意度超过85%。
另外,虚拟人还需要展现出声情并茂的面部表情和肢体语言。为此,OPPO通过ORTC窄带高清、大规模低延时等基础创新技术,依托小布助手的综合AI能力,实现了在多个场景下与用户的实时情感化交互,让用户于小布的交互不会因为计算处理、网络问题而卡顿,变得更加自然、真实。
基于这些硬核的AI能力,小布虚拟人才变得能听会说、活灵活现,成为与用户智趣相投的数字“生命体”。
第二重结界,从软到硬的服务能力。
人类走向文明的体现,是学会使用工具来为自己服务。如果小布虚拟人只能停留在手机里插科打诨,那和其他虚拟人也就没什么差异了。
如前所说,OPPO在内的硬件厂商早已不局限于手机这一单品,都在发力多终端、多场景的智慧生活,这也使得消费者对于打破软件和硬件之间的结界,用一个数字助手调度多种硬件的能力,有了迫切的需求。
用一个词来总结,就是服务泛在化。具体有四大特性:人与设备间的交互将更加自然无感,虚拟世界的真实渲染与现实趋于融合,多设备无缝互联互通,服务体验随人流转。
对此,OPPO研究院院长刘畅认为,泛在服务的趋势,对开发者和平台提出了更高更全面的要求。
作为多端融合的服务调度工具,小布虚拟人也就具备了“软硬服一体化”的差异化能力,给消费者带来了实质性的体验改变,也让自己变得与众不同、独一无二。
面向未来的全新服务形态,小布虚拟人具体能做些什么呢?
首先是感知,作为用户与机器互动的入口,通过语音、视觉等多元化信息融合感知,具备数据感知、数据采集的基本能力,为主动服务提供数据养料;
其次是计算,借助AI大脑的计算分析处理引擎,将多维信息综合处理,化繁为简变成高效服务传达给用户,让无处不在的应用功能可以被高效触达;
最后是生态,未来除了手机,平板、冰箱等各种带屏设备,都需要更具情感色彩的人机交互,这时候虚拟人生态的形成,可以汇聚开发者和IoT厂商,为消费者联合打造千人千面的是虚拟人,让有温度的智慧服务无处不在。
从这个角度看,软硬服一体化的小布虚拟人,也成为实现泛在服务、智慧生活时代的关键。
第三重结界,从应用到生态的支撑能力。
应对物竞天择,最好的方式是,形成一个庞大的物种生态。对于小布虚拟人来说,要给用户提供更丰富、更多元的AI服务,无法依靠一家企业来独立完成,需要引发用户、开发者、合作伙伴们的多维互动和创意。
以往虚拟人的开发者是企业自身,为自有产品和服务提供支持,运营模式相对封闭。如何寻找更多场景激活更多服务,成为虚拟人技术为用户提供更多价值的前提,才能形成欣欣向荣的生态图景。
生态的打造是一件复杂工程,开发者们的创意飞扬,也需要工具、资源、算力等底层支撑。从小布开发者平台中可以看出,OPPO对开发者的支持可谓是诚意满满。
一方面,提供一站式、能力完备的平台工具与服务。小布开发者平台,以OPPO全栈式AI技术能力为底座,覆盖了底层的数据和算力基础,搭载了各类语音、对话、视觉、图谱、多模态交互等AI基础能力,上层各类平台,如BVS语音服务、AIoT云平台、技能平台、以及虚拟人定制平台。让设备接入、虚拟形象定制、功能开发等都变得便捷高效,每一位开发者都能定制专属的小布虚拟人。
另外,开放从软件、硬件到服务的OPPO生态资源,助力“冷启动”。以小布AIoT服务平台BVS为例,就与IoT行业特别是智能家居行业展开互动合作,IoT厂商的主控设备如音箱或控制面板,通过BVS可以快速接入小布智能云,开发者应用可以实现一次开发、多端触达,开发出的虚拟人可以搭载在OPPO生态中多个智能终端设备上(电视、手机、手表等带屏设备),收获商业价值。
时代考题与OPPO公式,打开产业之变
对于开发者来说,万物互融时代,既是潜力无限的金矿,也是一个充满残酷挑战的竞赛。
潜力在于,为用户提供一致的多维多场景体验,开发者能够触及更多场景,降低开发成本,收获更大的认可和商业成功。
挑战在于,虚拟人这样的新物种也是顶级技术的综合体,并且需要产业配套来推进,单打独斗的普通开发者很难找到适配自身的场景和突破口。
对于智能终端品牌来说,与其自筑城池,不如开放自己,成为产业变革的推动力,汇聚开发者的力量,建立新技术体系下的话语权和创新输出能力。
从此次ODC大会中我们观察到,OPPO在重度投入、赋能开发者上做得非常深入,思考得也很透彻,将其拆解为一道综合考题。
智慧生活的一道加法题,S多维场景与O全链路运营,围绕人的生活场景和行为习惯,OPPO将开放统一的连接框架,让开发者具备给用户全场景互联互通的服务能力,实现全场景、全链路的服务优化,可以更容易、更高效、更精细地找到机会,扩展触达用户的广度和深度。
人机交互的一道乘法题,T是OPPO主导的软硬融合技术,小布能实现多终端、多模态的人机对话,打造人与设备间更加自然无感的交互体验,为开发者提供创新源动力,获得必备的AI能力。
泛在智能的一道乘积题。以OPPO 全栈式AI技术能力为底座,通过小布实现智能设备之间的万物互融,开发者可以创作出定制化的虚拟人,和用户之间进行更多形态的情感化交流,让虚拟世界和真实世界之间的交流变得不再单调和枯燥,进而实现泛在智能的指数级增长。
由此,也形成了下一代生态势能公式NEPE =T(S+O)i生态模式。
在小布虚拟人身上,我们能看到这一公式的落地应用,真正达到了软硬兼施、内外兼修,OPPO开辟出了一条全新的赛道,这将是产业改变的初始。
这也让我们相信,只要技术不断浇灌,智慧生活会在开发者的想象力中,向更深处进化,未来还无尽可能。