欢迎光临
人工智能那点事

虚拟主播打开直播新玩法 科大讯飞、影谱科技各有方案

2019是直播带货突围的一年,薇娅、李佳琦成功出圈,登上时尚杂志封面,俨然明星化,而直播本身作为新型营销、卖货渠道也开始被重视,疫情期间,携程梁建章、格力董明珠、蔚来汽车李斌、百度李彦宏等企业家先后现身直播间,为旗下产品拉新、卖货。

步入万物皆可带、全民皆主播的时代,站在塔尖则是一天带货超27亿、10亿元的薇娅、李佳琦,市场上甚至涌现了一批电商直播培训学校,试图复制李佳琦的速度和奇迹。但问题在于:真人带货极具性格属性,李佳琦直播间也曾因小助理的离开被粉丝评论“不像原来的李佳琦了”,再加上口误、翻车事件,李佳琦被多次推上微博热搜,毁誉参半。

与之相对,正大举进军直播行业的虚拟主播却完美解决了这一问题——可复制、可控制,无需面对李佳琦“不敢停播一天”的焦虑和体能上限,更避免了人设崩塌、直播口误等不可控因素。五一期间,拥有187万粉丝的B战虚拟歌手洛天依来到淘宝直播间,首次为博士伦、美的、欧舒丹等品牌跨界带货,当天直播在线观看人数一度高达270万,收获了市场认可。

实际上,源起AI、AR技术的虚拟主播更本质的表述就是文字、图片、语音、动作的AI化,早期受限于制作成本高昂无法普及,近年来随着人工智能技术发展,科大讯飞、影谱科技等一批技术服务商出现,解决了从0到1的技术攻坚,虚拟主播打破了技术门槛,开始普及。

与2016年的网络直播热潮不同,此次直播顺利出圈,不仅体现在主播角色上,更体现在多元化平台对直播的积极参与中——除了电商直播带货,包括官方媒体、视频软件在内的内容平台开始引入虚拟主持人、虚拟主播生产内容,来自银行、旅游、法律等行业的企业先后引入直播技术,一系列虚拟客服、中介、导购、导游、律师涌现在各行各业。

伴随直播出圈的,是一场串联内容、技术、平台的多方协同,这不是一家独大的市场,拥有丰富内容和深厚技术积累的玩家,将获得先机、率先撕开一条口子。

虚拟人出圈

虚拟技术正以前所未有的速度覆盖我们的生活和工作,《时代周刊》封面首次刊发了由虚拟技术创作完成的马丁·路德·金“虚拟肖像照片”,该虚拟人物还将重现马丁·路德·金的经典演讲《我有一个梦想》;虚拟偶像洛天依、默默酱、AC娘分别在淘宝直播、抖音、快手直播带货,将虚拟技术直接变现;2019年央视网络春晚中,虚拟主持人“小小撒”、“朱小迅”吸足了观众的眼球。

不管是内容创作还是商业销售,雅俗共赏、应用场景多样的虚拟人都收获了不俗表现,也因此获得了各大平台的青睐:4月“淘宝直播MCN机构大会”上,淘宝直播宣布将对四大MCN赛道——二次元赛道中的虚拟主播进行重点扶持,5月抖音上线“元气学院”,以“短视频创作+直播挑战”形式鼓励二次元创作。

如果以形式来区隔,国内目前对虚拟人物的应用主要体现在两个方面:其一,内容创作,比如以虚拟人物为IP的动漫、影视剧和衍生品创作,此类虚拟人物迎合了国内Z世代崛起下二次元文化的蓬勃发展。根据爱奇艺发布的《2019年虚拟偶像观察报告》,2019年中国二次元用户规模达4.9亿,其中泛二次元用户3.9亿人,核心二次元用户1亿人。

其二,工作替代,比如虚拟人物直播卖货、播报新闻、智能客服等等,此类虚拟人物对比内容创作而言,更需要极强的技术支撑,以此满足高时效性、高反应度的实时呈现,达到“以假乱真”的画面效果。这些替代了过往真人主持、真人主播、真人客服的虚拟人,不仅可以有效避免真人工作过程中容易出现的口误、疲累、高成本问题,真正在行业内实现规模化复制,还可以根据需要做差异化的人格设定。最典型的案例,当属虚拟主播。自称“第一位Virtual YouTuber”的绊爱,以呆萌可爱的形象俘获大批粉丝,YouTube之外,还在B战拥有逾100万粉丝;虚拟主播辉夜月则设定成一位毒舌话痨,喜欢跟其他虚拟主播互动,充满元气活力的人物形象;猫宮ひなた则被设定成有着慵懒外表的游戏高手。

二次元虚拟主播以人设(IP)+技术在泛文娱赛道打开了一条缺口,而更多传统媒体机构,则开始运用虚拟主持人来替代重复性的新闻播报。2019世界制造业大会上,科大讯飞旗下的AI虚拟主播“小晴”亮相,它不仅拥有高颜值的外表,声音动听,熟知各国语言,可以实现实时翻译、实时播报、虚拟主持等多个场景。

除此之外,科大讯飞与相芯科技合作推出了虚拟主持人“康辉”,前者通过A语音合成技术对康辉的声音进行合成模拟,后者则通过FaceUnity的P2A和虚拟形象驱动技术设计康辉的形象和互动。2018年5月CCTV13的特别报道《直播长江》中,“康辉”机器人完成了与记者现场对话、表演绕口令等多个任务。

影谱科技也和媒体进行了虚拟演播室、虚拟主播等创新报道模式的探索,通过人脸识别、行为识别、物体检测、场景识别、自然语言处技术、人脸特征提取、人脸重构、情感迁移等多项前沿技术,按照指定人物形象,结合文本或语音自动生成动态和逼真的口型,同时合成自然流畅的面部以及全身的动作影像。据悉,影谱科技正在与大型媒体合作开发AI主播。

技术深耕者

如果往前追溯,虚拟主播最早可以回溯到虚拟主持人时代。2001年,英国 PA New Media公司推出了世界上第一个虚拟主持人“阿娜诺娃”,三年后央视推出了国内首位虚拟电视节目主持人“小龙”。这些主持人形象高挑完美,可单独主持节目,但在动作流畅度、时效性、制作成本上都存在短板,无法与真人主持相媲美。

为了解决这些难题,人工智能赛道的企业各施其法,推出了许多方案。比如,主流玩家多采取多模态融合生成技术,需要在准确性和时效性上做出妥协,为此影谱科技研发了一套面向虚拟主播自动编辑和生成系统,实现了虚拟主播的低延迟流式生成。在此方案下,影谱通过嘴型生成方法和面部渲染技术,提高了虚拟主播合成的准确度与清晰度,并通过低延迟优化技术显著减少了生成时间,满足实时、半实时的应用需求。

不仅技术上打破了门槛,伴随着5G新基建的落地,虚拟主播也获得了大量应用前景和市场青睐。以媒体行业为例,它极大简化了策划、编辑、主持、制作等一系列工作,提升了播报的效率,虚拟主播的表情、神态、形象、动作也十分接近真人状态。在虚拟演播室中,媒体输入文字即可生产对应的音视频内容,音、视频输出可以轻松完成,达到快速生产内容的效果。

不仅如此,疫情催生的人工智能热潮将在很长一段时间内继续发酵。对媒体来说,疫情报道机器人、数据新闻机器人、直播拆条机器人、海报视频机器人、字幕生成机器人,这些在疫情期间被频繁使用的智能工具,不仅在短期内缓解了生产焦虑,还将在更长远的时间维度上赋能行业转型。以虚拟主播为例,过往虚拟主播是媒体的锦上添花,而疫情的突发导致大量媒体工作人员隔离或无法到岗,虚拟播报和主持成为了必须。

另一方面,短视频、直播的出现给了企业一个转型出口,对新技术的拥抱将从一种积极变成一种必须。而对于技术服务商而言,这将是重要契机。科大讯飞、影谱科技等行业龙头与大型媒体、企业的强强联合已经出现,一些中小型技术服务商也开始崭露头角。

这个过程里,头部与中尾部各有侧重,比如科大讯飞主攻音频,主要为虚拟主播提供语音方案支持,而影谱科技素来以视频能力见长,对人物动作、形象、表情的捕捉和生产更熟练,因此在影像领域具备较强的落地能力。强大的通用技术能力,让龙头可以覆盖多个行业,而中尾部玩家因资源有限,更集中于单一行业的单点突破。

一个预判是,随着技术、内容的不断融合,未来技术服务商与内容提供商之间,将会形成更强的联动效应,而在此之前,头部技术服务商因落地经验和技术积累丰富,将获得更大的内容议价权,在“技术+内容”的双塔结构下,获得先发优势。

赞(8)