本篇文章1777字,读完约4分钟
原标题:萨尔贝宁“双胞胎”ai虚拟主播:约30分钟制作
最近,观众在央视网络春晚的舞台上,高兴地看到贝宁有虚拟双胞胎兄弟“小山姆”。 这是ai的虚拟主持人第一次出港和原型一样的秀技,这给了小山姆一个感慨。 面临着自己将来的职业危机。
据说做这样的ai双胞胎播音员大约需要30分钟。 那么,其中到底有什么深奥之处呢?
像原型双胞胎一样真实
你见过吗? 你让贝宁当“什么也说不出来”的主持人了吗?
突然一看,小撒出来,小撒,“我的天,就像照镜子一样。 ”。 从外表来看,直呼简直是“失散多年的孪生兄弟”。
小摆设也不是花瓶的装饰,能控制现场,奇怪的话与玉相连,几乎没有余地留下来。 因为旁边小撒的不满,“你能说一句话吗? ’”
很明显,与以往僵硬机械形象的虚拟人类技术相比,引入人工智能、基于人类原型构建的虚拟主持人在技术上有了相当大的提高。
“为了与真实的主持人区别开来,技术团队在形象设计上发生了一定程度的变化。 比如这次可爱的“小撒旦”又高又健谈。 ”。 美国人工智能企业偶邦( oben )共同创始人郑毅先生介绍给科学技术日报记者。
当然,小撒但也不是独家制造的。 因为节目中除了虚拟双胞胎贝宁外,朱迅、高博、龙洋的双胞胎ai主持人也相继登场。
本世纪初,英国广播企业宣布第一个虚拟主持人anaova后,虚拟主持人成为科学技术研究的焦点。 “能听到声音,也能看到人”,可以说今年的网络春晚是国内第一个大规模的应用。
用数据“培育”成长
常说“台上一分钟,台下十年功”。 这次虚拟主持人培养进程大大加快。
记者将制作这样的ai虚拟双子播音员的技术称为pai(personal ai ),知道在20件以上的专利申请技术的支持下,只需散布贝宁等主持人的脸部扫描和30分钟的录音数据,就能生成形象和声音模型。
“主持人不需要基于ai语音技术输入大量副本来构建语音数据库。 只有那短短的几十句标准原声,通过特征参数提取,可以利用迁移学习算法建立自己的发声模型。 这样,输入的复印件可以用主持人的声音阅读和唱歌,也可以使用中日英汉四种语言。 ”。 郑毅说。
随着更多的数据被“饲养”,小散布在成长中掌握了越来越多的技能,包括小散布的喜好、说话方式等,在别的层面上被介绍得更相似。 除了运动捕捉训练外,传感器和运动跟踪设备还强调了原型主持人的个性,大幅提高了认识度。
“现在的深度学习和机器学习,在以往的自动化规则中学习能力变多了——自己发现法则。 换句话说,由于人类不太容易发现法则的细节,ai可以通过大量的训练让计算机学习洞察法则和细节。 ”。 华为人工智能算法工程师张顿冬天告诉记者。 从某种意义上来说,正如主持人朱迅所说,“通过以数据载体的形式,与现实世界亲密交流,我们实现了“永生”。 ”。
从数字世界到人类世界的差距
未来的世界是并行的数据世界,社会的主角是人,数据世界的主角是数字化的人。 那么,在人工智能时代,虚拟主持人有什么快速发展的瓶颈?
郑毅说:“‘感情’是人类的专利。 从语音模拟到语义模拟,虚拟主持人面临着从数字世界到人类世界的差距,在模仿音色、语速、停顿时没有问题,虽然知道意思、答案,但不理解感情上的意思。 ”。
在词义学习中,也有“兴奋”、“悲伤”、“焦躁”等感情模型,但在模拟过程中虚拟主持人不能及时调动,需要人工参加。 虚拟人依然像打嗝的宝宝,人类如何培育它,为此构建怎样的世界观,是未来深入探索的方向。
郑毅相信ai虚拟主持人不仅是从技术诞生到技术落地的过程,也是信任的交接过程。 当初虚拟主持技术的最大目的是通过对主持人和明星这样具有一定公共说服力的人物的牵引,提高人们对人工智能的信赖。 我们还处于技术的成长阶段,所以未来的人与人工智能的交往也应该从信任开始。 比如,像未来公务这样繁杂的职场人士,如果有另一个数字化的自己,模拟自己的意志,能代替成为助手,处理日常琐事,让生活安心吗? 我相信人工智能会带来越来越多的生活便利,创造更好的生活。
一位业界人士评价说,今年网络春晚应用ai的一步可能是打开虚拟主持人时代的一大步。 有人戏言说:“当然,即使虚拟人上岗,工资依然发给我们人类就行了。”
资料来源:科学技术日报
猛料越来越多了! 欢迎扫描左边的二维码关注本信息的官方web消息( xinlang-xinwen )
标题:【要闻】揭秘撒贝宁“孪生”AI虚拟主持人:30分钟打造(图)
地址:http://www.nxxlxh.com/nczx/15460.html