“视频AI产品今后几年将是一片蓝海”

AI 4K
LiveVideoStack 2020年10月29日

“视频AI产品今后几年将是一片蓝海”

——专访RealNetworks中国执行总裁乐永升

“4K内容的匮乏制约着4K产业链的发展”

“8K的视觉呈现仍然是一个大问题”

“希望能有带AI功能的3D制作工具在短视频平台出现”

“大家将在此次大会上看到最酷炫的4K样片展示”

......

6842077a783f4192b2855eefe43fd04f.jpg


RealNetworks 中国执行总裁乐永升

f3d60579fc824f08bbfd3e612b1cdfec.jpg


RealNetworks公司RealNetworks:RealNetworks是流媒体类别的发明者,改变了音频和视频内容在全世界范围内各种设备上的消费方式。自创立的25年来,RealNetworks以数字媒体专业知识和创新为基础,采用世界一流的人工智能和机器学习技术,定义了新一代的音视频产品及服务,不断增强和保护人们的日常生活。乐永升:RealNetworks中国执行总裁。乐永升先生曾任职中国数字视频集团高级副总裁、Quantel大中国区总经理、Avid中国区销售总监,在超高清数字视频解决方案和电影高端后期制作等领域成绩卓著。

“Real”多媒体



LiveVideoStack:您目前的工作内容以及RealNetworks在中国的发展?

乐永升:我从事计算机及数字媒体应用技术近30年,经历了中国IT技术、互联网技术、人工智能技术以及智能终端产业发展的各个阶段,但我主要的经历还是在数字媒体应用领域。

从早期的非线性电视编辑大规模广播电视网络系统,再到今天的超高清(4K/8K)电视广播;从全媒体演播室到基于媒体云和智能终端的媒体融合应用;从早期的电影数字剪辑、特效、CG动画、音效,再到电影4K数字中间片母版制作、3D立体电影制作等等,很荣幸涉猎国际最前沿的高端电影电视科技,与卡梅隆导演团队(CPG-China)徐克导演团队等国内外影视行业著名客户建立了良好的合作关系。

我在一年前加入RealNetworks中国公司,主管中国及部分北亚地区(韩国、日本)的业务。RealNetworks是世界最早音视频播放器RealPlayer的开发商,Real RMVB视频编码更是行业的里程碑,至今全球已有超过数十亿的智能终端设备采用了RealNetworks视频技术。同时,RealNetworks在人脸识别、情绪识别、动作识别等AI领域也掌握全球领先的技术解决方案。

中国是全球智能终端产品(智能手机、智能电视等)最大的生产及消费大国,亦是RealNetworks重要的战略市场,RealNetworks中国研发及产品团队立足中国市场需求,力求为国内客户提供最全面的支持与服务。


LiveVideoStack:您在音视频领域及广电行业有着丰富的经验,而互联网行业音视频应用和传统行业音视频技术有着很大的不同,在这方面给您启发最大的是什么?

乐永升:专业影视内容制作周期长、投入大、技术门槛高且单向传播,互联网内容则互动灵活、内容短平快,短视频主要是由非专业人士创作。电影是票房效益,互联网是流量效益,所以编码技术对于互联网非常重要。

随着5G通讯、手机投屏等技术的发展,专业内容更多地进入互联网市场,同时,短视频创作也会变得更长、更专业,广大非专业人群非常需要带有人工智能的音视频创作工具。专业的影视高新技术,比如3D立体影像、VR等技术对于广大互联网市场同样有着巨大的吸引力。

2008年,全球金融危机爆发;2009年,各行业经济受到重创。好莱坞著名导演詹姆斯-卡梅隆及其团队正好在进行《阿凡达》的后期制作,该片是全球第一部全片采用3D立体影像技术拍摄制作和放映的影片,在当时就采用了我当时就职公司的Quantel 3D电影制作系统完成制作。

2010年初,《阿凡达》全球上映,一举成为全球电影票房王,还推动了电视制作及院线、手机、电视机厂家等产业链3D热潮,重振了大家对影视传媒产业发展的信心。

后期,因为3D拍摄技术比较复杂,专业创作成本高,消费端内容稀缺,3D产业链退烧。最近,裸眼3D显示技术已经非常成熟,《阿凡达2》也将在明年上映,当下一次裸眼3D屏幕浪潮来袭的时候,希望能有带AI功能的3D制作工具在短视频平台出现,相关产业链必将再次井喷。

“Real”摄影师·


LiveVideoStack:您的职业生涯中所参与的最难忘的项目是什么?可以与LiveVideoStack的读者分享其中的一两个小故事吗?

乐永升:在前面的回答中我有提到过自己从事计算机及数字媒体应用技术近30年的时间,这30年也正是中国经历IT及互联网产业全面发展的时间阶段。数字化及通讯网络的发展,不仅推动了中国成为全球最强的产业链,也极大地改变了人们的日常生活。

30年前,我还是一名新闻摄影师,拍摄过朱镕基、田纪云、邹家华等国家领导人的纪实照片。在那个胶片摄影的年代,通常只有ISO400的胶片,低照度下只能用闪光灯。早期的闪光灯是固定功率指数,被摄主体远近不同,光圈就需要变化,摄影师需要首先判断主体距离,选择合理光圈,再判断合理的快门曝光速度,手动对焦抓拍。连拍往往就比较困难,因为闪光灯根本跟不上。因此,过去要想成为一个纪实新闻摄影师需要经过严格的训练;而今天,即使是没有摄影知识储备的小朋友,也可以利用智能手机轻易地拍出纪实照片。

胶片也曾经是电影行业的标准载体,但从2007年开始,电影行业就放弃了胶片,开启了全面数字化的电影时代。今天,内容创作人群已经扩大到广大手机用户——中国已经有上亿的短视频创作用户。

1997年,我作为SGI图形工作站的技术经理,帮助客户搭建影视后期制作系统,需要升级计算机系统固件。当时互联网还没有普及,我专门托电讯部门的熟人,才下载了海外发布的补丁程序。今天看来,这些事都难以想象,但这些的确是曾经中国影视制作行业的样貌。

“Real” 8K ·


LiveVideoStack:在您眼中,4K的普及程度、8K的逐渐成熟等现在处于什么样的状态,有哪些相关产品及技术值得关注?

乐永升:早在5年前,新上市的LCD液晶电视机都已经全面支持4K显示,大尺寸液晶电视机更是强调支持4K HDR高动态范围。随着家庭用户的升级换代,绝大部分家庭的电视已经可以显示4K的内容了,4K的拍摄及后期制作成本已经比较接近HD节目,专业电视机构也已经有足够的技术储备,但4K内容的匮乏制约着4K产业链的发展

作为2022年冬季奥运会的主办国,中国加速了超高清电视广播计划,这也是国家推动广大消费者更新大屏液晶电视拉动电视机产业链的重要布局。此外,互联网OTT平台也高度重视4K内容的收费运营。RealNetworks正联合海外内容商,为国内用户提供优质的4K内容,满足国内下一步大规模超高清频道播出的内容缺口。

NHK 2013年开始全面准备2020东京奥运会的8K电视转播,2018年已经开始8K电视广播。早期8K节目的拍摄制作成本很高,随着东京奥运的临近,佳能、尼康、索尼的高端微单相机都开始支持8K视频拍摄,后期制作价格也逐渐降低,但8K的视觉呈现仍然是一个大问题

产业链已经有大尺寸8K液晶电视机一般75英寸至100英寸基于人眼的视觉分辨力,在3米距离观看75寸屏幕,是区分不了8K和4K的区别的,真正展现8K的魅力,需要150寸以上的大屏。产业链无法以较低的成本造出150寸液晶单屏,大部分家庭空间也容纳不了150寸大屏。所以我个人认为进入家庭并不是8K电视广播的理想选择。

目前8K投影产品、8K LED户外大屏,8K 液晶电视拼接大屏都已经存在,可以将8K电视广播传送到剧场或户外大屏,营造转播现场气氛,还便于门票收费,这正是东京奥运会“剧场化8K电视转播”的思路。

中国短期内还不会有8K电视频道的正式播出,但各行各业有最广泛的室内及户外大屏应用场景,无论是体育、会议、展览、婚庆、娱乐、商业广告、演播室等各种大屏应用场景都需要8K视频播放器,因此,RealNetworks基于多年的音视频领域的技术积累及多年的播放器开发经验,推出了高性价比的RealPlayer 8K播放器,填补了 8K产业链的空白。

LiveVideoStack:RealNetworks在为用户提供8K、超高清视频体验方面做了哪些努力,目前的产品成果,以及今后相关的产品计划、发展方向

乐永升:正如前面介绍的,RealNetworks自肇始即在流媒体领域发展,经过近25年的发展,积累了大量有关Codec、流媒体播放、播放器开发等经验。我们于去年底开始8K相关技术的研究与开发,并在今年历疫情期间,异地协同,成功地推出了超高清高性价比的8K播放解决方案:不仅支持Real的独家的世界一流的流媒体编解码Codec——RMHD,也支持市场上主流的Codec;同时,相较其他8K解决方案,Real 8K播放器更加高效、更具性价比,其多种输出方式满足了目前市场上绝大部分的8K显示设备,可以更广泛地适用于不同的播放设备,可以减少用户对于硬件的采购成本。

RealNetworks将继续在8K播放领域深耕,一方面针对客户的需求与反馈优化产品,另一方面将结合我们本身在AI方面的优势,利用AI增强播放体验,提供更多媒体创作工具。

“Real” AI·


LiveVideoStack:您如何看待目前市场上AI在视频产品中的应用及发展?

乐永升:目前中国AI市场的发展呈现出如火如荼的态势,然而更多的企业仍在传统的安防、认证等领域发展,在视频产品中的AI应用仍有较大的发展空间视频AI产品在今后的几年将是一片蓝海。

一方面AI可以在传统的底层编解码领域中得到应用,进一步提升视频画质、减少码率与带宽;另一方面, AI可以进一步在不同的视频场景中得到应用,在满足视频、内容运营的同时,更好地在前端与消费者互动,为其提供个性化、定制化的视频观看体验。对于广大互联网用户,基于AI的短视频创作工具将会获得巨大的市场反响, 这也正是RealNetworks下一步的战略发展方向。

特别值得一提的是,在经历了疫情之后,越来越多的学校将线上教学作为一个选项,AI在此领域中将有无限的潜力。为此,RealNetworks也推出了基于AI的e-training系统,更好地辅助学校与学生开展线上教学的工作。

LiveVideoStack:您如何理解音视频服务在科技、商业以及社会生活中扮演的角色?在您的眼中,RealNetworks在近些年历经了怎样的发展和变化(尤其是在后疫情时代)

乐永升:从文字、图片再到音视频数字媒体时代,从短信聊天、微博、微信、到短视频时代,人类生活记录、传播、交流的方式在演变;从标清、高清到超高清,从VCD、DVD、蓝光再到OTT, 从电话拨号上网、Wifi、3G、4G到5G,网络通讯的高速发展带动了内容的技术进步,从手机、iPad、大屏电视、再到电视拼接屏、户外LED大屏,屏幕尺寸的加大需要更高的图像及视频解析力。这些变化充分呼应了国家的5G/4K/8K产业战略,也应证了音视频数字媒体与人类文明的共同进步趋势。

RealNetworks曾经是流媒体播放技术的奠基者,在互联网带宽瓶颈的时代,RMVB编码技术成为了行业的重要标准,覆盖了广大的手机、电视、芯片等行业客户。如今中国年产智能手机近4亿台、电视机近2亿台,超过7亿以上人群使用智能手机、超过4亿人关注短视频。疫情的出现再度强化了人们对互联网和视频的依赖,在传媒、教育、医疗、娱乐、安防、网购、会议等各领域都更多需要数字音视频技术。RealNetworks将更加关注数字视频制作传播相关工具的开发,并将公司已经在全球获得首肯的SAFR人脸识别情绪识别年龄及性别识别产品融合到未来的视频创作工具里,为更广大的消费者服务。

LiveVideoStack:能透露一下RealNetworks在这次LiveVideoStackCon会带来哪些独家内容吗?

乐永升:非常荣幸能有机会参加LiveVideoStackCon 2020 北京站。作为大会的长期合作伙伴,我们一直致力于将RealNetworks最新的成果在大会上进行展示。

除了在往年大会上已经展示的世界一流的流媒体编解码解决方案——RealMedia® HD和全球领先的实时面部识别系统——SAFR™外,今年视频领域迈入8K时代,大家在播放8K内容时苦于缺少高性价比的解决方案,因此,我们基于多年的音视频领域的技术积累及多年的播放器开发经验,推出了超高清高性价比的8K解决方案——Real 8K播放器;同时,考虑到在观看视频的同时,用户更加追求个性化、智能化的运营和观看体验,RealNetworks也将自己视频领域的经验与全新的AI系统进行结合并推出了多种AI Base的视频播放、运营解决方案,解决了平台、运营商及用户多种对于视频的编、播、看等方面的需求。

欢迎各位来宾莅临我们的演讲环节了解更多的信息,也可以在我们的展位上体验更多音视频、AI等方面解决方案的演示;大家也可以在此次大会上看到最炫的4K精彩样片展示。

编辑:Coco Liang


还可输入800
全部评论
作者介绍

Coco Liang

LiveVideoStack

编辑

文章

粉丝

视频

阅读排行
  • 2周
  • 4周
  • 16周
热门视频

WebRTC视频数据流程分析

许建林/《WebRTC Native开发实战》书籍作者