魔镜魔镜告诉我,画质评测哪家强?|LiveVideoStackCon2020讲师专访

LiveVideoStack 2020年6月16日


采访讲师:蔡媛
15年加入金山云, 现任金山云高级技术总监,负责视频云AI 产品线、媒体处理产品线、视频质量评测体系建设的产品及研发工作。核心项目包括媒体云转码、集智高清、画质增强、KSC265、KQoE等。

LiveVideoStack:在您眼中,自加入金山云以来,金山云在视频云方面经历了怎样的发展?

 

蔡媛我是2015年加入金山云的,从我加入后金山云在视频云方面其实发生过很多的变化。金山云是云行业中最早开始做视频云的云服务厂商之一。2016年直播开始爆发,金山云开始在移动端直播SDK、流媒体处理、流媒体分发、视频编解码等方向投入了大量的研发资源。

 

2018年后,我们开始探索深度学习与传统图像处理、编解码的结合,陆续推出图像增强、集智高清、内容审核等产品,落地了很多客户。

 

2020年,金山视频云持续在5G 风口寻求新的机会,相继推出KVR 8K高清直播解决方案、金山云图像\视频评测平台魔镜等。


LiveVideoStack:近期攻克的技术难点、现阶段正在解决的问题、下一个阶段的研发目标?


蔡媛我们视频云团队围绕5G时代视频高清化发展方向,在图像处理和编码方向都有不错的进展,新晋攻克的技术难点主要集中在几个关键项目:集智高清、图像增强、云转码支持AV1、视频评价体系建设等。


我们在4月正式上线直播AI集智高清产品,在同等画质下,直播AI集智高清产品压缩率最高可达50.65%;码率的降低带来直播QoS的提升,包括首帧、卡顿率、卡顿时间等。在视频质量问题的处理上,一方面利用AI图像增强技术解决了拍摄过程中引入的低质量画面问题,比如曝光、清晰度、颜色、质感、噪声、抖动、伪像等问题。另一方面块级智能决策可以很好地避免块效应,减少低清视频比率,降低产生用户反感的可能性。


图像增强方面照片修复取得不俗进展,运用卷积神经网络和生成式对抗网络自动补充细节,模型稳定性和泛化性进一步增强, 可为用户带来超清的图像视觉体验,细节生成的主观评测得分接近4.5(总分5分),达到可大规模商用化的程度。


除此,作为AOM的成员之一,金山云在AV1算法优化上投入了巨大精力。2019年底金山云推出的AV1编解码服务在国内实现商用落地,AV1结合集智高清压缩率可达到80%以上。AV1具备更复杂的预测模式,在超低码率下仍然能有非常明显的主观优势,但同时也带来很大的计算复杂度压力。目前KAV1已经可以做到在1fps转码速度的同时,在主观相同画质比H.265节省20%码率以上。


金山云视频云团队持续深耕在图像视频处理领域,在质量评价方面有着很长时间的积累,对内使用有非常不错的表现。今年5月,金山云视频云团队对外发布了图像/视频质量评价平台-魔镜,旨在帮助用户提升评测效率并保障评测质量,通过高效的主观画质验证,可帮助客户实现算法原型短期快速验证、算法长期迭代并提供可度量的画质指标,帮助AI处理提升泛化性,满足商业化落地要求。



本次音视频大会我会跟大家分享金山云魔镜平台,重点从如何建立视频主观画质可量化指标方向进行阐述,包括视频筛选、评测维度、评测质量、数据映射等难点进行剖析,敬请大家关注。


下一阶段,我们在评价体系建设上主要希望以魔镜平台抛砖引玉, 寻求视频行业更多合作,打造完善画质评价体系,包括建立符合国人审美、适合不同终端的评价体系;连接学术界更精准的传递工业界的需求,推动技术发展;明确可度量的评测分数,促进高清技术进步,与客户一起探索和推动视频质量的行业标准。


LiveVideoStack:技术进阶之路上给您最大启发的人是谁?


蔡媛给我启发最大的是视频和CDN行业的元老级大神宗劼老师,他也是我们CVC BU总负责人。宗劼老师是一个非常严谨的人。在目标达成方面,他不仅要求团队要给出清晰可量化的路径,更是要求技术负责人沉到前线帮团队成员分析解决问题。


对系统稳定性问题,从系统架构到异常处理的细节,从研发代码质量到测试覆盖度,宗劼老师对我们都有严格的要求。对于新的idea,包括魔镜平台和评价指标的想法,宗劼老师认为这对行业具有非常友好地推动促进作用,给与我们很大的理解和支持。


LiveVideoStack:能透露一下您在这次LiveVideoStackCon会带来哪些内容吗?


蔡媛:在本次大会上,我主要会跟大家分享金山云魔镜平台, 主要从如何帮助客户高效进行视频质量评测进行剖析。魔镜平台支持三种评测模式,通过使用金山云魔镜平台,能够有效提升算法研发的效率,包括但不局限于:



Ø 算法原型短期快速验证

Ø 算法长期更新迭代,提供可度量的画质指标

Ø 帮助AI处理提升泛化性,找到bad case,满足商业落地要求


实际上,在主观评测过程中有很多难题,比如什么样的视频用来评测,哪些评测维度是有必要考量的,不同分辨率的视频应该在什么样的场景下进行评测。在本次演讲中,我会从数据筛选、评测维度、数据质量、数据映射等方面进行深入阐述。


LiveVideoStack:想要开发魔镜平台这样一个主观评测平台的初衷是什么?


蔡媛:金山云从事视频编码方向的研究已经有超过5年的时间。编码器常规度量失真的方式是PSNR或者SSIM,然而我们发现这两种指标在MOS分数下的SROCC很难超过0.6。除此之外,在一些图像处理诸如超分、去噪等算法应用时,这一问题更加严重。


为了更好的打磨算法,我们决定每次测试都采用人工评测的方式,因此质量评测团队、算法团队、前端团队联合设计开发了内部版的评测平台,支持H265、AV1 等编码标准,支持图片、点播、直播形式评测。


2019年下半年,我们开始萌发评测平台免费对外开放的想法,希望能让更多有类似需要的评测团队和算法团队可以更高效迭代算法。


LiveVideoStack:在开发魔镜平台的过程中遇到了哪些困难?


蔡媛:目前市面上,还没有开放的图片\视频质量评测平台类似的产品,平台的需求、设计、交互都是整个团队成员思维碰撞产生的,比如为了区分视频处理前后的细微差别,我们设计了叠加和放大镜模式,通过图层叠加实现拖动鼠标可在同一位置对比。再比如评测员打分界面如何弹出,我们尝试了悬浮和弹出模式, 从评测主体最大化考虑选择弹出模式。


在web上支持H265 播放,我们也尝试了很多的技术方案, 最后选择了基于webassembly技术,实现流畅播放。在评测模式上,我们先后也改进并推出了三种模式,包括专家模式、用户模式、精细对比模式,来应对多变的需求。



LiveVideoStack:为什么要免费对外开放魔镜平台?


蔡媛:希望评测平台的免费开放可以帮助更多客户进行高效的评测和算法迭代, 因此技术和交互细节都是用心设计打造。

不积跬步无以至千里,希望以魔镜平台抛砖引玉,寻求更多合作,打造符合国人审美,适用于不同终端的完善的画质评价体系。一方面,希望可以更精准地传递工业界的需求给学术界,推动技术发展;另一方面,可以明确可度量的评测分数,促进行业高清技术进步。


LiveVideoStack:魔镜平台对金山视频云现有产品产生了哪些推动价值?

 

蔡媛:魔镜平台对金山视频云现有的画质增强、超分、编码产品都有非常重要的推动价值,对直播、点播业务都带来了很大的收益。平台开始的时候主要是内部的产品、研发、测试对画质评测,后面平台支持了第三方人工评测,我们在质量方面严格把控,整体的标注成本控制和效率得到了质的飞越。

LiveVideoStack:魔镜平台下一步会如何发展?

 

蔡媛:我们会积极拥抱变化,希望能推动国内评价标准的建立, 让行业的主观画质可度量, 进一步推动金山视频云打造更贴近用户场景的高清编码产品。

还可输入800
全部评论
作者介绍

蔡媛

金山云

高级技术总监

文章

粉丝

视频

阅读排行
热门视频

SRS实用手册-一剪定乾坤(10)

杨成立/RTC服务器团队负责人

WebRTC视频数据流程分析

许建林/《WebRTC Native开发实战》书籍作者