准确评估音画质量,七牛云将发布音视频质量分析系统

LiveVideoStack 2021年7月27日

近些年来,随着音视频的不断普及,终端用户对于音视频的质量要求越来越高:从最初的通话、观看流畅,到现在对音视频画质的高清需求及节省流量诉求。日益高涨的用户需求,将给音视频技术领域带来哪些挑战?如何更加客观、准确地评估音视频音画质量?未来音视频领域还会发生哪些大的变化?LiveVideoStack近期采访了七牛云直播与实时互动技术总监陈辉,和他一起讨论了七牛云视频质量分析的具体情况、优势与挑战,音视频的未来发展等问题。



陈辉:七牛云直播与实时互动技术总监,主要带领七牛的直播、RTC、SDK等团队升级产品能力和攻克技术难关。曾主导过大型服务化体系建设和业务中台建设,有着丰富的性能调优和架构设计经验。


LiveVideoStack: 陈老师,您好。请您介绍一下您在七牛云所负责的工作和您近期所关注的技术方向。


陈辉:我在七牛云主要负责实时互动产品 QRTC 的产品更新和技术迭代,同时我还负责方案架构团队,整体拉通七牛的 MPaaS (Media PaaS) 和 DPaaS (Data PaaS) 产品,更好地为客户创造价值。


我自己会比较关注两个方向的事情,一是跟实时音视频相关的技术,当前阶段我比较关注音画质量提升这个领域,也就是跟QoE\QoS相关。二是云平台对外服务能力架构的演进,这块能够帮助我很好地去思考和规划如何更高效地在工程侧给到客户支撑。


LiveVideoStack:目前视频云服务在七牛云整体业务中处在一个什么样的位置,它的主要产品有哪些?


陈辉:七牛云为客户提供企业级云计算和数据服务。作为云+数据的 PaaS(平台即服务)提供商,七牛云通过建立统一的异构数据湖,主要为客户提供多媒体数据智能和解决方案的 MPaaS 服务以及机器数据智能和解决方案的 DPaaS 服务。


视频云是七牛 MPaaS 的重要组成部分,MPaaS是以多媒体(图片、音频和视频)为介质,主要解决的是交互方式演进的技术挑战,并结合AI的能力,将交互方式变得更智能化、场景化。


视频云目前主要的产品有直播(PILI)、实时互动(QRTC)、视频监控(QVS)、低延时直播(Geek)等。


LiveVideoStack: 您如何定义高质量音视频?就您所观察到的,近几年用户对音视频质量的要求有哪些变化?这给后台的技术支撑带来哪些挑战?


陈辉:今年七牛云把音视频质量提高到一个非常重要的高度来对待,我先大概来说下这么做的原因:


一、用户对质量要求越来越高。对服务提供商来说,今天对质量体验有要求的发起者往往是最终端的用户而不是客户或者平台本身,因为用户对质量的感知是最直观的。随着音视频在生活工作中不断普及,大家对质量的要求也不仅仅限于能够顺畅观看、通话了,是否高清、是否省流量等都是用户的直观诉求。


二、基础设施不断完善。追求极致是每一个七牛云开发者的基因,随着网络质量、算力等不断提升,我们会力求每一个环节都能做得更好。所以在音画质量上,我们也有着更高的追求。


关于如何定义高质量音视频这个问题,这里不仅包含了客观的数据,也包含了很多主观的因素,确实不是简单的几句话能描述清楚的。我们今年一直在做的一件事情就是,如何以更客观、更准确的形式来反馈音视频的质量。这里不仅仅包括我们常见的运行时的抖动、卡顿、马赛克等情况,还包括了对画质、音质的评测数据,所以这是一个综合的指标。


LiveVideoStack:七牛云的音视频质量体验优化是如何进行的?由哪几部分构成?


陈辉:七牛云在音视频质量优化这个领域上是全方位去考虑的,这也跟我们如何定义质量有关系。我们不单单认为质量就是 QoS 或者 QoE ,我们认为这是一个综合的结果,并且质量是可以相对客观地用数字量化的。


所以在整个质量优化过程中,我们主要会分为如下几部分开展:首先很重要的是针对质量问题进行量化,我们用内部的质量评分体系去检测质量的变化和评判优化的效果(如果没有这个客观的工具,我们的评判周期就会变得依赖用户,这样会拉长我们的优化周期)。另外,针对这部分的优化,我们是全方位展开的,除了针对客户端、codec、媒体服务端等各个端采取一些优化手段之外,我们还会从更全局性的网络、资源、调度等方面进行优化。


每一次优化都会设置对照组,通过客观的评分,来确保优化效果是正向的。


LiveVideoStack: 客户采用H.265主要的应用场景是什么?成本和收益怎么样?


陈辉:QRTC 在技术实现上同时支持 H.264&H.265 标准,会综合“设备能力、设备类型、用户设置、具体应用场景”等条件,选择最佳编码器类型,对客户来说,并不需要费心具体是什么编码器,只需要聚焦在感知视频质量够不够好。


从我们的客户行为分析来看,所有对视频质量敏感的应用场景都会优先选择 H.265,譬如电商、教育等。


H.265能普遍提高 20%~30% 的压缩率,在某些高清视频上,甚至能达到50% 的压缩效率提升,也即是在相同的传输成本下,可以享受到更清晰的视频;对客户来说,“代价”只是用户设备终端的耗电量会大一些,一些低端设备可能没法使用,不过七牛云也正在逐步优化自研 265 来提升性能,总之其他事情放心交由我们七牛云来解决。


LiveVideoStack:如果是未来5~10年这样一个维度,您认为音视频技术领域还会有哪些大的变化?


陈辉:短期内我觉得 AR/VR 和 RTC 的结合已经是一个被公认的趋势了,这部分也将是我们接下来在产品和技术侧需要去商业化的能力。


另外,基于 AI 和 RTC 相结合的部分,也将会带来比较大的改变。比如基于 AI 的超分辨率音视频编码会被广泛使用,包括提取人声特征、提取文字、提取面部特征、骨骼动作等方式来替换传统的 codec,极大降低带宽。


LiveVideoStack: 作为一名经验丰富的音视频技术人员,对于想要入行的新人,您有哪些建议?


陈辉:一、首先是爱好吧,无论入门哪一行,我觉得兴趣是非常重要的保障,如果不能保持对这一行持续的热爱,很容易半途而废。


二、其次是耐性,音视频这个领域的入门门槛相对较高,而且很难速成,需要不断花时间下去钻研,特别是一些优化和找bug的过程是极需耐性的。


三、保持好奇心,多实践。我自己的理解,和传统业务工程不一样,在这个领域经验是非常有效的,多的实践带来的是经验的积累。遇到问题要经常冲到一线一起去解决,哪怕不是你的问题。


LiveVideoStack: 在9月份即将到来的LiveVideoStackCon音视频大会上,七牛云将发布音视频质量分析系统,您能简单介绍一下这个质量分析系统吗?它主要解决什么问题?


陈辉:其实在之前的介绍中也已经透露了,这个质量分析系统主要解决的问题就是如何客观地评价我们的音画质量。当然它还有更高阶的功能,它可以依据大数据和 AI 的能力做音视频的智能分析,反推优化质量需要做的一些操作。


我们做这部分的出发点也是为了更好地去提升平台自身以及客户的音画质量。未来我们还将开放出相关接口,让评分可以作为更多场景下使用的条件因子。


LiveVideoStack: 本次大会的七牛云专场上还有哪些精彩的内容?您可以剧透一下吗?


陈辉:本次七牛云专场会围绕着质量这个话题展开,我们会从客户端、服务端以及 codec 三个维度来阐述七牛云是如何保障我们的音视频质量。每个话题都是内部经验的总结,相当大一部分内容也是今年我们在技术上做的创新,比如上半年我们更新了我们的传输网络来提升质量,H.265的覆盖等等。更多的内容,敬请期待当天的大会!


LiveVideoStack: 好的,陈老师,谢谢您接受采访,期待您大会当天的演讲!


编辑 / Alex


还可输入800
全部评论
作者介绍

LiveVideoStack

音视频技术社区

文章

粉丝

视频

阅读排行
  • 2周
  • 4周
  • 16周