QoS和QoE初学者指南

LiveVideoStack 2022年5月23日

翻译:Alex
技术审校:曾凯
本文来自OTTVerse,作者为Jan Ozer。

Easy-Tech #027#

各类公司发行视频的原因有很多,有时是作为公司产品,有时是为了销售或者营销另一种产品,有时是为了培训或交流。无论动机或者商业模式如何,你的视频只有在观看体验良好时才会发挥最大效用。启动时间长、缓冲多、质量差的视频以及播放器崩溃等原因都会破坏用户体验和减少观看时间(无论是对于视频还是你的整个平台)。

大多数关于用户体验的讨论主要围绕两个术语:QoS(Quality of Service,服务质量)和QoE(Quality of Experience,体验质量)。虽然相关,但它们却是两个独立的概念,并以完全不同的方式进行衡量和使用。

本篇文章从宏观角度向大家介绍QoS和QoE。我会先从它们的定义开始,然后讨论它们之间的关联。接着,我们再来简单了解公司如何衡量和使用QoS和QoE。

什么是QoS和QoE?

那么究竟什么是QoS和QoE? 根据ITU的描述,QoS是指“电信服务的全部特性,这些特性与该服务是否能够满足用户明确和隐含需求的能力有关”。在这个定义下,QoS衡量视频传输基础设施的性能,包括第三方或者内部CDN、跟踪数据(如总体吞吐量、延迟、错误率以及缓存命中率)。

相比之下,ITU对于QoE的定义是“终端用户主观感知到的应用程序或者服务的整体可接受性。它包括完整的端到端系统效应(客户、终端、网络、服务基础设施等),有可能受到用户期望和环境影响”。所以QoE直接衡量用户体验,包括播放成功、起播时间、重新缓冲以及视觉质量等因素(编码和解码时)。

图1显示了QoS和QoE是如何相互关联的。如你所见,左图是通过编码和打包准备内容,接着文件被移交给传输基础设施进行分发,此处由QoS来衡量。一旦在观看位置被接收,视频便被解码,并在播放器中观看。正如图片所示,QoE包括了完整的端到端体验,而QoS衡量的是中间的分发部分。

图片

图1 QoS和QoE如何相互关联

很明显,网络性能对于好的QoE十分关键。但其他如视频源质量、编码质量、打包完整性和视频观看环境等因素也同样重要。在手机上创作看起来很棒的内容是一回事,但是能生产和交付显示在你客厅中85寸LED电视上的内容却是另外一回事。

你可能拥有很棒的QoS但很差的QoE,比如,当源材料质量很粗糙或者播放器由于错误逻辑没有切换到最高质量的ABR视频流。你还可能拥有高质量的QoE和低质量的QoS,比如,网速足以准时传输视频,但是缓存性能很差,这就增加了带宽和分发成本[1]。所以想要全面了解情况,你就必须一起衡量QoS和QoE。

[1] 审校者注: 这里翻译的没问题,但是作者的这个例子举得不好,是没办法说明高QoE低QoS的情况的。其实这种情况的概率不大,QoS是基建,低QoS大概率会导致低QoE,这也是为什么在过去的几十年里,人们一直用QoS来代表QoE。实际中,一种低QoE高QoE的情况是:网络丢包率比较高,但视频的编解码段做了很好的误差纠错和隐藏,比如WebRTC的情况,QoE还是可以达到用户满意的效果的。

如何衡量QoS?

所以如何衡量QoS呢? 一些系统为了监测便在系统之间的网络上安装了探测器。这些探测器可以是硬件设备或者软件程序,被安装在遍布互联网的服务中心里,用来监测从某个或者多个源站到某个目的地或多个目的地这一过程中的流量。图2显示了Telestream的Surveyor产品,其中各种位置之间的探测器由surveyor theodolite(三脚架)表示。

所以,如果你想要监测内容准备前端和核心网络之间的性能,你就要在核心网络安装探测器。如果你想要监测核心网络和边缘网络之间的流媒体服务,你就要在边缘侧安装探测器。你可以通过这些探测器确定传输问题的位置,从而确定问题的源头。

其他系统通过在自己的播放器安装软件跟踪QoS,对于QoE来说(我们接下来会讲到),这是最常见的部署方案。

图片

图2  Telestream Surveyor 安装探测器来测量生产和交付基础设施的关键组件之间的数据流

你应该跟踪哪些QoS指标?产品和服务提供商不同,指标也不一样。但是像吞吐量、码率、延迟、抖动和丢包等指标都会被各厂商跟踪和对比。

如何衡量QoE?

QoE通常通过播放器中的插件测量,这些插件将性能数据报告给中央数据库进行分析和呈现(图3)。不同的服务提供商使用不同的方法提取数据和跟踪数据。

图片

图 3  NPAW跟踪播放体验的YOUBORA插件

两个权威组织已经给出了关键数据点。流媒体视频联盟(Streaming Video Alliance)所给出的关键指标是:视频起播时间、缓冲比率、平均媒体码率和视频启动失败(表1)。

指标描述
视频起播时间从播放事件开始直到网络传输的视频的第一帧被渲染所用时间。注意:预加载的Splash视频的显示与此指标无关。
重新缓冲比率
观众体验重新缓冲的时间比例\[即当视频因为缓冲区下溢而非用户的直接干预(快进快退或者暂停视频)而停止播放时\]。

比率计算:总体重新缓冲时间除以总体播放时间与总体重新缓冲时间之和。

在特定设备上,不太可能从测量到的重新缓冲时间中排除快进快退时间。为了使其在所有设备上具备可比性,可以计算一个单独的指标,其中包括每台设备的快进快退和暂停时间。还可以对每台设备进行测量以保持这些指标的可比性。
平均媒体码率(每秒多少比特)平均码率就是每个播放session所下载视频块的综合平均比特率,一般以Mbps或者Kbps为单位(本描述来自审校者)。
视频启动失败(是或否)当第一个视频块在播放事件开后的截止时间(10秒)内未完全交付时。

表1 流媒体视频联盟(SVA)所给出的关键QoE指标

美国消费技术协会(Consumer Technology Association)推荐监测播放失败、起播时间、播放暂停、码率、播放器故障和其他指标,包括广告插入和许多其他播放器和视频播放数据点,如播放器宽度、视频分辨率。任何想要从跟踪数据中获取数据点的人都应该查看这两个文档。

QoS和QoE的系统功能

QoS和QoE系统具有哪些功能?功能之一:当分值下降到低于一定水平,就会发出警告。请看图4,该图显示了TestTree的OTT监控探测器。技术人员通过此功能可以跟踪所有可用频道,并在性能下降到低于一定阈值时迅速识别,你可以看到底部两排视频出现的红色警告。通常情况下,这些警告会发送电子邮件或者文本通知,所以你不必时时刻刻监控视频以发现问题。

图片

图4 TestTree的监控探测器显示了三个频道出现的问题

一旦发出警告,服务提供商就能在用户出现糟糕体验前,诊断和解决问题(通过使用不同的CDN)。很多QoS和QoE系统能够根据性能数据自动转换CDN或者支持手动转换。

QoS和QoE系统提供必要的数据以便在不同级别上对比各类产品和服务提供商。比如,如果你使用了几个不同的CDN,你可以跟踪关键性能指标的数值,比如每个CDN所达到的吞吐量、平均传输码率等。你可以使用数据对比不同厂商的价格/性能,识别潜在问题,和(或)控制每个服务提供商应该分配哪些客户。

很多大型QoE和QoS服务提供商还可以提供特定行业的数据,所以你可以将自己公司的性能与其他处在同一地理区域并分发同样内容的公司进行对比。当你能够知道竞争对手的优势和劣势,并以此提升自己的服务时,这些数据就显得尤为宝贵。

正如我在文章开头所说,无论你通过哪种方式使视频流媒体获得收益,最有效的方式就是良好的观看体验。而确保观看体验的唯一方法就是跟踪和监控与你的视频交付相关的QoS和QoE数据。

作者简介:

Jan Ozer,流媒体技术专家。Jan一直致力于为专业人士提供流媒体技术培训、编码测试服务等。你可以在:

https://courses.streaminglearningcenter.com/ 上了解和学习他的课程。

致谢:

本文已获得作者Jan Ozer授权翻译和发布,特此感谢。

原文链接:

https://ottverse.com/beginners-guide-to-video-qoe-and-qos/

还可输入800
全部评论
作者介绍

LiveVideoStack

音视频技术社区

文章

粉丝

视频

阅读排行
  • 2周
  • 4周
  • 16周
热门视频

用互联网发展视角看元宇宙创新

龙明康/AI工程院常务副院长

单目3D人体姿态估计的挑战和探索

宋波/人工智能高级工程师