全球多媒体视频内容保护最佳实践

DRM
LiveVideoStack 2021年7月1日

随着后疫情时代教育全面转向线上、短视频和影视剧市场需求增加,音视频平台对于内容保护的重视更是前所未有。国内,5G的加持下,视频的消费蓬勃发展,用户付费习惯养成,如何增加和保护收益,成为各视频平台和在线教育平台的关注热点。本文来自爱迪德亚太区产品总监 施广在LiveVideoStack线上分享的演讲内容,从不同视频内容盗版手段出发和大家一同探讨了如何实现视频内容创作、分发和消费端到端的保护。


文 / 施广

整理 / LiveVideoStack


很高兴在这样一个时间和大家一起在这个论坛相遇,我今天讨论的话题是全球多媒体视频内容保护最佳实践。爱迪德是一个总部在荷兰阿姆斯特丹的公司,所以我们有一些全球的实践经验在这里和大家分享。


01

流媒体市场的发展


上图是互联网流媒体市场的增长图,左图是过去三年全球的增长状况,预计在2021有1800亿+美元的市场规模,而中国在2021年也预计有250亿+美元的市场规模,并且右图的中国市场是广告收入比用户付费订阅收入多,这是中国市场的一大特点。


疫情对我们行业有巨大的促进作用,从2020到2021行业总量增长迅速,驱动行业最重要的增长动力,归根结底是各种各样高质量的原创内容。可是互联网的开放性注定流媒体内容如果没有保护的话,盗版起来再传播简直就是病毒级别了。所以对高质量的内容保护尤其重要。而中国在这几年对内容的保护也越来越重视,尤其是今年上半年有一些很有意思的版权保护话题。


这是一些从网上找到的关于版权保护的话题,有关于长视频、中视频、短视频版权的各种说法,具体细节就不再多说。实际上在过去三五年,长视频平台之间的鏖战一直难解难分,除了芒果在财报上显示盈利,多数平台仍在亏损,这两年短视频异军突起加入战团,形式更加扑朔迷离。不管怎么说,长视频平台对版权保护理解、认识、关注和投入都是比较高的,我们也有目共睹。短视频平台也逐渐意识到对版权保护需求的重要性,包括像李子柒的视频,还有一些公众号、B站上的视频,也直接被搬走。长短视频的竞争在所难免,但上图说明版权保护是非常重要的,需要做长期规划,不管是长视频、短视频或者是在线教育平台,其实对内容的保护,都有共同的诉求和痛点。


毫无疑问,首先是保护平台的收益,高附加值的内容如果被轻易地就被盗版破解传播,那收入大幅下降,投入产出比极其不匹配。不管是和国外还是国内运营商合作过程中,我们都意识到的一个问题,版权方分销它的内容给平台运营商,其实版权方对版权保护的要求是非常苛刻的,无论是电影、体育赛事、游戏赛事等,在这种情况下,像我们爱迪德这样的内容保护供应恰恰能够提供一整套方案,似乎运营商觉得不是特别爽,因为需要一定的集成工作,但实际上是对它有很大价值的。那么防止内容非法下载、防止录屏、追溯盗版源等等这些都是达成共识的内容保护诉求。


接下来和大家分享一下我们的最佳实践,上图从左边到右边这是一个整个端到端的版权保护链。插入水印并被DRM保护的内容,通过运营商平台传播出去后,有可能被盗版者盗版。而我们内容被盗版者分发后,能做些什么事呢?我们可以从预防、检测、发现到下架去做一系列的工作。比如第一步是云端爬虫,可以24小时在网上搜索到盗版的内容,这是发现的过程。发现后需要去分析,有三个层次,第一是针对视频内容的指纹提取,第二个是水印检测,根据水印的检测结果,从盗版视频流中能检测出可以唯一识别盗版者身份的取证水印,有时候还有一些人工专家的分析过程,这是验证加元数据的过程,收集的这些数据可以作为涉及法律诉讼取证的证据,所以这些数据都是需要收集下来的。接下来则是与执法环节打通,主要是怎么样能够迅速找到盗版源头,发送相应的下架通知,与警察、法律部门对接,让盗版者停止盗版行为,尽快合规。最后是商业智能环节。我们刚刚梳理了一下,不仅仅是技术方案和手段,还有相关的取证、执法等流程,这是我们从实践经验检验来讲,有一个对端到端的版权保护的认识。


02

DRM数字版权保护


接下来我们来看一下DRM。DRM即数字版权保护,最简单理解就是视频流传输是加密的。如果内容是加密的,你势必马上会想到一个问题,这个加密视频流的密钥(Content Key)怎么传输呢?加密视频流的密钥最简单的形式就可以用clear的方式,也就是明文的方式传下来,用另外的一个相对应的请求和响应消息来承载,这也就是最简单的Clear Key Request的方法,显然不是很安全的。为了让加密视频流的秘钥安全的传输下来,就必须要终端服务器侧关于鉴权,互信和加解密的沟通交互。就是需要把content key 安全分发,这是最基本的概念。无论你是在什么平台上,即便是包月付费,也会有最新大片的付费点播,点播支付成功后系统会告诉你观看视频的有效时间段,以及开始第一次播放后只能在24小时内看完全部等等,所有的这一切都是内容分发的策略,这些也是DRM的范畴。除了content key加密了传输,还有一系列分发的策略也是被加密传输的。


回到上图,苹果有HLS协议,对应的DRM叫 FairPlay Streaming。FairPlay最早在乔布斯时代,大概1990年后,已经有针对音乐版权的保护了FairPlay。但是苹果公司在2015年推出了FairPlay Streaming的DRM技术,这个名称其实是强调自适应流媒体下的版权保护技术。它的原生的DRM技术和它操作系统和平台都集成的非常好,全是由苹果公司自己开发,整个生态链都是它来掌控的。


右边整个大框架是DASH,黄色的框是Widevine,Widevine是谷歌在2010年收购的一家公司,那个时候这家公司是专做DRM方案的,谷歌收购之后,Widevine被整合到安卓操作系统4.4以上之后,算是比较完善和稳定的。黄色的框内除了实体的设备,左上角用虚线框出来的Chrome、Opera、Firefox还有新版的Edge,是浏览器。这几个浏览器,也内置了Widevine,当然是软件方案。


图中右侧,微软也有类似的情况,有一些特定的设备是只支持微软的PlayReady DRM,比如说XBOX最新款或者PlayStation最新款。我们也参加了China DRM论坛,就是中国自主定义的DRM的规范,2019年已经升级到版本2.0了。华为公司作为设备厂商的代表,是ChinaDRM最大的的支持者,这是公开信息。华为的HarmonyOS和安卓操作系统都包括在内,已经有大几千万的手机设备都支持ChinaDRM了,而且是Hard Profile。我们刚已经说了Soft Profile通常在这个浏览器当中支持,Hardware profile是基于高安芯片或者TEE芯片等情况下支持的,很复杂,但是安全性更高。


对于现状来讲,国内排名靠前的几大的长视频平台,可能早就进行自研ChinaDRM系统和方案了,因为规范是公开的。但对于体量比较小,自研能力不是那么全的,包括新的在线教育平台,想研究新的技术,怎么把终端设备都覆盖到这是非常复杂的。恰恰有专业的公司来帮助这些运营商,把各种DRM技术适配到整个视频分发流程,也就是从流产生分发一直到终端侧平滑地播放,这个像我们这样的公司可以提供比较好的服务和价值。我们和苹果、谷歌、微软都有很好的合作关系,我们可以帮运营商把DRM技术对应的server端都集中统一代理起来,然后基于比如针对内容播放的策略,我们也可以迅速的提供集中灵活的统一配置和管理。


关于DRM技术和方案就谈到这,其实DRM解决了什么问题呢,比如说非法下载。但基于浏览器的DRM保护的视频流依然可以被拷屏,就是屏幕拷贝,因为这是基于软件方案的DRM技术,没有办法对抗屏幕拷贝。现在有很多软件随时都可以把屏幕拷贝下来,尤其是Windows平台下。那么这时候就用什么技术来应对呢,就是我们接下来要讲的水印技术。


03

视音频水印技术及应用


首先澄清一下,我们这说的水印是不可见的隐秘水印,它是可以为取证使用的。讲这个ppt细节前,先解释一下原理。水印其实是利用了信息论当中的一些变换理论,通常都是把时域信号转换为频域信号再处理比如离散余弦变换、小波变换等。总之是把一些信息量即二进制比特串,能够识别某一个特定个体的信息量,添加插入到视频信息流中。肉眼的视觉感知几乎发现不了,然后解决方案自己的监测平台却能够把它检测出来,这就是能够检测出WMID。


从水印插入的方式来区分,有两个大的方案,第一个方案是直接法,图上从左往右的清流有5个片段,有一个水印生成器,有多个特定的客户端,每个都有一个唯一的可识别的水印标识码,直接把这个水印标识码叠加到某一个视频帧或片段上,毫无疑问可以持续在不同的片段上叠加。你也可能会产生一些新的问题,这个插入水印的方案是从视频分发前做还是在设备终端播放时做呢,两种方案其实都可以,待会我们会谈到。


接下来是两步法。第一步,水印A/B嵌入器,换句话说是把原始的片段添加了一些A信息,再添加了一些B信息,A和B只是一个识别符,这样相当于视频片段被复制了两份,各自添加了A信息和B信息。第二步,是当终端侧来请求视频片段时,水印片段切换器会根据终端侧某一个唯一特征值,如临时生成一个二进制比特串的WMID,从时间的维度上去选择究竟给终端输出A片端还是B片端。比如第一位终端消费者发送了视频播放请求,最终带上的水印ID是00110,那服务侧就会选择做好的信息A和信息B,按照时间顺序和水印ID挑选相应的A/B,以此类推。换句话说,每一个用户他请求的视频流,从时间维度一拖长,就已经是一个个性化可以唯一识别的视频流,所以这是A/B片段法的基本介绍。


因为水印是隐秘透明的不可见水印,除了这我们马上要讲的健壮性,还有对视觉的影响,这也有一些主观和客观的考量。国外有这种专门的检测,视力敏感度超出常人的检测者,可以看出来到底你的视频变了没有,还有一些客观的标准,比如说峰值信噪比等等。但更麻烦的一点的是健壮性,因为有各种各样的攻击,不管你这个攻击是恶意的还是非恶意的。比如说最简单一种情况压缩、加噪、转码、这些都是在正常的视频处理操作过程都会发生的事情。这些操作都有可能对添加的水印信息量进行损耗和衰减,导致检测的时候没法检测出来。中等程度攻击就更难一些了。最后需要强调一下的是恶意攻击或者说共谋攻击,以帧交织攻击为例,如果有盗版者结伙,共同盗版同一个片子,把视频拿到后,再重新切片并组合。比如第一秒用盗版者X的片段,第二秒用Y的片段,总之,假设有五个共谋盗版者,这五个人将各自的视频帧片段按照时间序列随机组合一下,这时这个新生成的视频流提交到原来检测的平台上去,就非常难检测了。尤其当这个共谋者数目越来越多时,检测的难度急剧增长。当然这是一个理论性的概念,实际上这种攻击在我们全球的实践中确实有过,但是共谋者人数不多。覆盖攻击也是类似,把几个共谋者的视频按时间同步叠加到一块,求一下平均,生成新的视频流。马赛克攻击是指把可能是九个共谋者各自的视频分成九宫格,第一个宫格放A的小视频块,以此类推,随机重新拼出来一个视频流,水印信息可能也检测不出来了。总之水印方案听起来原理比较简单,但要做好还是很复杂的,在这一点上,业界的厂商都有各自的方案。


刚刚我们讲了最基本的原理,接下来具体介绍一下落实到实际应用的方案。左边这张图是分销商水印,也就是在视频后制和分发阶段,给分销商分销的时候添加水印。比如说好莱坞大片制作出来之后,片商他去在不同平台,比如爱奇艺、腾讯、优酷发布时,这些运营平台就是片商的分销商。我们的方案能够在大片里面添加一个针对分销商的唯一标识的水印,从而能在后期检测到泄露或盗版的视频流是从哪个平台下泄露的。这个放啊的目标客户是谁呢,是卖给影视制片方、影业工作室、发行公司,比如像好莱坞片商,也比如想阿里、腾讯他们都有影业,他们的影业公司就需要这种方案。给平台、在线教育运营商的方案是右边的OTT水印方案,Broadcast方案在中国几乎可以忽略了。这个方案的目标用户就是流媒体服务运营商和付费广播电视运营商,它能够从众多的消费者中识别出某个特定订阅用户进行了内容的盗版的违法行为。左右的两个方案体量不一样,左边是给好莱坞制作的大片添加分销商水印,比如最近的《速度与激情9》马上就要开播了,全球分销商加起来大概100个,所以添加的水印标识是以百来计量。右边的方案,对一个运营商平台,例如爱奇艺、腾讯,单个平台的付费超过一亿,那么添加的水印量就要以亿来计量,这是完全不同的两个方案。


接下来我们看一下具体的情况,分销商水印是借用了云服务,其中里面用到了IBM的Aspera,这是高级协议,它比FTP或HTTP传输要快好多倍。总之我们有个云服务,不同的分销商来请求下载影片时,云服务可按全球策略或个性化配置,把水印都加上去,水印添加完后马上就可以分发了。其实版权方或发行公司去分发内容的时候也是在最后一刻才放出片源,最后一刻留给分销商的时间也很短,势必有一个快速下载的过程。所以我们和IBM Aspera Cloud合作做这样一个方案,满足了快速安全下载的诉求。方案的优势很明显,就是快速部署、简单易用、不影响用户体验。


OTT方案刚刚也说到了一些,它可以适用于UHD点播内容或者Live,都可以做,用户内容全面可控,同时又有很好的健壮性,刚刚针对分销商的方案我们是不考虑共谋攻击的,因为那个水印的量总共也就100个左右,100个分销商去共谋可能性不大。但这种OTT的方案就必须要有前面提到的防止恶意攻击的考量。


04

最佳实践案例解析


接下来是用户案例的分享,这是2019年11月9日,我们帮助一个OTT运营商做的直播赛事的全套保护,罗根保罗与KSI这两个其实不是职业拳手,而是YouTube上的超级网红,他们都有两千三百万左右的粉丝。其实2018年他们就作为业余拳击手打了一场拳击赛,这次以职业拳击赛的形势在某一个流媒体平台直播的时候,必须是至少花费20美金的包月用户才可以观看。在这种情况下,我们怎么对实际场景做保护呢?这个案例的方案其实同时也适用于其他直播赛事,包括目前正在进行的欧洲杯。我们来看看细节。


这块针对直播反盗版的案例和我们前面讲的最佳实践内容其实是类似的,我就不再重复,唯一需要强调的是,针对直播赛事,我们水印方案有一个要求,就是能够快速检测出来盗版视频的源头,否则这场拳击赛,打的时候快得很,三局就结束了,总共持续了一个小时,检测速度不快的话可能直播结束了还没检测出来,那么方案是失败的。这是直播和VOD点播的水印方案的一个区别。


赛事前服务,针对可能出现盗版的名单,都要提前做一些工作,这样在赛事的时候就更有针对的去抓取,而且还要把拥有分授权的平台白名单拿出来,定义好交互规则。另外我们的方案还和YouTube自己的内容识别系统和Facebook的版权管理进行对接,同时要把搜索引擎中的结果提前删掉,极大提高获取盗版内容的门槛。


直播时,解决方案的爬虫就要开始扫描盗版网站、Kodi、社交媒体网站等等。自动分析的内容前面也有提到。国外的盗版者想要触及消费者来推销自己的盗版流的话,社交媒体的推广和宣传是非常重要的渠道,所以YouTube和Facebook是我们关注的重点,就和微信是国内推广和宣传渠道一样。然后我们的方案检测并发现问题,能够自动执行直接下架操作。比如说CDN,我们和CDN也有合作,CDN收到我们的确凿盗版证据和下架通知后,CDN就可以把这个盗版流立即掐断。


赛事后的服务,我们要总结所有的原始数据包括相关的信息、托管网站、链接网站,包括水印检测、取证包、搜索引擎降级、持续更新等,这块当然包括我们刚讲的DRM方案的应用,DRM在整个方案里面都是必备的,在这个DRM之上我们加了视频水印以及一整套盗版监控和检测系统,形成一个闭环。


这是爱迪德反盗版监测系统的门户,门户能够提供各种各样的关键信息,包括是否合规,社交媒体上相关的百分比,以及对应链接网站和托管网站的情况等等。这些都是可以实时刷新的,就是因为有爬虫,有我们的盗版检测系统和水印检测系统等持续不断的动态输入,把所有的即时数据都呈现在这。


下面,很快地看一下整体方案的ROI,这是实际案例的数据,KSI和罗根-保罗的这场对战在国外社交媒体上观看了被下架的盗版流的人数是214,092人。而在24小时内,在浏览器搜索“免费流”的关键词有93,089次,这两个加起来潜在的可以付费观看的用户大概是30万。图中将这30万用户作为潜在用户,分别计算这场赛事1%、3%、5%转化率下的投资回报。可以看出投入产出比是相当高的,从运营商的角度运用这套系统是非常重要和有价值的。


最后就是爱迪德公司的一些关键业务数据,过去一年我们保护了223亿条OTT视频流,我们其实提供了各种DRM服务端的云托管服务,全球覆盖,遍及各大洲,具体的DRM技术包括FairPlay、Widevine、PlayReady,ChinaDRM也有一点量。我们保护超过累计60亿台设备和应用程序,我们有核心专利技术,能够对设备及应用程序做保护。迄今为止我们的在线爬虫检测出45亿次侵权行为,目前所有的数据目前都是在国外的,同时我们代表版权方发出了2.8亿次通知。


爱迪德目前主要服务两个大的市场,左边是视频娱乐行业,相关数据都在上面就不多重复了。新的业务方向是物联网的安全保护,包括车联网等。爱迪德是一个总部在荷兰的公司,至今已经有52年的历史,目前在全球14个城市建有办公室,在北京也有办公室,为亚太区的中心节点。


这就是我本次分享的全部内容,谢谢大家。


Q&A:


Q: 相较于数字水印方式,视频指纹生成需要计算和处理的数据量会特别大么?


Mike: 有可能。我们并没有做指纹,而是与第三方厂商合作合作。我们认为这一部分与加密、解密高复杂的技术相比并不是最核心的,所以选择了和第三方厂商合作。当然,我的理解不一定准确,我觉得水印处理方式计算量会比指纹更大。


Q: 这么多视频加水印不需要编码解码吗?性能能承受吗?


Mike: 针对OTT水印,这里有两种方案:服务端水印、终端侧水印。终端侧水印没有细讲,这个方案是指在Media player这一部分把水印信息加上,但这必须要求在安全环境内(如TEE)来做。在服务器端,通常水印A/B片段切换会选择关键帧而不是所有帧。举个例子,通常一个片子加了A/B水印后在CDN最终大小会多出3%到5%。这里就需要权衡,寻求一个动态的平衡:如果处理不当,检测速度不够快;水印信息添加加得多了虽然容易检测,但CDN存储也占用更多空间,都是成本。


至于性能能承受,针对直播中的恶意攻击或共谋攻击确实没法做。VOD高价值影片的网络传播是毁灭性的,针对VOD更多的是在服务器端提前做好水印添加,在A/B选择时对终端消费者、对CDN性能要求并不高。


Q: 通过光学仪器进行转播的盗版能否解决吗?


Mike: 这叫翻拍,是必须需要解决的问题。我们将翻拍列在简单攻击这一类别(不一定准确),所谓简单就是说日常操作过程中可能发生的,所以这种情况是可以解决的。


Q: DRM 的数据被保护了, 如何盗取 转发?不能录像,不能截图。如果使用另外一个设备录制,那么另外一个设备再录制,水印还在么 ?


Mike: DRM数据/视频流被保护,纯硬件方案会使得盗取、截图转发很难。但纯软件DRM方案指浏览器的播放,浏览器的播放在Windows上有一大堆录屏软件,因为Windows平台开放性好,这些录屏软件可以很好的录屏。如果使用另一个设备录制,再使用另一个设备再录制确实会存在一定问题,实际情况下再录制如果清晰度能够保证,就是说转录设备都是静止稳定拍摄的,这时检测成功率相当成功。但如果是手拿着,如上所说,A/B变换,添加到关键帧,手抖一下有可能会对水印有很大伤害。但是,手又抖对视频拍摄效果不好,质量也在损失,自然盗版的价值价值大大降低,这一块也是平衡。


还可输入800
全部评论
作者介绍

LiveVideoStack

音视频技术社区

文章

粉丝

视频

阅读排行
  • 2周
  • 4周
  • 16周