LiveVideoStack » 技术标签 » LiveVideoStackCon 2018

视频直播体验优化

本次分享将着重介绍全平台差异化直播能力的统一与完善设计方案，以及从视频画质、流畅度、音视频同步、弱网条件下开播以及连麦质量等几方面核心技术指标提升策略。

LiveVideoStack

QoE 直播连麦 LiveVideoStackCon 2018

百度媒体云智能编码技术实践

短视频、小视频行业蓬勃发展，各个平台之间的竞争更加激烈，提升视频质量、降低带宽成本，成为每个平台提升竞争力的重要手段。在本次分享中，将对百度云智能编码技术进行深入介绍。结合该技术在百度APP视频FEED、好看视频、全民小视频中的应用实践，进一步介绍AI技术在云转码中的应用探索。

LiveVideoStack

视频编解码 AI LiveVideoStackCon 2018

魔镜：使用无监督式学习来辨识Twitch用户社区中繁复多样的网络状况

作为一个国际性的互动直播平台，Twitch服务的观众分布在世界的很多国家，从而具有千差万别的网络状况。这种差异性给我们试图提高服务质量亦或是发布任何前、后端的新功能都带来巨大的挑战。所以说如能建立起一个用户社区典型网络状况的知识库，那将对我们优化观看体验以及缩短软件部署周期都具有非同一般的意义。根据平台收集到的海量播放质量指标，我们提出一个无监督学习的方法先对播放行为进行分组，因为每一个细分的播放行为集群都代表一类网络状况。下一步是用仿真和配对的方法来模拟出符合每种播放行为的网络模型。最后我们试图利用仿真出的结果来开发针对移动网络用户的ABR播放算法优化，同时加速它的灰度发布。

沈悦时

AI ABR LiveVideoStackCon 2018

基于英特尔架构的实时视频流分析系统的设计与优化

随着实时媒体流分发技术的发展，在医疗，监控，社交和教育等领域，对多媒体数据进行基于深度学习的实时视频流分析的应用场景日益丰富。端到端的实时视频流分析涵盖视频流接入，视频编解码，视频帧前后处理以及深度学习网络推导等一系列流程，流程的复杂性以及深度学习网络调优的需求极大提高了实时视频流分析应用的门槛。为解决这一问题，面向WebRTC的英特尔协同通信开发套件设计了一个端到端的全流程实时视频流分析系统，它具有分布式可扩展的特性，同时实现了基于英特尔平台全加速，并提供了用户对深度学习网络的自由定制，帮助开发者使用极简的代码快速实现符合自身需求的高效实时视频流分析应用。本议题会对该系统的设计原理和优化方法以及所涉及的组件进行详细介绍，同时也会简要介绍其应用开发方法。

LiveVideoStack

AI 视频编解码 WebRTC 网络传输 LiveVideoStackCon 2018

AI在视频增强中的技术以及应用

随着全民直播时代的到来，主播对视频质量和创意需求增多，由此产生了视频增强技术的巨大需求。基于360在视频领域的开发经验和技术积累，本次分享为大家介绍人工智能在视频增强中的技术以及相关应用。在算法层面，主要向大家介绍在移动平台中，应用人工智能技术解决人脸，手势，肢体识别等问题，以及相应的技术挑战；其次在应用层面和落地场景中，应用face 贴图，手势特效，人脸美颜，背景抠图等对视频进行渲染和增强，让我们的视频更加生动和有趣。

LiveVideoStack

AI 视频增强人脸识别 LiveVideoStackCon 2018

以质量三维论持续推进腾讯视频播放体验提升

作为承载日播放量几十亿的流媒体移动端平台，腾讯视频持续通过技术体系建设及细节的匠心打磨为每天亿万用户提供优质服务。充当高品质内容资源和高质量用户体验之间的连接器，我们以移动端播放框架的系统梳理为先导，打通前后台的整体升级与提升，逐步建立了「三维论」思想来持续推动我们的工作。此次分享就给大家带来我们在这方面的方法论沉淀与总结，全景式展示腾讯视频的播放体验优化工作。

李大龙

视频编解码 LiveVideoStackCon 2018

KSC265全链路解决方案及演进

2018年，短视频行业日益火爆，移动直播行业走向成熟，众多视频公司在美国或香港敲钟上市。如何进一步提高用户播放体验和降低运营成本，成为视频从业公司急需解决的两个核心问题。通过提供全链路、全终端支持H.265编解码的解决方案,帮助用户成本节省50%，内容覆盖超过30%，金山云和业界同仁一起不断推动视频行业迭代更新和发展壮大。

LiveVideoStack

视频编解码 H.265 LiveVideoStackCon 2018

面向QoE的感知视频编码

近年来，随着智能终端的发展以及在线视频等新型业务的普及，无线网络中所传输的图像视频数据量呈爆炸式增长的趋势，网络带宽供求矛盾日益尖锐。视频编码理论是突破无线网络带宽瓶颈的重要途径之一。传统编码理论一直沿着数字信号处理的思路演进，难以突破“边际效应”。事实上，当前终端计算能力飞速发展，为解决带宽供求矛盾提供了契机。因此，另一种新的研究思路是从人类视觉感知模型出发，利用机器学习的计算工具，在视频大数据驱动下构建人类视觉感知模型，面向人类用户体验（QoE），研究基于视觉感知模型的视频编码关键技术，以智能媒体协同计算换取无线视频通信带宽。本报告将介绍徐迈课题组在面向QoE的感知视频编码方面的工作，主要包括：（1）基于关注点大数据的视频显著性感知模型；（2）基于感知模型的视频压缩方法；（3）基于深度学习的HEVC视频编码优化；（4）数据驱动下的全景视频质量评价与编码优化。

徐迈

视频编解码 AI 感知编码 HEVC LiveVideoStackCon 2018

HEVC标准在客户端上的快速实现方法的研究

从13年HEVC正式成为国际标准以来，业界人士都在为HEVC的普及做着不懈的努力。H265为提升压缩的效率，计算复杂度相对于H264而言增加了不少。因此在一些计算资源受限的设备上（如手机端）实现HEVC的实时编解码能力面临着很大的挑战。本次演讲的主旨是向大家分享下手淘在客户端侧实现HEVC实时编解码能力的探索之路。

李晓波

视频编解码 HEVC H.265 LiveVideoStackCon 2018

基于 WebRTC 架构的直播课堂实践

互联网流媒体的演变经历了3个不同的时代，如今在低延时流媒体充斥互联网的时代，在线教育如火如荼的发展。七牛云在线教育行业总监为你诠释基于WebRTC的直播3.0时代，为所有人带来低延时技术的革新与突破。实际案例分析结合大数据AI，横向打磨教育产品。讲解底层WebRTC的优势，打造共赢共创的行业优势。

LiveVideoStack

WebRTC 低延迟 LiveVideoStackCon 2018

基于FFmpeg的运动视频分析

视频分析有着广泛的应用空间和前景。本次演讲将介绍基于FFmpeg的运动视频分析。从一个足球赛事直播的典型体育场景出发，系统地介绍英特尔视频分析的软硬件解决方案。

张华

FFmpeg 视频分析 LiveVideoStackCon 2018

视频编码质量评价及如何寻找质量甜点的方法初探

本次演讲主要内容分为以下几个方面：1.研究实时视频时间维度质量，并提供了评测时间质量的算法；2.研究实时视频空间维度质量，提出了特定编码器的分辨率、码率和质量之间的规律；3.寻找视频质量甜点，通过数学建模计算特定资源条件下的最佳质量配置（甜点）。

钱晓炯

网络传输视频编解码 LiveVideoStackCon 2018

跨国应用场景和即构实时网络的调度系统架构设计

随着技术和模式的成熟，中国互联网出海正有趋势变成常态。有两种出海的模式比较有代表性：其一、在线教育，把海外优质的外教资源通过实时音视频课堂的方式来服务国内的学生；其二、视频社交/直播，把在中国经过验证的技术和玩法copy到东南亚、中东和北美等地。这两种模式带来跨国的应用场景，跨国网络的复杂性、不稳定和高丢包率对即构实时网络的实时性和流畅性提出更高的挑战。在跨国实时网络中，调度系统的作用十分关键，它不但负责第一公里，节点间传输和最后一公里的调度，还负责就近接入、负载均衡、智能选路和动态路由等重要任务。在调度系统的全局控盘之下，跨国实时网络保障了连通率、稳定性、实时性和流畅性，为跨国在线教育、海外视频社交/直播等业务的快速落地提供了无形而强大的云计算平台。本次演讲将会从两种模式的应用场景切入，探讨实时网络调度系统的部署、架构设计、挑战和应对策略。

冼牛

网络传输丢包补偿负载均衡 LiveVideoStackCon 2018

三体云视频抗抖动演进之路

从引起视频抖动的根源入手，为开发者们普及视频抗抖动的相关内容以及三体云视频抗抖动解决方案。

LiveVideoStack

LiveVideoStackCon 2018

爱奇艺版权保护技术与维权实践

本演讲分「发布之前」、「分发播放」、「盗版追踪」、「维权处理」四个环节介绍爱奇艺的各相关技术系统以及具体应用情况，分享相关思考以及可能的挑战。包括爱奇艺DRM、爱奇艺视频指纹、视频水印、网盘联动以及若干实际案例分享，本演讲也会包括一些爱奇艺相关数据的分享，借以分析版权保护技术及其应用对爱奇艺商业模式的影响。

陈赫

DRM 视频水印 LiveVideoStackCon 2018

视频加密和DRM的实施实践

掀开视频加密和DRM的神秘面纱。介绍视频加密的原理，以及在视频处理全链路中各环节的保护机制。介绍DRM实施中遇到问题和解决方案：如何在谷歌的Widevine、苹果的FairPlay、微软的PlayReady等DRM方案中进行选择。如何兼容各种类型终端的播放。如何优化云端服务的计算和存储等。

LiveVideoStack

DRM 视频加密 LiveVideoStackCon 2018

解密GPU：视频转码与分析加速

本分享作为一份GPU视频处理技术调研报告，探讨了GPU对视频编解码、图像处理和视频分析的支持，提供了详实的性能评测数据，为技术选型用户采纳与部署GPU提供技术依据与路线，并为有GPU编程经验的用户提供前沿、全面的进阶信息。

季光

GPU 视频处理视频编解码 LiveVideoStackCon 2018

FFmpeg 硬件加速的现状与将来

FFmpeg作为最为流行的多媒体基础库之一，最近这两年来，FFmpeg社区在硬件加速方面做出了大量的努力，使得FFmpeg正逐步演化成一个支持跨平台，跨OS，跨硬件厂商的通用硬件加速方案，本报告将综述FFmpeg在主流硬件平台/OS上的硬件加速方案的当前进展，详细讲解FFmpeg基于Intel全开源的硬件加速方案上的种种努力，以及展望FFmpeg在硬件加速的一些其它的可能性。

赵军

FFmpeg 硬件加速 LiveVideoStackCon 2018

From VP9 to AV1 and beyond

Google embarked on the WebM Project in 2010 to develop open source, royalty-free video codecs designed specifically for media on the Web. The second generation codec released by the WebM project, VP9, is currently served by YouTube, and enjoys billions of views per day. Realizing the need for even greater compression efficiency and to cope with the ever-increasing demand for video on the web, Google joined a consortium of major tech companies called the Alliance for Open Media in 2016, and started an ambitious project to develop a next generation royalty-free codec AV1. AV1 was finalized in June 2018, and achieves about an one-third reduction in bandwidth over current generation codecs VP9 and HEVC at a practical hardware and software complexity. This makes AV1 the most advanced video codec available today that is also royalty-free. In this talk, I will provide a technical overview of the most innovative coding tools in AV1, followed by coding results on standard test sets compared against VP9 and HEVC.

LiveVideoStack

AV1 VP9 视频编解码 LiveVideoStackCon 2018

AI硬件中的声学问题剖析

人工智能产业领域的技术着眼点会更关注神经网络和深度学习算法以及数据，但是随着技术的落地，不可避免的要涉及到硬件产品的基础体验问题。而由于使用场景、使用方式的差异，以及人际通讯和人机对话的技术要求差异，使得人工智能硬件和传统具有音频功能的硬件又有所不同。本次分享拟从声学硬件系统的角度来剖析声学信号处理算法、声学硬件指标及相关技术对于语音交互体验的影响。

邓滨

AI 音频技术 LiveVideoStackCon 2018

视频质量评价——从裁判到教练

视频质量评价(VQA)是视频服务系统中的重要技术要素，贯穿成像、编辑、处理、编/转/解码、渲染、显示等整个视频技术链条。理想的VQA模型接受一个输入视频/图像，能够定量地计算出一个质量分数，真实地反映出观看者的体验。本报告给听众带来如下三方面的内容：1、介绍VQA的技术图谱和工业标准；2、VQA在视频服务流程中的管理技术，包括VQA建模、工具部署、业务应用；3、VQ驱动的视觉感知编码技术、视频增强处理技术。

宋利

画质评定视频编解码感知编码 LiveVideoStackCon 2018 宋利，

无参考图像视频质量评价

无参考图像质量评价中面临的一个重要挑战来自图像内容的多样性。当前的无参考质量评价方法在跨内容图像对的相对质量预测中与人类主观视觉感知不一致。考虑到预训练好的图像分类模型中包含有区分度的图像内容信息，为了解决上述问题，我们提出了一种基于语义特征聚合的无参考图像质量评价方法。具体地，首先我们将图像划分为多个重合的图像块，以包含图像的全部信息以及避免引入额外的几何失真；其次，使用一个自适应程序选择最合适的深度特征来表征图像的内容失真信息；然后，使用统计方法对所有图像块对应的局部特征进行聚合得到代表整个图像的全局特征；最后，一个线性模型将图像全局特征映射到图像质量分数。所提出的新方法与13种代表性的方法在7个常见的数据集中进行了广泛的比较。实验结果验证了我们的方法的优越性能和良好泛化能力。与此同时，这也表明了深度语义特征在无参考质量评价中起到了重要作用。

LiveVideoStack

画质评定 LiveVideoStackCon 2018

视频编码器对比与选择

视频编码器是各类视频服务的核心组件，很大程度上决定了视频编码的效率甚至整个视频服务的质量。当今业界各类视频编解码标准、视频编码器层出，如何选择编码器成为了一个非常重要的话题。然而在实践中，视频编码器的对比中有大量的误区，经常导致不准确甚至错误的结论。本次分享会以Hulu的业界实践为基础，分享对视频编码器进行客观准确对比中的经验。

傅德良

画质评定视频编解码 LiveVideoStackCon 2018

手机K歌的人声伴奏对齐优化实践

人类大脑对声音的响应速度和敏感程度非常高。K歌时对人声音轨和伴奏音轨的时间对齐有很强的要求。本次分享将主要介绍手机K歌在混音时间对齐方面存在的问题，常规的工程解决方案以及值得探索的方向。

LiveVideoStack

音频技术 LiveVideoStackCon 2018

微博客户端播放器的演进之路

微博客户端短视频业务的发展迅速，最近几年的播放量翻了几十倍。为了承载如此大的播放量，客户端视频播放器为了更好的支持视频业务的发展，围绕着快速上线、快速启播、成本节约、稳定性等问题进行了持续的优化。未来我们希望播放器具有用户环境的感知能力，根据用户的环境提供更好的播放体验。演讲嘉宾

刘文

播放器客户端前端 LiveVideoStackCon 2018

基于WebRTC的互动直播实践

互动直播已经成为直播的主要形式，本次分享将介绍INKE自研连麦整体设计思路；介绍如何基于WebRTC搭建互动直播SDK、介绍对回声消除问题的处理、对实时传输的优化；介绍为保障互动直播QOS而开发的优选、埋点、问题分析等系统；介绍对互动直播相关前言技术的探索等。上述互动直播系统，已经上线运营并达到了很好的效果，供实时音视频相关同行参考。

LiveVideoStack

WebRTC QoS LiveVideoStackCon 2018

音乐场景下的实时音频解决方案

本次演讲内容主要分为以下几点：1. 一般 VoIP 框架的组成，各个模块的功能介绍，以及常见的坑有哪些； 2. 在高清音乐场景下面，普通 VoIP 框架面临的痛点；3. 云信高清音乐场景方案的大致介绍。

李备

实时音视频音频技术 VoIP LiveVideoStackCon 2018

基于Licode的WebRTC全球分布式架构

随着在线教育行业兴起，许多人把目光投向了国外市场，但是如何搭建一个全球化的音视频网络就成了一个大问题。本次分享主要介绍了如何利用Licode 开源服务器搭建全球分布式架构；介绍了在教育场景下为何选择以Licode为基础来架构全球和百家云在该架构优化和修改；介绍了如何利用Licode 实现WebRTC 服务器的级联；介绍如何了利用该架构解决常见的教育场景的问题。

LiveVideoStack

WebRTC LiveVideoStackCon 2018

51Talk音视频技术的思考及非典型挑战

本次演讲主要介绍51Talk在音视频及其相关技术上的实践、挑战和对策，包括音视频编码器的选择，客户端及服务器的设计和优化，抗丢包、延迟的一些技术以及其他一些51Talk的独特挑战。

陈靖

视频编解码客户端服务端 LiveVideoStackCon 2018

微博视频平台架构演进

微博作为国内最大的社交媒体平台，一直致力于向用户提供高质量的内容。从13年微博逐渐加大对于视频内容的投入开始，微博视频后端系统经历了多次迭代，由最初的每日千级简单视频处理，到如今面对百万级视频上传、数十个垂直业务方的复杂平台，本次分享将会和大家讨论微博视频后端架构的发展历程以及过程中我们经历的那些“坑”。

刘志勇

服务端 LiveVideoStackCon 2018

基于HLS格式的互动直播技术实现超越RTMP的低延时

主播和观众之间的实时交流是互联网互动直播有别于传统电视的新功能。为实现双方对话的顺畅，端到端（即主播端发出画面到播放端显示画面）的延时目标一般应小于5秒。同时，在不牺牲服务质量（例如卡顿率、画面清晰度）的前提下，越低的延时能带来越好的互动性用户体验。为保证上述小于5秒的低延时，Twitch在2011年成立之初曾采用RTMP格式来推流。然而随着同时在线观众达到一定规模，有状态的推流技术逐渐暴露出它高CPU占用率、低可扩展性的缺点，从而成为平台继续发展的最大技术瓶颈。在这种情况下，Twitch于2013年开始从RTMP切换到HLS。HLS的无状态拉流和ABR特性使得网站在用户规模和体验两方面都取得大幅度提升，但另一方面也把端到端的延时扩大到10秒。为达成可扩展性、服务质量、互动性的三赢，Twitch团队研发了仍然基于HLS格式的低延时直播技术。新技术利用了HTTP 1.1的Chunked Transfer Encoding机制，并在直播分发路径从转码到播放的每一个环节都做了架构和软件的升级。Twitch的低延时功能自2018年5月初正式向所有主播开放以来，实现了3.7秒的中位数延时。对于很多网络状况良好的用户，延时甚至能小于2秒。Twitch的用户社区对这种超越RTMP的低延时表现给予了巨大的正面反馈，与此同时，根据我们的实际数据，低延时并不对容量、卡顿率等其他方面带来负面影响。

沈悦时

低延迟网络传输 LiveVideoStackCon 2018

基于QoE的实时视频编码优化

之往我们优化Codec，只是优化Codec本身，其实只是一个局部最优解，而且在实时通信领域，用户的QoE才是最终目标，这和很多因素相关，只有你的Codec优化适应了当前的网络状况，设备平台，应用场景，用户才能得到最佳的体验，我们所要找的其实是全局最优解。

LiveVideoStack

QoE 视频编解码 LiveVideoStackCon 2018

如何打造音视频服务的用户极致体验

音视频服务追求的不仅是单纯QoS，而是用户最终的极致体验。本次分享将针对点播，直播，实时通讯几个不同的运用场景，结合讲师在Facebook和阿里巴巴的实际工作经验，着重讨论视频编码策略，同时结合音频编码，网络传输，服务器架构，用户界面设计，全链路监控等方面的实际经验，探讨如何从端到端整体提升用户的音视频极致体验。

何亚明

QoS 视频编解码网络传输服务端 LiveVideoStackCon 2018

大数据驱动下的短视频体验优化

快手作为国民短视频社区，日上传内容数量过千万，累计内容存量已超五十亿，日播放量过百亿。在海量的用户规模下，只有通过大数据处理和分析，才能准确有效的发现用户体验痛点。快手在短视频大数据处理和分析领域积累了丰富的经验。本次演讲主要介绍快手短视频实时多维数据处理&分析架构，短视频QoS&QoE指标的定义，并以具体案例展示如何通过实时多维数据监测，adhoc数据分析，AB测试等手段，指导用户体验优化。

罗喆

QoE LiveVideoStackCon 2018

基于爱奇艺HCDN视频分发网络的开放缓存

为通过Internet向海量用户传输高清晰度、高码率的视频节目，爱奇艺融合CDN和P2P技术，开发出一套广泛适应多终端并融合P2P和CDN的混合分发网络——HCDN (即Hybrid P2P & CDN)；综合利用常规商业CDN、PC、OTT盒子、家庭NAS、路由器、以及机房闲置X86服务器等设备的多源化带宽，满足着数亿爱奇艺视频用户观看和下载视频需求；其中加入到爱奇艺开放缓存合作（IOCP）的各类伙伴通过大量的家庭NAS、路由器和闲置X86设备无缝融入爱奇艺HCDN网络开放缓存生态，在宽带中国的时代大背景下，实践了大规模的共享计算带宽和可观的经济效益。

LiveVideoStack

网络传输 CDN P2P LiveVideoStackCon 2018

互动白板在在线教育上的应用

教育的本质是内容，在线教育也属于此范畴。而在线教育不同于线下教育，需要经过电子白板展现给用户，白板该怎么做，做成什么样是一个很有意思的话题，本次分享会通过多年实践的经验和技术，来介绍小学，初中，高中在线教育中互动白板的做法，如白板功能，白板渲染，内容合成和传输等实用经验。

赵文杰

互动白板 LiveVideoStackCon 2018

技术标签： LiveVideoStackCon 2018

视频直播体验优化

百度媒体云智能编码技术实践

魔镜：使用无监督式学习来辨识Twitch用户社区中繁复多样的网络状况

基于英特尔架构的实时视频流分析系统的设计与优化

AI在视频增强中的技术以及应用

以质量三维论持续推进腾讯视频播放体验提升

KSC265全链路解决方案及演进

面向QoE的感知视频编码

HEVC标准在客户端上的快速实现方法的研究

基于 WebRTC 架构的直播课堂实践

基于FFmpeg的运动视频分析

视频编码质量评价及如何寻找质量甜点的方法初探

跨国应用场景和即构实时网络的调度系统架构设计

三体云视频抗抖动演进之路

爱奇艺版权保护技术与维权实践

视频加密和DRM的实施实践

解密GPU：视频转码与分析加速

FFmpeg 硬件加速的现状与将来

From VP9 to AV1 and beyond

AI硬件中的声学问题剖析

视频质量评价——从裁判到教练

无参考图像视频质量评价

视频编码器对比与选择

手机K歌的人声伴奏对齐优化实践

微博客户端播放器的演进之路

基于WebRTC的互动直播实践

音乐场景下的实时音频解决方案

基于Licode的WebRTC全球分布式架构

51Talk音视频技术的思考及非典型挑战

微博视频平台架构演进

基于HLS格式的互动直播技术实现超越RTMP的低延时

基于QoE的实时视频编码优化

如何打造音视频服务的用户极致体验

大数据驱动下的短视频体验优化

基于爱奇艺HCDN视频分发网络的开放缓存

互动白板在在线教育上的应用

轻松掌握WebAssembly视频播放器