音视频技术开发周刊 | 157

LiveVideoStack 2020年8月16日

每周一期,纵览音视频技术领域的干货和新闻投稿:contribute@livevideostack.com。

内容推荐

 

SRT协议在电视直播中的应用

本文来自安徽广播电视台 直播技术工程师 张博力在LiveVideoStackCon 2020 线上峰会的演讲,详细介绍了SRT协议在信号传输、远程制作等方面的应用,以及实际工作中遇到的相关技术问题。

https://mp.weixin.qq.com/s/qN54rJ53MetFL-GK7d6ptw

 

FreeSWITCH视频会议“标准”解决方案

本文由FreeSWITCH 中文社区创始人杜金房在LiveVideoStack线上分享的演讲内容整理而成,详细介绍了FreeSWITCH做为一种开源的视频会议解决方案如何在开源、开放的基础上,对接各种无法修改的“标准”视频会议终端、WebRTC浏览器以及微信小程序等,迎接各种挑战。

https://mp.weixin.qq.com/s/LOCxUNBA1j94qJPqY1RKrA

 

架构

 

Qt5+FFmpeg实现同时采集屏幕+麦克风+系统音频的录屏软件

windows下实现录制屏幕,系统声音,麦克风声音成mpeg4(Win7及以上系统),并且实现音视频同步和基础UI界面。

https://blog.csdn.net/qq_34940879/article/details/107797504?utm_medium=distribute.pc_category.none-task-blog-hot-3.nonecase&depth_1-utm_source=distribute.pc_category.none-task-blog-hot-3.nonecase&request_id=

 

传输网络

 

互联网可靠实时协议RIST和SRT

使用SRT和RIST协议的场景很丰富,包括摄影机到基站的转播、体育场转播、新闻报道和云转播等。

https://mp.weixin.qq.com/s/Dhz0jsHRiSrN7QZYPbxF_A

 

RIST –可靠的互联网流传输

从任何地方上网似乎正越来越成为可能。当然,严格意义上讲,这并不正确,但将互联网连接到某个地方的选择正在逐年增加。很快,5G将提供更可靠的接入互联网的新方式,卫星互联网的部署正在逐渐增多,ISP基础设施继续扩大。既然互联网触及了很多广播公司想要的领域,为什么他们不把它用于视频和音频连接,代替专用线路呢?

https://mp.weixin.qq.com/s/mBTYr1MaEs2NffocByEsCg

 

完整双流控制协议 (BFCP),SDP拓展和应用概论

本文将重点介绍通过SDP拓展实现的BFCP数据交互信息的方式和BFCP其他技术架构的讨论,应用场景(例如物联网IOT)和其他部署问题的讨论。

https://mp.weixin.qq.com/s/w-SXoX_fPrzC0i4e_kxpOQ

 

ATSC3.0:新一代广播标准

Jerald在文中介绍了ATSC3.0是一个全新的电视广播标准,并简单回顾了ATSC的发展历程和重要性,指出现在的电视广播协议中手机成为了主要的终端设备,并且还需要具有足够强大的一对多广播的能力。Jerald接着介绍了ATSC3.0是一个全IP的协议,并拥有传输多种动态视频流的能力。

https://mp.weixin.qq.com/s/tOKFDU5Y0xr7qthCAl2dlQ

 

编解码

 

创建商用AV1软件编码器的挑战

本文讨论了AV1在视频和游戏的低带宽流传输中的特定应用,针对性能受限的解码器调整编码的重要性以及使用机器学习技术调整视频压缩参数的重要性。

https://mp.weixin.qq.com/s/E2OcEhzbCotpA13CRkGoGg

 

中国的大学可以塑造视频以及其他领域的未来,如果他们获得了正确的知识产权

关于VVC的专利,中国公司和大学非常活跃。

https://www.iam-media.com/frandseps/chinese-universities-can-shape-future-of-video-and-plenty-more-besides-if-they-play-ip-right

 

音视频技术

 

音视频元数据那些事

本文主要介绍音频AAC、视频H264和H265等编码格式的元数据,以及它们在MediaCodec中的处理逻辑和在封装容器中的存储逻辑。

https://juejin.im/post/6858809474820997127

 

视频字幕技术及案例

演讲主要介绍了自动语音识别(ASR),以及如何将其应用于视频和音频内容的字幕;描述了当今各种字幕方法的利弊;讨论美国监管字幕环境,其预期的未来和处罚;探索监管环境将如何影响内容创作者、内容发布者(网站,广播公司等)、场地设计师和业主、系统集成商;概述ASR的一些新优点。

https://mp.weixin.qq.com/s/M092snvVUCzSEOEa4S6ndA

 

人物专访

 

“非洲用户的付费意愿并不低”—— 专访四达时代研发总监张亮

2018年世界杯前,StarTimesOn App在非洲正式上线,全程直播32个球队的64场比赛,获得了广泛的关注和大量用户。在非洲的网络条件下,交付良好的视频播放体验绝非易事,所以这几年张亮的工作就是从各个角度探索问题的解决方案,以保障非洲地区的视频播放体验。

https://mp.weixin.qq.com/s/HWAwb-9cpNzYD1S7Zr0rlw

 

AI智能

 

一个眼神都不放过,FRL公布自然表情系统MCA

通常,头像是一个社交平台的重要元素之一。而在目前大多数VR社交应用中,大多数虚拟头像都比较卡通风,还达不到像人那样真实。因此,为了打造更逼真的VR头像,社交媒体和科技巨头Facebook一直在打造一个叫Codec Avatar的系统。

https://mp.weixin.qq.com/s/EaDQwf19WtHOompcMhUmKQ

 

GitHub Repository,让计算机视觉开发更上一层楼

如今,计算机视觉在许多领域都被广泛应用,且进展非凡。但是计算机视觉的准入门槛对初学者较高,为了对广泛的受众更加友好,微软将多年在计算机视觉领域工作中对处理现实世界问题的代码和心得,都放到了一个开源的 GitHub Repository(以下简称 GitHub Repo)中供更多人使用。

https://mp.weixin.qq.com/s/WEBLwo_3xio0l1euArZjfQ

 

图像

 

MMEditing:多任务图像视频编辑工具箱

我们近期在 OpenMMLab 项目中开源了MMEditing。这是一个图像和视频编辑的工具箱,它目前包含了常见的编辑任务,比如图像修复,图像抠图,超分辨率和生成模型。在编辑图像或者视频的时候,我们往往是需要组合使用以上任务的,因此我们将它们整理到一个统一的框架下,方便大家使用。

https://mp.weixin.qq.com/s/9mdWJ25eBAkXeHdYEbNEEg

 

资源推荐

 

抖音直播的礼物特效引擎

为了直播事业的蓬勃发展,我们开源了抖音直播的礼物特效引擎,抛砖引玉,欢迎各位交流讨论。

https://github.com/bytedance/AlphaPlayer

 

吴恩达推荐笔记:22张图总结深度学习全部知识

195篇NAACL+295篇ACL2019有代码开源的论文。

https://github.com/yizhen20133868/NLP-Conferences-Code

 
还可输入800
全部评论
作者介绍

LiveVideoStack

阅读排行
  • 2周
  • 4周
  • 16周