音视频技术开发周刊 | 167

LiveVideoStack 2020年11月9日

架构


前端音视频WebRTC实时通讯的核心
敲代码实现一个 Demo 来真实感受下 WebRTC 实时通讯的魅力。

https://juejin.im/post/6884851075887661070 


传输网络


CDN视频流中的3个问题以及解决方法
目前,视频内容占据了所有互联网的流量近70%(而且还在不断攀升),因此视频流媒体的重要性从未像现在这样重要。现下,大部分内容由内容交付网络(CDN)管理。然而,对于涉及实时内容的CDN视频流时,仍存在许多不足之处。

https://mp.weixin.qq.com/s/1F2DduHAzH-RhKWJeg32hQ 


人物专访


智能制作,是我们改变时代的机会——阿里云视频云的理想与未来
“生产制作是核心,AI是辅助”,本期专访邀请嘉宾阿里云智能视频云高级技术专家邹娟分析了云媒体生产平台及产品的最大难点,解密阿里云在云剪辑产品的关键技术点与场景优化。

https://mp.weixin.qq.com/s/BmYsJjpqiOwB3da-XmKeZg 


保25ms争10ms——Zenlayer如何保持出海业务的超低延时
本期专访邀请到Zenlayer资深产品总监沈建发,他从边缘计算与云计算区别、网络传输与本地化覆盖以及技术发展与个人成长多个层面展开。

https://mp.weixin.qq.com/s/-PrwXXySzDVFYB1S7I_u3A 


编解码


VVC并行视频编码技术的回顾与比较分析
本文来自SPIE论文展示,论文标题是“Review and comparative analysis of parallel video encoding techniques for VVC”。

https://mp.weixin.qq.com/s/zzUoFmYW8AmQKs7PVIruvQ 


WebCodecs对音视频进行编码解码
现在已经有很多 Web API 进行媒体操作: Media Stream API, Media Recording API, Media Source API、WebRTC API,但是没有提供一些底层 API 给到 Web 开发者进行帧操作或者对已经编码的视频进行解封装操作。

https://juejin.im/post/6885482349098860558 


Google 6DOF视频生成与编解码:身临其境
在SIGGRAPH 2020上,Google提出了一种新的算法[1,2]来进行6DOF VR视频的录制与编解码,对于给定空间,用户无论选择何种视角,都可以得到沉浸式的观看体验,仿佛置身其中。本文对该算法做一简介,并展示效果。

https://skarredghost.com/2020/10/10/google-6dof-videos-review/amp/ 


音视频技术


IP视频工程师101
本文来自Leader America的网络研讨会,Steve Holmes主持了第1部分,内容是关于连接IP视频以及日常操作需要了解的知识。

https://mp.weixin.qq.com/s/Ys6qlzJfKSVGX1XOGS6Wxw 


搭建一个点播跟直播流媒体服务器
现在抖音、快手等直播实在是太火了,因此对音视频的开发非常感兴趣,查阅了相关资料,使用Nginx搭建一个简单的直播跟点播流媒体服务器,能够实时推流到服务器,同时在网页端播放直播的视频。

https://juejin.im/post/6885126367558664206 


AI智能


基于机器学习和深度学习的视频处理
该会议来自于IBC2020 TECHNICAL PAPERS,本期内容主要为基于机器学习和深度学习的视频处理。主持人为Dr. Paul Entwistle, 来自IBC Technical Papers 协会。两位演讲人为Taeyoung Na与Luka Murn。

https://mp.weixin.qq.com/s/F_MGntn2Yx8mEsv2bQC86g 


OpenCV:用Python构建人脸识别器
这篇文章,我将向你展示如何使用Python构建自己的人脸识别器。构建一个检测和识别人脸的程序是一个非常有趣和有趣的计算机视觉入门项目。在之前的文章中,我展示了如何识别文本,也展示了如何检测图像中的人脸,这些都是计算机视觉中练习python的好项目。

https://towardsdatascience.com/building-a-face-recognizer-in-python-7fd6630c6340 


强化学习算法DeepCube,机器自行解决复杂魔方问题
我花了近一年的时间写《动手深度强化学习》一书,距离该书出版已经过去半年了,在这段休整时间,我发现自己对强化学习的热情已经无法退却。无论是研究不同的RL方法,或是复现论文代码,对我而言是极大的乐趣。幸运的是,RL在各个领域均在迅速发展,很多有趣的主题值得探讨。

https://medium.com/datadriveninvestor/reinforcement-learning-to-solve-rubiks-cube-and-other-complex-problems-106424cf26ff 


图像处理


关于php使用gd库合并图像 图像模糊处理方法
最近开发了一个项目,功能是图像,文字生成一个简单的logo,比较简单我用的是php的GD库图像处理进行实现的,开发的时候遇到一个问题透明背景时 图像边缘会模糊有一道黑线效果。

https://juejin.im/post/6883006167665115143 


什么是计算机图形学?
由于时常有本科学生来向笔者询问计算机图形学是做什么的,为了使得学生能够快速了解计算机图形学,有利于他们在选择研究生方向做出适合自己的选择,特撰写此文。

https://toutiao.io/k/rapdyc4 

还可输入800
全部评论
作者介绍

LiveVideoStack

阅读排行
  • 2周
  • 4周
  • 16周
热门视频

WebRTC视频数据流程分析

许建林/《WebRTC Native开发实战》书籍作者