音视频技术开发周刊 | 159

LiveVideoStack 2020年8月30日



内容推荐



OWT(Open WebRTC Toolkit)云游戏自动音视频测试探索

在日益临近的5G时代下,5G网络和新的流视频游戏服务将在未来几年内让云游戏的增长一触即发,云游戏已渐成行业热点。英特尔基于OWT(Open WebRTC Toolkit)也对云游戏使用场景所需要的高分辨率,高比特率和高帧率的视频超低延时的实时传输做了深入研究和广泛优化。

https://mp.weixin.qq.com/s/1zwPe8-TgCa2rcoVYfEXww



架构



端到端加密 E2E:安全特性的的过去,现在和未来

Frozen Mountain 如何在其 SDK 中支持 E2E 加密的。

https://resources.frozenmountain.com/developers/blog/end-to-end-encryption-the-past-present-and-future-of-security



传输网络



趣谈网络协议

文章根据刘超老师(网易研究院云计算技术部首席架构师)的课程趣谈网络协议整理而成。

https://juejin.im/post/6863089460691599367



编解码



HEVC(H.265)流服务器被过度炒作的5个原因

实时流传输是一个复杂的过程,涉及多种不同的方法和格式。这些组件之一是用于媒体文件编码和解码的编解码器。编解码器还定义了编解码器可用于执行流传输的工具的类型。

https://www.red5pro.com/blog/5-reasons-hevc-h-265-streaming-servers-are-overhyped/



FFmpeg获取视频首帧转封面图Bitmap

本篇博客主要是使用ffmpeg获取本地视频文件的第一帧数据转换为Bitmap,然后抛给上层ImageView显示。

https://juejin.im/post/6846687602200805383



初探视频原理和FFmpeg

短视频大行其道的年代,作为程序员势必需要了解:视频编辑背后的原理和技术。

https://mp.weixin.qq.com/s/oenjo6d75Ew1rHx3eeB0wg



Linux AV1硬件视频解码将支持Intel Tiger Lake

AV1硬件解码将在最新的Intel处理器上实现,但AMD却还没有动作。

https://mp.weixin.qq.com/s/-zN_iwvgy5nbbC-RGTaW8A


音视频技术



3D深度估计,让视频特效更梦幻!

身为顶会领域主席的作者 Jia-Bin Huang 最近和合作者提出了一项新的计算机视觉方法,可以让厨房「水漫金山」,让天空下起「彩球雨」。

https://mp.weixin.qq.com/s/gS5uFwTDbvzhbu8M8X2dXw



Why should I care about IPMX?

本次演讲者是来自matrox video研发部门的执行副总裁David Chiappini,他同时也是AIMS ProAV Working group的主席,演讲的题目为Why should I care about IPMX?

https://mp.weixin.qq.com/s/a0E1FkuGG9WvjTayvvsyYQ



3GPP 5G多媒体标准化进展

本文试图梳理3GPP对5G网络上的多媒体业务制定的标准及演进。

https://mp.weixin.qq.com/s/8lxSmh-jPWv_A8qe2_NG0A



Chrome 85发布

随着Chrome 85的发布,用户现在获得内置的AVIF图像支持。

https://www.bleepingcomputer.com/news/google/chrome-85-released-with-security-fixes-app-shortcuts-avif-support/


AI智能



AI还原人像,B站Up主大谷新作

朱元璋、林黛玉、兵马俑、杜甫…… 这些历史人物到底长什么样?B 站 up 主「大谷」帮我们用 AI 还原出了一种可能。

https://mp.weixin.qq.com/s/yDF7Aw_TWwBnfeHD_nw4zA



Torch:从特征提取到模型的语音识别

我们探讨从语音数据中提取的特征,以及基于这些特征构建模型的不同方法。

https://juejin.im/post/6864194857628827661



面向细粒度的人脸表情操纵

人脸表情编辑指的是对图像中人脸的表情进行变换和修改。通常,我们希望这种编辑方法是足够方便、可控的。方便,在于我们尽量设置少量的条件,操作简单;可控,在于我们可以精确地控制需要编辑的部分与编辑的结果。

https://mp.weixin.qq.com/s/UyWYCb54mxxkuTU6-08TWQ


图像处理


二次采样 安卓的图片优化

在我们日常开发app的,大部分的时候都需要展示图片信息,图片最终对应Android中的是Bitmap(位图)对象。

https://juejin.im/post/6864380007550287880



Android Bitmap像素排列与JNI操作

在 Android 开发中,经常和 Bitmap 打交道,不知道你是否真正理解 Bitmap?

https://juejin.im/post/6864165543042744327


视频质量评测


衡量QoE和视频质量的最新ITU-T标准

本文来自Streaming Learning Center的博客,作者是H.264,H.265和VP9编码实时和按需制作的领先专家Jan Ozer,本文主题是“衡量QoE和视频质量的最新ITU-T标准”。

https://mp.weixin.qq.com/s/etmAWI9vNBLsFoRga2DbOQ


资源推荐


手残党福音:一键抠图、隔空移物

世界上从来不缺少抠图工具,但始终缺少更完美的抠图工具。

https://mp.weixin.qq.com/s/BBkAdtdmzPMdY-SQ5nBlUg



computervision-recipes

computervision-recipes 是微软开源的计算机视觉最佳实践,它利用最先进的计算机视觉算法、神经系统搭建了一套全面的计算机视觉工具和代码示例,如果你想了解计算机视觉,不妨站在这个“巨人”的肩膀上学习图像加载、优化和评估模型以及上云的相关内容。

https://github.com/microsoft/computervision-recipes


咨询速览


  • Telegram 推出端到端 E2E 加密视频通话功能

  • 一个新的平台:帮助我们在 Signal Desktop 上测试一对一的语音和视频对话

  • Google 计划最终用 Meet 取代 Duo


还可输入800
全部评论
作者介绍

LiveVideoStack

阅读排行
  • 2周
  • 4周
  • 16周