ffmpeg 5.0 发布
FFmpeg 5.0 正式发布,距离上个版本 4.4 相隔 9 个月时间,该版本的一些亮点更新如下:新的 Vulkan 驱动的视频水平/垂直翻转过滤器;Apple Graphics SMC 编码器;Speex 解码器;各种新的 muxers/demuxers,例如 Argonaut Games CVG 和实验性的 IMF demuxer;添加了一个 AV1 低开销比特流格式复用器;Swscale slice 线程支持;新的音频和视频过滤器;LoongArch CPU 架构支持;清除原有弃用警告。
https://github.com/FFmpeg/FFmpeg/tree/ce4d459db186a7d8ac842685cd6256c9ac1b7f25
中科院声学所团队结合可调式头靠结构与虚拟传感算法实现反馈有源噪声控制
7英尺的屏幕:比Zoom更好还是更糟?
在新冠疫情蔓延的近两年时间里,全球各地的公司白领们已经习惯了在视频通话中只看到他们同事的半身像,甚至是只能看到一个头部区域的画面。但一家法国初创公司在消费电子展上展示了其7英尺高的数字视频聊天系统,该系统希望即使你与你的同事相隔很远,但还能够通过屏幕可以从头到脚的看到一个全身像的同事。
https://mashable.com/article/7-foot-video-conferencing-digital-screen-la-vitre?utm_source=feedly&utm_medium=webfeeds
你说我画,你画我说:全球最大中文跨模态生成模型文心ERNIE-ViLG来了!
上交开源业界首个两阶段物体阴影生成网络,自建数据集DESOBA,入选AAAI 2022
阅读推荐
做音频软件开发10+年,包括语音通信、语音识别、音乐播放等,大部分时间在做语音通信。做语音通信中有大部分时间在做VoIP语音处理。语音通信是全双工的,既要把自己的语音发送出去让对方听到,又要接收对方的语音让自己听到。发送又可叫做上行或者TX,接收又可叫做下行或者RX。之前写了好多关于VoIP语音处理方面的文章,本文想结合框图对相关知识做一个梳理。先综述发送和接收方向的处理,再具体到每个知识点上。讲到某个知识点,如曾经写过相关的文章,就给出链接,如没有写过,等以后写到时再补上链接。由于一些知识点在发送和接收两个方向上是相关的,就放在一起讲。
https://blog.csdn.net/david_tym/article/details/122353913