技术文章: 音频编解码

音乐创作引擎实现即时交互体验的探索

LiveVideoStackCon 2022 上海站大会我们邀请到了北京灵动音科技有限公司(DeepMusic) CTO 苑盛成博士为我们详细介绍了这种新型音乐创作引擎的研究成果和技术实践。

Max

音频技术

AI自动剪辑生成视频探索实践

网易云音乐 音视频算法专家 赵剑,详细介绍网易云音乐结合多年音乐领域多模态算法能力积累与实际业务需求,实现AI自动剪辑生成视频的技术探索与与实践。

Max

AI剪辑 音视频技术

语音前处理技术在会议场景中的应用及挑战

随着在线会议的普及,用户已经不再满足于能听到,而是要有更为极致的听感体验,如何能够在复杂多变的应用场景中依旧保证声音清晰流畅是对会议系统的极大挑战。

顾骋

语音前处理 视频会议

最新日程海报(LiveVideoStackCon 2022 音视频技术大会 北京站 )

LiveVideoStackCon 2022 音视频技术大会 北京站 最新日程。

LiveVideoStack

实时音视频 音频技术 视频技术

对话安谋科技周华:编解码硬件的机遇与挑战

我们很荣幸地邀请到了来自安谋科技,视频编解码处理器研发负责人周华老师,来和我们聊一聊编解码硬件的机遇与挑战,以及介绍今年新推出的“玲珑”VPU处理器有哪些亮点。

LiveVideoStack

编解码芯片 视频编解码 硬件编码

基于无监督预训练的语音识别技术落地实践 火山语音表示有话要说

火山语音团队在基于无监督预训练的语音识别技术落地过程中,针对三大痛点进行了算法改进和工程优化,形成一套完整易推广的落地方案。本文将从落地流程、算法优化以及工程优化等环节展开详尽介绍。

LiveVideoStack

语音识别 火山引擎

新一代视频编码标准VVC的芯片设计思考

LiveVideoStackCon2022上海站大会邀请到了复旦大学微电子学院的范益波老师和和大家一同探讨了针对新一代视频编码标准VVC的芯片设计和思考。

LiveVideoStack

视频编解码 编解码芯片 范益波

对话火山引擎王悦:多媒体继续向更高清,更交互,更沉浸演进

火山引擎支撑起了字节跳动旗下的音视频能力,支持数亿DAU,为每天数千亿次播放与互动提供保障,他们是如何做好这一切的?除了数据驱动、A/B测试还有哪些深度的思考与方法呢?

LiveVideoStack

音视频技术

对话快手苍鹏:播放器还有什么新玩法?

在LiveVideoStackCon 2022北京大会前夕,我们和苍鹏畅谈了播放器的未来。

LiveVideoStack

播放器 视频技术 快手

是时候展现“真正”的技术了!

LiveVideoStackCon 2022 北京站将延期至2023年第一季度,一切就绪,只等你来。

LiveVideoStack

视频传输 视频技术 音频技术 视频编解码 AI 元宇宙

对话腾讯天琴赵伟峰:当音乐与科技结合,会碰撞出怎样的火花?

LiveVideoStack采访到了腾讯音乐天琴实验室的音频技术负责人赵伟峰,请他来跟大家聊聊天琴实验室在音频技术上所取得的各类创新、与高校开展的研究合作、天琴所获得的多项技术专利以及他对音频技术发展的未来展望。

LiveVideoStack

音频技术 音频编解码 腾讯音乐

WebRTC开源项目现状

在今天这篇文章中,我们会详述WebRTC开源生态的现状,以及我们为什么需要做出必要的改变以确保WebRTC在未来几年能够健康发展。

LiveVideoStack

WebRTC 开源

对话Debargha Mukherjee:AV1历史和三个你可能不知道的工具

在本次采访中,你将了解关于AV1开发的重要内容,其中包括使AV1在市场中获得独特优势的三个工具。

LiveVideoStack

AV1 编解码

ffprobe综合教程(内含7个示例)

在本文中,我们将学习如何使用ffprobe分析视频和提取视频信息。

LiveVideoStack

FFmpeg FFplay ffprobe

AI时代的视频云转码移动端化——更快、更好,更低,更广

即构科技的李凯老师,为我们分享产品架构、移动端视频转码、移动端智能视频处理、四位一体网络模型设计以及具体实施Demo。

LiveVideoStack

AI 视频云 AI转码 即构科技 李凯

声网3D在线互动场景空间音频的实时渲染——如何把“声临其境”推向极致

在Meta RTC场景中如何让不同人也能畅想“身临其境”的感觉?3D在线互动场景空间音频的实时渲染又有哪些应用?

LiveVideoStack

空间音频 实时渲染 声网 冯建元

基于WebRTC的开源低延时播放器实践

在直播中良好的网络环境与低延时是优质交互体验的关键,在这个各家云服务厂商标准不统一的年代,如何让低延时直播更加便捷稳定呢?

LiveVideoStack

WebRTC 开源技术 低延时 播放器 网易云信 毕伟

影视级跨平台视频制作技术的落地实践

LiveVideoStackCon 2022音视频技术大会上海站邀请到了视杏科技的李志强老师,为我们分享影视级跨平台视频制作技术的落地实践。

LiveVideoStack

内容生产 视频技术 视杏科技 李志强

腾讯自研新一代AV1编解码器

LiveVideoStackCon 2022音视频技术大会上海站邀请到腾讯云香农实验室编解码器研发负责人张贤国老师,为大家介绍腾讯自研AV1编解码器。

LiveVideoStack

视频编解码 AV1 腾讯

七牛云QRTC自研传输协议(QRTP)对音画质量的提升

于佳老师在LiveVideoStackCon 2022 上海站为我们讲述QRTN的网络架构是如何提升用户体验度的,以及分析其中的QRTP协议是如何对音画质量进行提升的。

LiveVideoStack

QRTC 网络传输 传输协议 视频质量 七牛云

PPIO边缘云聚焦音视频底层技术,探索元宇宙“登月工程”

本次分享将从VR/AR的核心指标及实现,云与边缘架构、编解码、网络传输路径等多个维度,全面分析元宇宙的音视频技术脉络,探讨元宇宙时代产业结构变化,介绍PPIO边缘云未来如何为元宇宙提供强大的基础设施服务。

LiveVideoStack

边缘云 元宇宙 音视频技术 PPIO边缘云

七牛云音画质量分析系统的行业前瞻

七牛云智能视频服务AI技术负责人宋宏亮,在LiveVideoStackCon 2022 音视频技术大会上海站为我们分享音画质量分析系统的行业前瞻。

LiveVideoStack

质量评价 视频技术 七牛云

从抖音到火山引擎——看流媒体技术演进和机会

在宋慎义老师的演讲中,我们看到了火山引擎一路走来的历程,也了解到通过结合不同的场景,火山引擎对外来探索的坚持。

LiveVideoStack

实时音视频 RTC 直播 编码 编解码 字节跳动 火山引擎 宋慎义

An interview with Professor Karlheinz Brandenburg: MP3 was just the right technology at the right time

近期,LiveVideoStack采访到了被人们称为“MP3之父”的Karlheinz Brandenburg教授。

LiveVideoStack

音频技术 音频编码 音频解码 音频编解码 MP3 Karlheinz Brandenburg

码率vs.分辨率,哪一个更重要?

在本文中,我们将讨论OTT领域中视频压缩和处理的基本问题:码率vs.分辨率,哪一个对视频流更重要?

LiveVideoStack

超分辨率 码率控制 视频编码

MPEG音频编码三十年

在这三十年中,MPEG的音频组向市场输入了一代又一代的音频编码标准。作为MPEG最佳传统,这些标准在某种意义上是通用的,可用于纯音频或者音频+视频应用程序。随着新一代音频编码标准构建在前代编码标准之上,这些编码标准通常可进行扩展。

LiveVideoStack

音频技术 编码 MPEG

8月5日我们一起,聚焦音视频、探秘技术新发展

大会报名倒计时8天,期待见面,会议详情及购票可咨询小秘书:13520771810(微信同号)。

LiveVideoStack

数字人 元宇宙 云游戏 深度学习 AI 开源技术 自动驾驶

2022 音视频技术风向标

这是我们成立5年以来筹备时间最长的一次音视频技术大会了。

LiveVideoStack

实时音视频 音视频技术

海内外技术人们“看”音视频技术的未来

内含8月5-6日 LiveVideoStackCon 2022 音视频技术大会完整版日程。

LiveVideoStack

音视频技术 元宇宙 视频传输 视频编解码 内容生产

你有一个机会,这里有一个舞台

LiveVideoStackCon 是每个人的舞台,如果你在团队、公司中独当一面,在某一领域或技术拥有多年实践,并热衷于技术交流,欢迎申请成为 LiveVideoStackCon 的讲师。

LiveVideoStack

音视频技术 编解码 编解码芯片 人工智能 网络传输 开源技术

迈克尔·霍利:当我看到人们急着加入新行列、抛弃高度发展的老技术时,我就感到很伤心

这是一篇来自上世纪80年代的采访,采访对象为IoT先驱人物迈克尔·霍利。

LiveVideoStack

IoT 视频技术 迈克尔·霍利

使用FFmpeg进行HLS打包——FFmpeg简单学

在本文中,我们将学习使用FFmpeg进行HLS打包。

LiveVideoStack

FFmpeg hls+

Clubhouse:使用空间音频提升对话质量

空间音频是一种新技术:当你只是戴上耳机,它也能重现影院级别的环绕声。对于Clubhouse这样的群组通信app,空间音频不仅能带来很棒的音效,还能使你与他人轻松对话。

LiveVideoStack

空间音频 音频技术 Clubhouse Justin Uberti

Prime Video如何使用AI确保视频质量

用于检测宏块损坏、音频失真和音视频同步错误的检测器是Prime Video的三个质量保证工具。

LiveVideoStack

AI 视频质量 Prime Video Amazon

音频正当时:我们和声网音频专家聊了聊AI、元宇宙、空间音频和“沉浸感”

近日,LiveVideoStack采访到了声网的音频算法负责人冯建元,请他来跟大家聊聊音频相对于视频的优势、音频在元宇宙中的应用、国内音频技术与AI结合的发展、过去一年声网在音频领域所取得突破和对前沿音频技术的探索等。

LiveVideoStack

音频技术 AI 元宇宙 声网 冯建元

如何使用FFmpeg将AVI转换为MP4(有损转换和无损转换)

在本篇文章中,我们将学习如何使用FFmpeg把视频从AVI格式转换为MP4格式(在重新/不重新编码AVI文件的情况下)。

LiveVideoStack

FFmpeg AVI 开源技术

使用FFmpeg添加、删除、替换和提取视频中的音频

FFmpeg是一个超级强大的工具,它可以在视频文件中增添、删除、提取或者替换音频。

LiveVideoStack

FFmpeg 视频技术 音频技术 开源技术 编解码 FFmpeg

音视频PaaS的“未毕之旅”

本文由LiveVideoStack和赵加雨的对话整理而成,旨在还原一名技术创业者的思考,涉及创业、RTC与音视频PaaS、to B SaaS、出海和钉钉生态。

LiveVideoStack

音视频技术 钉钉 拍乐云 赵加雨 PaaS

音视频技术下一个风口在哪里——LiveVideoStackCon 2022 上海站 演讲剧透

在去年北京站大会筹备过程中,我曾经采访过一些技术人,有问到这么一个问题:“您认为目前我们所处的“后疫情时代”,音视频技术领域的下一个风口在哪里?”

LiveVideoStack

超分辨率 硬件加速 编解码 LiveVideoStackCon2022上海 智能汽车

探秘冬奥开幕式背后的播控系统

2022年2月4日晚8点,一场美轮美奂的冬奥开幕式如约而至,作为本次奥运盛会的播控系统,澜景公司旗下的Hirender全媒体总控系统为全世界观众呈现出了最完美的视觉效果。

LiveVideoStack

视频传输 信号处理 播控系统 北京澜景科技有限公司 李林

LiveVideoStack年终技术盘点总结

在2021年底,LiveVideoStack策划了一次年终技术盘点,我们向音视频领域的一线技术工作者们发出了约稿邀请,希望他们能够输出一些音视频方向的技术内容。下面让我们再来重温一下2021年的年终技术盘点。

LiveVideoStack

互动白板 QUIC HDR WebRTC Miro 王晶 张昊

对话王晶:音频人才亟待培养,高水平研究人员尤其欠缺

在此次与LiveVideoStack的对话中,王教授分享了过去几年音频领域的重要发展和创新、音频编解码器的独特之处、AI与音频编码技术结合的突破以及目前音频领域人才培养和输出所面临的困境等。

LiveVideoStack

音频技术 王晶

FFmpeg 5.0 正式发布

近日,FFmpeg 5.0正式发布。这一新版本代号被命名为“Lorentz”,主要为纪念伟大的荷兰物理学家亨得里克·安顿·洛伦兹(Hendrik Antoon Lorentz)。此次重大发布包括大量API更改,并增添了一些新的特性。

FFmpeg 视频编解码 编解码

未来已来,音视频江湖再起波澜

“全真稳”,打通企业音视频“任督二脉”

LiveVideoStack

腾讯云 TRTC CDN SDK 腾讯云专区

直播新玩法背后的音视频技术演进

近年来,直播改变了许多行业模式,其形态在不断的演进中也逐渐丰富起来。直播在字节跳动中衍生出了KTV歌房、直播答题、互动游戏、电商拍卖及企业直播等不同场景。本次分享我们邀请到火山引擎视频云音视频直播客户端研发负责人——徐鸿,向大家介绍直播场景中沉淀下的优秀架构能力和技术能力。

LiveVideoStack

直播连麦 直播 RTC AEC ANS AGC

视频编码器的智能化——AI辅助编解码的ASIC解决方案

在此次LiveVideoStackCon 2021 音视频技术大会 北京站,来自镕铭半导体的刘迅思详细列举了目前常用的AI辅助编解码的方法,论述如何在硬件和软件层面将AI结合编解码的实践,探索新的标准和新一代编码器结合AI应该如何设计。

LiveVideoStack

硬件编码 GPU OpenGL 视频编解码 AI

华为云媒体质量管理最新实践——“视镜”

对全球不可靠的互联网络和大容量分布式系统的挑战,如何以用户为中心,从可用变得更好用,追求更流畅、更清晰、更快、更省的极致用户音视频体验?LiveVideoStacCon 2021 北京站邀请到华为云媒体服务资深研发专家——康永红,为大家分享华为云媒体服务在追求极致用户体验质量道路上的沉淀成果——“视镜”。

LiveVideoStack

网络传输 体验优化 QoS 音视频技术

三星电子推出X-net架构用于语音通话

近日,三星电子推出X-net,这是一种联合学习的Scale-down和Scale-up架构,用于语音编码中的预处理和后处理,作为在带宽受限的语音通话信道上扩展带宽的一种手段。

LiveVideoStack

音频技术 网络传输

陈曦:超低延迟下的实时合唱体验升级

本文来自即构科技行业解决方案总监 陈曦在LiveVideoStack公开课的分享,结合即构科技在实时合唱场景中实现极致工程化的经验,对超低延迟体验的优化思路进行了详细解析。

LiveVideoStack

低延迟 超低延迟 RTC

Google’s Ambition in Audio Compression: an Interview with Jamieson Brettle and Jan Skoglund from Google

an Interview with Jamieson Brettle and Jan Skoglund from Google

LiveVideoStack

音频技术

近期对流媒体技术的思考

从年初到现在跟各领域的朋友们交流后对几个大伙频繁聊起的方向做了一些思考

LiveVideoStack

视频技术 音视频技术

完整声学极简史

偶然得见一篇文章简单介绍了声学发展史,与我之前的几篇文章有很大关联。所以将其添油加醋放到这里,用编年史的形式呈现。显然这里涵盖的仅为声学史的一隅,所以在厚颜无耻的“完整”二字后面,加上“极简”以示谦卑。

LiveVideoStack

音频技术

LiveVideoStackCon 2021北京站 9月再次启航

2021年9月3~4日,LiveVideoStackCon北京站再次来袭!各路音视频技术大咖将齐聚北京,一起分享宝贵行业经验,探索音视频技术的未来。

LiveVideoStack

视频编解码 AR AV1 网络传输 4K

音乐编解码器的更新情况

在我最近关于高分辨率音频播放器以及为它们提供内容的服务和外部DAC和放大器的报道中,我意识到我向我的读者抛出了很多新的可能不熟悉的术语。自从我上一次深入介绍无损和有损音频压缩标准以来,已经有一段时间了,确切地说,是20年!而且世事变迁,所以这个简短的更新可能是迟来的。

LiveVideoStack

音频技术

基于深度学习的实时噪声抑制——深度学习落地移动端的范例

在实时通讯技术迅猛发展的今天,人们对通话时的降噪要求也不断提高。深度学习也被应用于实时的噪声抑制。本次LiveVideoStackCon 2021 上海站中,我们邀请到了声网Agora音频算法负责人冯建元老师为我们分享深度学习落地移动端的范例,遇到的问题和未来的展望。

LiveVideoStack

深度学习 AI 音频技术

淘宝直播“一猜到底”

淘宝移动端实时语音识别技术方案及应用

LiveVideoStack

移动应用 直播连麦 网络传输 5G

端到端神经视频编码=A Better Trade-off ?

归根结底,每一种视频压缩方法都要权衡利弊

LiveVideoStack

视频编解码 VVC HDR VR HEVC

SRT协议在电视直播中的应用

本文详细介绍了SRT协议在信号传输、远程制作等方面的应用,以及实际工作中遇到的相关技术问题。

LiveVideoStack

SRT 网络传输 UDP 5G 视频编解码 张博力

视频生产环境下的音视频解决方案

音视频处理在生产环境下,对控制精准性有着更高的要求。

LiveVideoStack

转码 视频生产 云剪辑 Media Track 姜雨晴

开源编解码器 SOLO 源码解读:带宽扩展与窄带编码

声网 Agora 在 2019 年 10 月 24 日,正式对所有开发者开源自研的抗丢包音频编解码器 SOLO。该编解码器适用于需要实时音频交互的场景,特别针对弱网对抗进行了优化,并且在相同弱网环境下 MOS 分优于 Opus。SOLO 可应用于各类 RTC 应用,并且可不与 Agora SDK 绑定使用。本文将从源码角度解读 SOLO 的带宽扩展与窄带编码。

LiveVideoStack

开源技术 音频技术 声网

在线催稿:当一位高级视频算法工程师接受采访

讲师专访是每一届LiveVideoStackCon举办前的固有“热身”和传统节目,我们夹带着为大会做宣传的私心(却也并不为过),但更多的是希望帮助大家多熟悉、多了解这些在音视频技术领域摸爬滚打多年的工程师、开发者,像朋友一样真心接触、平等交流。毕竟,技术的分享本就不应该居高临下,他们也曾是你,或许有一天,你也将成为他们(大神们请忽略这句)。

LiveVideoStack

视频编解码 视频会议 感知视频编码 李佳俐

坚守音视频领域多年:是偶然,也是必然

十几年持续专注于音视频领域的在国内确实不多,我能坚守是偶然也是必然。早期的坚持是兴趣加上偶然因素,现在看到能够通过技术来极大的提升人类在各方面应用的效率时,更多的则是必然。网易云音乐音视频实验室负责人刘华平在采访中说到。

LiveVideoStack

视频技术 音频技术 丢包补偿 网易云音乐

音视频领域或将开启”外卷“之路

如果说让我们聊一聊2021年音视频技术领域在这一年中的变化,莫不如从LiveVideoStackCon 2021 音视频技术大会 上海站 & 北京站,这两场大会缩影来看。

LiveVideoStack

外卷 音视频技术 视频编解码 开源技术 系统架构

直播时代的下一个江湖

直播时代的下一个江湖在哪儿?欢迎来到LiveVideoStackCon 2021 音视频技术大会北京站一起探索……

LiveVideoStack

RTC 音视频技术 视频编解码 传输协议 开源

基于FPGA的高性能视频硬件编码器

本文详细介绍了现有视频编码方案存在的挑战,并对高性能视频硬件编码技术进行了详细解析。

LiveVideoStack

FFmpeg 视频编解码 5G 阿里巴巴 杨名远

课程推荐

轻松掌握WebAssembly视频播放器

紧抓多媒体生态趋势,将浏览器、WebAssembly和Rust等热点结合;熟知播放器工作原理,为实现商业化H.264/H.265播放器打下坚实基础;课程包含图文、代码、视频,降低学习门槛; 李超精准讲解,及时详细解答

阅读排行
  • 2周
  • 4周
  • 16周