技术标签: 音频技术

音频品鉴与歌唱评价 —— 音频内容理解实践

歌唱评价是K歌系统中核心技术之一。近年来,歌唱评价领域也发生着多元化和深度化的变革。本次LiveVideoStackCon 2022 北京站邀请到腾讯音乐天琴实验室高级研究员——江益靓,为大家介绍全民K歌的多维度评价技术和深度歌唱评价技术的实践,以及优质内容挖掘中使用的音频品鉴系统。

音频技术 内容理解

下一代听歌识曲技术 —— 从信号处理到深度学习

音乐丰富我们的生活;音乐传达人类的情感;音乐表达人类的艺术。人类文明的进程中离不开音乐这个载体,音乐也离不开人类的真情创作。在听到好听却没听过的歌曲时,如何快速准确得到该歌曲的歌名成为当务之急。LiveVideoStackCon 2022 北京站邀请到了腾讯音乐的孔令城老师,为我们介绍 QQ 音乐在听歌识曲方面的成熟方案。

音频技术 听歌识曲

音乐创作引擎实现即时交互体验的探索

LiveVideoStackCon 2022 上海站大会我们邀请到了北京灵动音科技有限公司(DeepMusic) CTO 苑盛成博士为我们详细介绍了这种新型音乐创作引擎的研究成果和技术实践。

Max

音频技术

最新日程海报(LiveVideoStackCon 2022 音视频技术大会 北京站 )

LiveVideoStackCon 2022 音视频技术大会 北京站 最新日程。

LiveVideoStack

实时音视频 音频技术 视频技术

是时候展现“真正”的技术了!

LiveVideoStackCon 2022 北京站将延期至2023年第一季度,一切就绪,只等你来。

LiveVideoStack

视频传输 视频技术 音频技术 视频编解码 AI 元宇宙

对话腾讯天琴赵伟峰:当音乐与科技结合,会碰撞出怎样的火花?

LiveVideoStack采访到了腾讯音乐天琴实验室的音频技术负责人赵伟峰,请他来跟大家聊聊天琴实验室在音频技术上所取得的各类创新、与高校开展的研究合作、天琴所获得的多项技术专利以及他对音频技术发展的未来展望。

LiveVideoStack

音频技术 音频编解码 腾讯音乐

为什么参与LiveVideoStackCon 2022 北京站

【最新速递】LiveVideoStackCon2022 北京站大会进展

LiveVideoStack

视频技术 音频技术 人工智能 元宇宙

An interview with Professor Karlheinz Brandenburg: MP3 was just the right technology at the right time

近期,LiveVideoStack采访到了被人们称为“MP3之父”的Karlheinz Brandenburg教授。

LiveVideoStack

音频技术 音频编码 音频解码 音频编解码 MP3 Karlheinz Brandenburg

MPEG音频编码三十年

在这三十年中,MPEG的音频组向市场输入了一代又一代的音频编码标准。作为MPEG最佳传统,这些标准在某种意义上是通用的,可用于纯音频或者音频+视频应用程序。随着新一代音频编码标准构建在前代编码标准之上,这些编码标准通常可进行扩展。

LiveVideoStack

音频技术 编码 MPEG

MP3是如何诞生的?

向MP3之父 Karlheinz Brandenburg提问。

LiveVideoStack

MP3 音频技术

Clubhouse:使用空间音频提升对话质量

空间音频是一种新技术:当你只是戴上耳机,它也能重现影院级别的环绕声。对于Clubhouse这样的群组通信app,空间音频不仅能带来很棒的音效,还能使你与他人轻松对话。

LiveVideoStack

空间音频 音频技术 Clubhouse Justin Uberti

音频正当时:我们和声网音频专家聊了聊AI、元宇宙、空间音频和“沉浸感”

近日,LiveVideoStack采访到了声网的音频算法负责人冯建元,请他来跟大家聊聊音频相对于视频的优势、音频在元宇宙中的应用、国内音频技术与AI结合的发展、过去一年声网在音频领域所取得突破和对前沿音频技术的探索等。

LiveVideoStack

音频技术 AI 元宇宙 声网 冯建元

使用FFmpeg添加、删除、替换和提取视频中的音频

FFmpeg是一个超级强大的工具,它可以在视频文件中增添、删除、提取或者替换音频。

LiveVideoStack

FFmpeg 视频技术 音频技术 开源技术 编解码 FFmpeg

对话王晶:音频人才亟待培养,高水平研究人员尤其欠缺

在此次与LiveVideoStack的对话中,王教授分享了过去几年音频领域的重要发展和创新、音频编解码器的独特之处、AI与音频编码技术结合的突破以及目前音频领域人才培养和输出所面临的困境等。

LiveVideoStack

音频技术 王晶

如何构建全球实时音视频云及其海外网络传输优化

全球不同国家和地区的网络基建水平参差不齐,如何利用有限的网络资源提供更高质量的音视频通话体验是音视频服务商必须面对的挑战。在此次LiveVideoStackCon 2021 音视频技术大会 北京站,我们邀请到了即构科技的RTC后台技术总监——肖潇,为我们介绍即构科技是如何构建全球实时音视频云以及其海外网络传输优化技术。

LiveVideoStack

音频技术 视频技术 网络传输 RTC 即构科技

三星电子推出X-net架构用于语音通话

近日,三星电子推出X-net,这是一种联合学习的Scale-down和Scale-up架构,用于语音编码中的预处理和后处理,作为在带宽受限的语音通话信道上扩展带宽的一种手段。

LiveVideoStack

音频技术 网络传输

Google’s Ambition in Audio Compression: an Interview with Jamieson Brettle and Jan Skoglund from Google

an Interview with Jamieson Brettle and Jan Skoglund from Google

LiveVideoStack

音频技术

完整声学极简史

偶然得见一篇文章简单介绍了声学发展史,与我之前的几篇文章有很大关联。所以将其添油加醋放到这里,用编年史的形式呈现。显然这里涵盖的仅为声学史的一隅,所以在厚颜无耻的“完整”二字后面,加上“极简”以示谦卑。

LiveVideoStack

音频技术

奈奎斯特采样定理中的奈奎斯特到底是谁?

当用手机和家人通话、视频的时候,你有没有想过你的声音、影像为什么能传送到千里之外的地方?

LiveVideoStack

音频技术

应用深度学习使用 Tensorflow 对音频进行分类

在视觉和语言领域的深度学习方面取得了很多进展,文中一步步说明当我们处理音频数据时,使用了哪些类型的模型和流程。

LiveVideoStack

AI 音频技术

音乐编解码器的更新情况

在我最近关于高分辨率音频播放器以及为它们提供内容的服务和外部DAC和放大器的报道中,我意识到我向我的读者抛出了很多新的可能不熟悉的术语。自从我上一次深入介绍无损和有损音频压缩标准以来,已经有一段时间了,确切地说,是20年!而且世事变迁,所以这个简短的更新可能是迟来的。

LiveVideoStack

音频技术

新的Google Lyra音频编解码器对实时视频流意味着什么?

通过语言编码中的码率缩减趋势,Lyra与Opus中的区别比较,Lyra的作用,XDN平台上的高效语音编码技术几个方面探讨新的Google Lyra音频编解码器对实时视频流的意义。

LiveVideoStack

音频技术 视频编解码 网络传输

音视频算法在淘宝中的应用

近年来,内容业务在行业蓬勃发展。淘宝也在积极进行内容化转型,今天我们邀请到阿里巴巴淘系技术高级算法专家——王立波(庄恕),回顾淘宝从图文到短视频直播的发展历程,介绍音视频算法在其中的应用和未来的投入方向包括编解码、视频处理、音频通讯与互动。

LiveVideoStack

音频技术 算法

基于深度学习的实时噪声抑制——深度学习落地移动端的范例

在实时通讯技术迅猛发展的今天,人们对通话时的降噪要求也不断提高。深度学习也被应用于实时的噪声抑制。本次LiveVideoStackCon 2021 上海站中,我们邀请到了声网Agora音频算法负责人冯建元老师为我们分享深度学习落地移动端的范例,遇到的问题和未来的展望。

LiveVideoStack

深度学习 AI 音频技术

算法也浪漫——我们和声网音频专家聊了聊美声、降噪与超高音质

与其说音频技术小众,不如说大家对周围最常用的东西太过习以为常,反而没意识到这些“习以为常”背后的音频技术的存在。

LiveVideoStack

音频技术

WebRTC 系列之音频会话管理

WebRTC(Web Real-Time Communication)是一个支持网页浏览器进行实时语音对话或视频对话的 API。W3C 和 IETF 在2021年1月26日共同宣布 WebRTC 1.0 定稿,促使 WebRTC 从事实上的互联网通信标准成为了官方标准,其在不同场景的应用将得到更为广泛的普及。

陶金亮

WebRTC 音频技术 iOS

Decode the Week|21 0222

Clubhouse全球下载量超800万 、TikTok电商服务、xCloud测试Web版本等

LiveVideoStack

iOS Android 音频技术

Decode the Week|21 0118

YouTube测试购物功能、 2021 最值得效力的科技公司榜单、2020 移动应用年度报告等

线上交友 音频技术 移动应用

2021 音视频技术趋势不完全预测

The Economist (经济学人)在 The World in 2021 特别刊的编者序中写到:“21 是一个与好运、冒险、机遇和掷骰子有关的数字。

LiveVideoStack

边缘计算 网络传输 音频技术 HDR 开源

非线性声学回声消除技术

本文详细介绍华为云音视频团队推出的双耦合的声学回声消除算法以及实验检验结果。

LiveVideoStack

音频技术 AI 非线性声学回声

互动协作白板与音视频实时同步技术实践

本文整理自即构科技互动白板技术负责人陈晓聪在LiveVideoStack的线上分享,内容主要围绕白板与音视频的同步和白板的多端实时互动两个角度,深度解析即构在互动白板方面的技术探索实践。

LiveVideoStack

音频技术 互动白板 实时音视频

从旧金山到滨江区,系统依旧收敛稳定

专访网易云信资深音视频算法工程师郝一亚

LiveVideoStack

音频技术 AI

情感语音合成技术难点突破与未来展望

在语音交互中语音识别、语音合成、语音理解是必不可少的环节。

LiveVideoStack

音频技术 标贝科技 李秀林

开源编解码器 SOLO 源码解读:带宽扩展与窄带编码

声网 Agora 在 2019 年 10 月 24 日,正式对所有开发者开源自研的抗丢包音频编解码器 SOLO。该编解码器适用于需要实时音频交互的场景,特别针对弱网对抗进行了优化,并且在相同弱网环境下 MOS 分优于 Opus。SOLO 可应用于各类 RTC 应用,并且可不与 Agora SDK 绑定使用。本文将从源码角度解读 SOLO 的带宽扩展与窄带编码。

LiveVideoStack

开源技术 音频技术 声网

坚守音视频领域多年:是偶然,也是必然

十几年持续专注于音视频领域的在国内确实不多,我能坚守是偶然也是必然。早期的坚持是兴趣加上偶然因素,现在看到能够通过技术来极大的提升人类在各方面应用的效率时,更多的则是必然。网易云音乐音视频实验室负责人刘华平在采访中说到。

LiveVideoStack

视频技术 音频技术 丢包补偿 网易云音乐

聊五分钟未来——视频会议音频技术的下半场

下一代音视频会议系统必须处理好无缝衔接智能手机、平板电脑和PC桌面系统的问题。视频会议系统应该做到可以随时随地接入转换。这种移动性的需求要求对异构终端设备间的一致性问题进行解决。

LiveVideoStack

视频会议 音频技术

“不要随便打扰一个正在开视频会议的人”

“不要随便打扰一个正在开视频会议的人”——因为你永远不知道他下一秒会不会被老板call out。

LiveVideoStack

视频会议 视频技术 音频技术 LiveVideoStack

打造极致体验:字节跳动亿级 DAU 背后的音视频技术最佳实践

6月26日,火山引擎开发者社区将举办第三期Meetup,我们邀请到了字节跳动的四位技术大咖,同大家一起聊聊亿级DAU短视频产品背后的音视频、直播、点播、RTC等最佳技术实践,探讨如何打造极致的音视频用户体验,揭秘支撑抖音和西瓜等现象级产品背后的秘密“武器”。

LiveVideoStack

RTC 音频技术 QoE 火山引擎

实时音视频技术的演进与应用

本次分享我们邀请到了来自腾讯云实时音视频TRTC后台的研发负责人薛笛,他向我们分享了腾讯云TRTC在架构升级和产品实践中的经验。仔细讲解了混音引擎最初的制造源、在整个优化过程中发现的问题以及解决方法,为后来做腾讯会议和云呼叫中心打下了一个良好的基础。

LiveVideoStack

TRTC 网络传输 音频技术

Decode the Week|21 0322

Facebook 最新可佩戴 AR 设备、AR 设备未来五年市场扩张、语音社交新创Swell等

LiveVideoStack

AR VR 音频技术 网络传输

在3kbps的带宽下还能清晰地语音聊天?

Google最新推出的音频编解码器Lyra,不仅实现了以每秒3kb网络宽带提供听起来自然清晰的语音聊天,还可以在仅90ms延迟的情况下在从高端云服务器到中端智能手机的任何设备上运行。

Teresa

音频技术 视频编解码

Decode the Week|21 0308

TwitterSpaces赶超Clubhouse 、比尔 · 盖茨称自己使用Android手机等

LiveVideoStack

Android 音频技术

Decode the Week|20 1026

猿辅导成全球最具价值科技教育公司、巴基斯塔解禁TikTok、等

LiveVideoStack

音频技术 网络传输 5G

美摄科技助攻小米10,MI剪辑功能可一键生成大片级VLOG

二月中旬,小米10系列手机正式发布,作为小米10周年的诚意之作,“科技突破极限”正式进军高端市场。小米10系列不仅搭载了目前为止性能最为强劲的高通骁龙865处理器,更拥有LPDDR5内存,1亿像素主摄,横向振动马达等顶级配置。

LiveVideoStack

AI 图像处理 音频技术 北京美摄网络科技有限公司 LiveVideoStack 音视频

课程推荐

轻松掌握WebAssembly视频播放器

紧抓多媒体生态趋势,将浏览器、WebAssembly和Rust等热点结合;熟知播放器工作原理,为实现商业化H.264/H.265播放器打下坚实基础;课程包含图文、代码、视频,降低学习门槛; 李超精准讲解,及时详细解答

阅读排行
  • 2周
  • 4周
  • 16周