技术文章:音频技术

音乐创作引擎实现即时交互体验的探索

LiveVideoStackCon 2022 上海站大会我们邀请到了北京灵动音科技有限公司(DeepMusic) CTO 苑盛成博士为我们详细介绍了这种新型音乐创作引擎的研究成果和技术实践。

Max

音频技术

奇声(IQDubbing)– 面向影视剧的AI配音技术

LiveVideoStackCon 2022上海站大会邀请到了爱奇艺 AI算法高级经理 李海老师,为我们分享现代影视剧配音面临的挑战,以及面向影视剧的AI配音技术 —— 奇声(IQDubbing)的技术实现与应用实践。

Max

AI配音

AI自动剪辑生成视频探索实践

网易云音乐 音视频算法专家 赵剑,详细介绍网易云音乐结合多年音乐领域多模态算法能力积累与实际业务需求,实现AI自动剪辑生成视频的技术探索与与实践。

Max

AI剪辑 音视频技术

语音前处理技术在会议场景中的应用及挑战

随着在线会议的普及,用户已经不再满足于能听到,而是要有更为极致的听感体验,如何能够在复杂多变的应用场景中依旧保证声音清晰流畅是对会议系统的极大挑战。

顾骋

语音前处理 视频会议

音视频杂谈–LiveVideoStack Meet厦门

2022年11月12日,有幸参与了LVS举办的厦门meet活动,本文是整理相关与会内容,以及自己的一些补充和理解。

Fenngtun

云游戏 3D成像 QUIC

对话ZEGO即构科技许明龙:聊聊元宇宙与实时互动RTI

元宇宙作为当前热门话题之一,受到了业界广泛地关注,不少企业纷纷开始依托现有业务与技术能力布局元宇宙领域,迎接这个新的风口。

LiveVideoStack

元宇宙 RTI 即构科技

最新日程海报(LiveVideoStackCon 2022 音视频技术大会 北京站 )

LiveVideoStackCon 2022 音视频技术大会 北京站 最新日程。

LiveVideoStack

实时音视频 音频技术 视频技术

对话安谋科技周华:编解码硬件的机遇与挑战

我们很荣幸地邀请到了来自安谋科技,视频编解码处理器研发负责人周华老师,来和我们聊一聊编解码硬件的机遇与挑战,以及介绍今年新推出的“玲珑”VPU处理器有哪些亮点。

LiveVideoStack

编解码芯片 视频编解码 硬件编码

基于无监督预训练的语音识别技术落地实践 火山语音表示有话要说

火山语音团队在基于无监督预训练的语音识别技术落地过程中,针对三大痛点进行了算法改进和工程优化,形成一套完整易推广的落地方案。本文将从落地流程、算法优化以及工程优化等环节展开详尽介绍。

LiveVideoStack

语音识别 火山引擎

新一代视频编码标准VVC的芯片设计思考

LiveVideoStackCon2022上海站大会邀请到了复旦大学微电子学院的范益波老师和和大家一同探讨了针对新一代视频编码标准VVC的芯片设计和思考。

LiveVideoStack

视频编解码 编解码芯片 范益波

对话腾讯音乐天琴董治:聊聊元宇宙与AI技术驱动虚拟人

入局元宇宙需要具备哪些能力?以及用AI技术驱动的虚拟人从建模到渲染,再到场景应用,当前遇到的瓶颈是什么?腾讯音乐天琴实验室在AI驱动虚拟人方面又做了哪些工作?在本篇采访中,董治老师分享了很多观点和相关经验。

LiveVideoStack

数字人 AI 元宇宙

对话火山引擎王悦:多媒体继续向更高清,更交互,更沉浸演进

火山引擎支撑起了字节跳动旗下的音视频能力,支持数亿DAU,为每天数千亿次播放与互动提供保障,他们是如何做好这一切的?除了数据驱动、A/B测试还有哪些深度的思考与方法呢?

LiveVideoStack

音视频技术

七牛宣利民:低代码也是时代发展的产物

“低代码是时代发展的产物。”宣利民表示,很多中小型公司内部没有一个成建制的音视频技术团队,导致在业务中引入音视频服务的研发门槛和周期都比较不理想,这是推出低代码平台的初衷。

LiveVideoStack

低代码 音视频技术 七牛云 宣利民

「延期通知」LiveVideoStackCon 2022 音视频技术大会北京站

LiveVideoStackCon 2022 音视频技术大会 北京站将延期至11月25日-26日举行。

LiveVideoStack

实时音视频 音视频技术大会

对话腾讯李志成:云端渲染将从2B、游戏扩展到XR

“云游戏不得不考虑高昂的GPU成本,2B客户有更高的付费意愿使用云端渲染服务。”

LiveVideoStack

XR 云渲染 云游戏 音视频技术

对话快手苍鹏:播放器还有什么新玩法?

在LiveVideoStackCon 2022北京大会前夕,我们和苍鹏畅谈了播放器的未来。

LiveVideoStack

播放器 视频技术 快手

对话PPIO边缘云联合创始人王闻宇,聊聊边缘计算与元宇宙

我们很荣幸地邀请到了PPIO边缘云的联合创始人&CTO 王闻宇老师,一同聊一聊边缘计算与元宇宙的交集,以及目前的发展情况。

LiveVideoStack

元宇宙 边缘计算

是时候展现“真正”的技术了!

LiveVideoStackCon 2022 北京站将延期至2023年第一季度,一切就绪,只等你来。

LiveVideoStack

视频传输 视频技术 音频技术 视频编解码 AI 元宇宙

对话首都在线刘铮:出海背后的陪跑者

首都在线刘铮讲述首都在线在服务出海企业过程中看到的机遇和面临的种种挑战。

LiveVideoStack

出海 网络传输 刘铮

对话美摄科技李磊:走出一条AI与传统视音频技术相结合的美摄特色道路

“美摄科技近几年已经在AI与传统视音频技术相结合的方向上走出了一条具有美摄特色的道路”。——美摄科技研发总监 李磊

LiveVideoStack

音视频技术 AI 北京美摄网络科技有限公司 李磊

对话腾讯天琴赵伟峰:当音乐与科技结合,会碰撞出怎样的火花?

LiveVideoStack采访到了腾讯音乐天琴实验室的音频技术负责人赵伟峰,请他来跟大家聊聊天琴实验室在音频技术上所取得的各类创新、与高校开展的研究合作、天琴所获得的多项技术专利以及他对音频技术发展的未来展望。

LiveVideoStack

音频技术 音频编解码 腾讯音乐

WebRTC开源项目现状

在今天这篇文章中,我们会详述WebRTC开源生态的现状,以及我们为什么需要做出必要的改变以确保WebRTC在未来几年能够健康发展。

LiveVideoStack

WebRTC 开源

对话腾讯陈仁健:聊一聊腾讯PAG动效解决方案的生产能力与开源情况

“PAG到目前为止已经迭代了5年,经历了四个大版本。最新的PAG4.0版本在今年年初开源…”

开源技术 深度学习 音视频开发

2022海外视频趋势营销分析

在本文中,我们将深入了解2022在线视频趋势,这些趋势包括视频内容开发中的热点、新兴事物以及如何利用二者与用户建立更好的连接。

LiveVideoStack

出海 视频技术

网心科技马婷:探寻边缘计算的“诗和远方”

LiveVideoStack走进网心科技,与行业To B资深专家、迅雷集团高级副总裁马婷女士开启深度对话。

LiveVideoStack

边缘计算 CDN 元宇宙 网心科技

声网3D在线互动场景空间音频的实时渲染——如何把“声临其境”推向极致

在Meta RTC场景中如何让不同人也能畅想“身临其境”的感觉?3D在线互动场景空间音频的实时渲染又有哪些应用?

LiveVideoStack

空间音频 实时渲染 声网 冯建元

腾讯云实时音视频出海技术实践及落地

本次分享将详细介绍腾讯云音视频客户在出海过程中所遇到的挑战,以及RT-ONE™网络的应对策略,为出海应用的音视频技术实践提供参考借鉴。

LiveVideoStack

出海 音视频技术 腾讯云

基于WebRTC的开源低延时播放器实践

在直播中良好的网络环境与低延时是优质交互体验的关键,在这个各家云服务厂商标准不统一的年代,如何让低延时直播更加便捷稳定呢?

LiveVideoStack

WebRTC 开源技术 低延时 播放器 网易云信 毕伟

七牛云QRTC背后的质量提升实践

QRTC产品作为流媒体流量入口之一,背后有一套完整的支撑体系。而在整个体系中,核心是要保障业务场景的稳定运行,保障音画质量的正常展现,那么业务与音画质量提升的实践方法有哪些呢?

LiveVideoStack

QRTC 网络传输 七牛云

影视级跨平台视频制作技术的落地实践

LiveVideoStackCon 2022音视频技术大会上海站邀请到了视杏科技的李志强老师,为我们分享影视级跨平台视频制作技术的落地实践。

LiveVideoStack

内容生产 视频技术 视杏科技 李志强

腾讯自研新一代AV1编解码器

LiveVideoStackCon 2022音视频技术大会上海站邀请到腾讯云香农实验室编解码器研发负责人张贤国老师,为大家介绍腾讯自研AV1编解码器。

LiveVideoStack

视频编解码 AV1 腾讯

端云协同创新优化音视频场景用户体验

火山引擎智能互动特效解决方案总监范青老师,为我们分享在字节内部业务线和外部企业服务线里面,视频云产品和视觉特效算法融合的最佳实践以及在业务的落地环节中,字节在这些方面发现的一些创新点以及技术积累。

LiveVideoStack

视频云 算法 音视频开发 火山引擎 范青

七牛云QRTC自研传输协议(QRTP)对音画质量的提升

于佳老师在LiveVideoStackCon 2022 上海站为我们讲述QRTN的网络架构是如何提升用户体验度的,以及分析其中的QRTP协议是如何对音画质量进行提升的。

LiveVideoStack

QRTC 网络传输 传输协议 视频质量 七牛云

PPIO边缘云聚焦音视频底层技术,探索元宇宙“登月工程”

本次分享将从VR/AR的核心指标及实现,云与边缘架构、编解码、网络传输路径等多个维度,全面分析元宇宙的音视频技术脉络,探讨元宇宙时代产业结构变化,介绍PPIO边缘云未来如何为元宇宙提供强大的基础设施服务。

LiveVideoStack

边缘云 元宇宙 音视频技术 PPIO边缘云

七牛云音画质量分析系统的行业前瞻

七牛云智能视频服务AI技术负责人宋宏亮,在LiveVideoStackCon 2022 音视频技术大会上海站为我们分享音画质量分析系统的行业前瞻。

LiveVideoStack

质量评价 视频技术 七牛云

从抖音到火山引擎——看流媒体技术演进和机会

在宋慎义老师的演讲中,我们看到了火山引擎一路走来的历程,也了解到通过结合不同的场景,火山引擎对外来探索的坚持。

LiveVideoStack

实时音视频 RTC 直播 编码 编解码 字节跳动 火山引擎 宋慎义

An interview with Professor Karlheinz Brandenburg: MP3 was just the right technology at the right time

近期,LiveVideoStack采访到了被人们称为“MP3之父”的Karlheinz Brandenburg教授。

LiveVideoStack

音频技术 音频编码 音频解码 音频编解码 MP3 Karlheinz Brandenburg

码率vs.分辨率,哪一个更重要?

在本文中,我们将讨论OTT领域中视频压缩和处理的基本问题:码率vs.分辨率,哪一个对视频流更重要?

LiveVideoStack

超分辨率 码率控制 视频编码

MPEG音频编码三十年

在这三十年中,MPEG的音频组向市场输入了一代又一代的音频编码标准。作为MPEG最佳传统,这些标准在某种意义上是通用的,可用于纯音频或者音频+视频应用程序。随着新一代音频编码标准构建在前代编码标准之上,这些编码标准通常可进行扩展。

LiveVideoStack

音频技术 编码 MPEG

8月5日我们一起,聚焦音视频、探秘技术新发展

大会报名倒计时8天,期待见面,会议详情及购票可咨询小秘书:13520771810(微信同号)。

LiveVideoStack

数字人 元宇宙 云游戏 深度学习 AI 开源技术 自动驾驶

专访即构科技李凯:音视频的有趣、行业前沿一直吸引着我

近日,LiveVideoStack邀请到了即构科技视频处理工程师李凯,请他来跟我们聊聊即构自研移动端实时超分辨率技术的优势与应用场景,在移动端实现此技术所遇到的挑战与困难,即构所采取的应对策略等。

LiveVideoStack

超分辨率 音视频技术 即构科技 李凯

2022 音视频技术风向标

这是我们成立5年以来筹备时间最长的一次音视频技术大会了。

LiveVideoStack

实时音视频 音视频技术

使用WebRTC作为RTMP的替代方案

WebRTC会是替代RTMP的最佳方案吗?在开发者中,这句话已经成为了流行语。正如我将在下文所解释的那样,它取决于你所使用的支持部署的技术和你想达成的目标。

LiveVideoStack

WebRTC 网络传输 RTMP

海内外技术人们“看”音视频技术的未来

内含8月5-6日 LiveVideoStackCon 2022 音视频技术大会完整版日程。

LiveVideoStack

音视频技术 元宇宙 视频传输 视频编解码 内容生产

MP3是如何诞生的?

向MP3之父 Karlheinz Brandenburg提问。

LiveVideoStack

MP3 音频技术

你有一个机会,这里有一个舞台

LiveVideoStackCon 是每个人的舞台,如果你在团队、公司中独当一面,在某一领域或技术拥有多年实践,并热衷于技术交流,欢迎申请成为 LiveVideoStackCon 的讲师。

LiveVideoStack

音视频技术 编解码 编解码芯片 人工智能 网络传输 开源技术

迈克尔·霍利:当我看到人们急着加入新行列、抛弃高度发展的老技术时,我就感到很伤心

这是一篇来自上世纪80年代的采访,采访对象为IoT先驱人物迈克尔·霍利。

LiveVideoStack

IoT 视频技术 迈克尔·霍利

使用FFmpeg进行HLS打包——FFmpeg简单学

在本文中,我们将学习使用FFmpeg进行HLS打包。

LiveVideoStack

FFmpeg hls+

Clubhouse:使用空间音频提升对话质量

空间音频是一种新技术:当你只是戴上耳机,它也能重现影院级别的环绕声。对于Clubhouse这样的群组通信app,空间音频不仅能带来很棒的音效,还能使你与他人轻松对话。

LiveVideoStack

空间音频 音频技术 Clubhouse Justin Uberti

Prime Video如何使用AI确保视频质量

用于检测宏块损坏、音频失真和音视频同步错误的检测器是Prime Video的三个质量保证工具。

LiveVideoStack

AI 视频质量 Prime Video Amazon

音频正当时:我们和声网音频专家聊了聊AI、元宇宙、空间音频和“沉浸感”

近日,LiveVideoStack采访到了声网的音频算法负责人冯建元,请他来跟大家聊聊音频相对于视频的优势、音频在元宇宙中的应用、国内音频技术与AI结合的发展、过去一年声网在音频领域所取得突破和对前沿音频技术的探索等。

LiveVideoStack

音频技术 AI 元宇宙 声网 冯建元

如何使用FFmpeg将AVI转换为MP4(有损转换和无损转换)

在本篇文章中,我们将学习如何使用FFmpeg把视频从AVI格式转换为MP4格式(在重新/不重新编码AVI文件的情况下)。

LiveVideoStack

FFmpeg AVI 开源技术

使用FFmpeg添加、删除、替换和提取视频中的音频

FFmpeg是一个超级强大的工具,它可以在视频文件中增添、删除、提取或者替换音频。

LiveVideoStack

FFmpeg 视频技术 音频技术 开源技术 编解码 FFmpeg

査勇:华为云在视频AI转码领域的技术实践

文章内容整理自2022.02.24期公开课

LiveVideoStack

视频技术 转码 AI AI转码 华为云 査勇

对话七牛云技术总监陈辉:音视频行业中的新系统新规划和新增长

继「音画质量分析系统」在 2021 LVS 专场发布后,在即将召开的 LiveVideoStackCon 2022 上,七牛云音视频团队又将带来怎样的发声?

LiveVideoStack

QRTC RTC 音视频开发 七牛云 陈辉

音视频PaaS的“未毕之旅”

本文由LiveVideoStack和赵加雨的对话整理而成,旨在还原一名技术创业者的思考,涉及创业、RTC与音视频PaaS、to B SaaS、出海和钉钉生态。

LiveVideoStack

音视频技术 钉钉 拍乐云 赵加雨 PaaS

一文简述FFmpeg

在本文中,我将带你快速了解FFmpeg以及这个软件的神奇用途,未来文章中我们将介绍FFmpeg的更多内容。

LiveVideoStack

FFmpeg 编解码 开源技术

对话美摄科技侯康:提升技术,拓展场景 美摄智能汽车视频处理方案已就位

来自美摄科技的算法工程师侯康,他向我们介绍了过去的一年美摄科技在音视频领域关注的重点、在美摄汽车智能剪辑方案开发过程中所做的工作、研发过程中遇到的“坑”以及最近推出的桌面端深度视频编辑解决方案“美映PC版”等。

LiveVideoStack

音视频技术 人工智能 智能汽车 北京美摄网络科技有限公司 侯康

构建DRM系统的重要基石——EME、CDM、AES、CENC和密钥

任何想要理解DRM的人都要遇到AES、CDM、CENC、EME等缩略词。对于初学者来说,这些词很容易混淆,但只有理解了它们,才能真正地理解DRM。

LiveVideoStack

DRM 数字版权 视频传输

人物专访 | 首都在线助力中国企业出海,提供全球云网服务一体化方案

近日,我们有幸采访了首都在线的首席网络架构师刘铮,聊一聊首都在线目前提供的服务、在音视频行业关注的重点以及如何助力中国企业出海等话题。

LiveVideoStack

云计算 IDC 音视频技术 刘铮

【日程发布】LiveVideoStackCon 2022 上海站

LiveVideoStackCon音视频技术大会2022上海站日程发布啦!

LiveVideoStack

音视频技术 LiveVideoStack LiveVideoStackCon2022上海

音视频技术下一个风口在哪里——LiveVideoStackCon 2022 上海站 演讲剧透

在去年北京站大会筹备过程中,我曾经采访过一些技术人,有问到这么一个问题:“您认为目前我们所处的“后疫情时代”,音视频技术领域的下一个风口在哪里?”

LiveVideoStack

超分辨率 硬件加速 编解码 LiveVideoStackCon2022上海 智能汽车

探秘冬奥开幕式背后的播控系统

2022年2月4日晚8点,一场美轮美奂的冬奥开幕式如约而至,作为本次奥运盛会的播控系统,澜景公司旗下的Hirender全媒体总控系统为全世界观众呈现出了最完美的视觉效果。

LiveVideoStack

视频传输 信号处理 播控系统 北京澜景科技有限公司 李林

LiveVideoStack年终技术盘点总结

在2021年底,LiveVideoStack策划了一次年终技术盘点,我们向音视频领域的一线技术工作者们发出了约稿邀请,希望他们能够输出一些音视频方向的技术内容。下面让我们再来重温一下2021年的年终技术盘点。

LiveVideoStack

互动白板 QUIC HDR WebRTC Miro 王晶 张昊

对话王晶:音频人才亟待培养,高水平研究人员尤其欠缺

在此次与LiveVideoStack的对话中,王教授分享了过去几年音频领域的重要发展和创新、音频编解码器的独特之处、AI与音频编码技术结合的突破以及目前音频领域人才培养和输出所面临的困境等。

LiveVideoStack

音频技术 王晶

FFmpeg 5.0 正式发布

近日,FFmpeg 5.0正式发布。这一新版本代号被命名为“Lorentz”,主要为纪念伟大的荷兰物理学家亨得里克·安顿·洛伦兹(Hendrik Antoon Lorentz)。此次重大发布包括大量API更改,并增添了一些新的特性。

FFmpeg 视频编解码 编解码

2022 WebRTC发展趋势分析

本篇为WebRTC技术专家Tsahi Levent-Levi发布在BlogGeek.me上的文章,我们翻译了其中部分内容发布在LiveVideoStack的公众号上。感谢Tsahi的授权。

LiveVideoStack

WebRTC 腾讯云 AV1 WebAssembly 直播 元宇宙

未来已来,音视频江湖再起波澜

“全真稳”,打通企业音视频“任督二脉”

LiveVideoStack

腾讯云 TRTC CDN SDK 腾讯云专区

音视频出海,如何乘风破浪?

最近几年,以TikTok为首的泛娱乐出海企业的成功让大家看到了中国之外的巨大市场和机会。但面对紧张的国际形势,严格的监管措施,很多跃跃欲试、想要开启出海业务的公司却望而却步:要不要出海?向哪里出海?如何应对“水土不服”?本地化如何开展?海外员工在管理上与国内有何不同?各种不确定性和疑问随之而来。

LiveVideoStack

出海 CDN

直播新玩法背后的音视频技术演进

近年来,直播改变了许多行业模式,其形态在不断的演进中也逐渐丰富起来。直播在字节跳动中衍生出了KTV歌房、直播答题、互动游戏、电商拍卖及企业直播等不同场景。本次分享我们邀请到火山引擎视频云音视频直播客户端研发负责人——徐鸿,向大家介绍直播场景中沉淀下的优秀架构能力和技术能力。

LiveVideoStack

直播连麦 直播 RTC AEC ANS AGC

从体验出发构建以增长为目标的视频服务体系

本次分享聚焦在字节跳动视频通过性能体验优化促进业务增长的实践。包括在分析方法上的探讨,如何衡量和预估体验优化对业务增长的贡献,以及具体的体验优化实践分享。

LiveVideoStack

体验优化

视频大时代下基础架构的演进

在本次LiveVideoStackCon 2021音视频技术大会 北京站,快手短视频架构负责人黄琦结合多年来对行业的观察与在快手的自身实践,和大家一起探讨视频大时代下基础架构的演进。

LiveVideoStack

实时音视频 音视频技术 AI 系统架构

下一代音视频SDK的方案设计

本次LiveVideoStackCon 2021北京站我们邀请到了腾讯云的常青来从产品能力、架构设计、以及技术原理等多个角度进行剖析分享。

LiveVideoStack

腾讯云 PaaS CDN

拍乐云基于AV1的实时视频系统技术实践

实时视频系统对于时延的要求极高,视频编码器必须满足实时性的要求。新一代视频标准AV1相比主流H.264在Rate-distortation性能的提升上是以复杂度的上升为代价的,当前应用设备的碎片化非常严重、设备的运算能力差异巨大,这些都是新技术落地实时系统面临的挑战。本次分享将围绕拍乐云在设计Pano Venus实时AV1通信系统时的一些技术实践展开深入分析与讲解,期望和大家共同探索实时视频技术的未来。

LiveVideoStack

实时音视频 视频编解码 AV1

​冲刺最后一公里——音视频场景下的边缘计算实践

在此次LiveVideoStackCon 2021 音视频技术大会 北京站,我们邀请到了网心科技首席架构师——曾伟纪,与大家分享一些实践历程和关键问题,以供参考。

LiveVideoStack

边缘计算

如何构建全球实时音视频云及其海外网络传输优化

全球不同国家和地区的网络基建水平参差不齐,如何利用有限的网络资源提供更高质量的音视频通话体验是音视频服务商必须面对的挑战。在此次LiveVideoStackCon 2021 音视频技术大会 北京站,我们邀请到了即构科技的RTC后台技术总监——肖潇,为我们介绍即构科技是如何构建全球实时音视频云以及其海外网络传输优化技术。

LiveVideoStack

音频技术 视频技术 网络传输 RTC 即构科技

即构科技:解决行业痛点,以MSDN为基础构建全球实时音视频通信云

近日,LiveVideoStack很荣幸地采访到了即构科技RTC后台技术总监——肖潇。

LiveVideoStack

MSDN RTC

三星电子推出X-net架构用于语音通话

近日,三星电子推出X-net,这是一种联合学习的Scale-down和Scale-up架构,用于语音编码中的预处理和后处理,作为在带宽受限的语音通话信道上扩展带宽的一种手段。

LiveVideoStack

音频技术 网络传输

陈曦:超低延迟下的实时合唱体验升级

本文来自即构科技行业解决方案总监 陈曦在LiveVideoStack公开课的分享,结合即构科技在实时合唱场景中实现极致工程化的经验,对超低延迟体验的优化思路进行了详细解析。

LiveVideoStack

低延迟 超低延迟 RTC

许路平:Gvoice千万在语音输入的那些事

GVoice为腾讯旗下的主流游戏提供低延迟语音通话服务,其特点是高并发、覆盖全球。本次分享的嘉宾许路平是GVoice后台负责人,他会详细介绍游戏业务的特点,以及GVoice针对性的架构与协议的设计原则和方法,高可用保障与成本控制,重点性能突破和未来展望等。

LiveVideoStack

Govice

Google’s Ambition in Audio Compression: an Interview with Jamieson Brettle and Jan Skoglund from Google

an Interview with Jamieson Brettle and Jan Skoglund from Google

LiveVideoStack

音频技术

MPEG Founder Leonardo Chiariglione: “MPEG’s Spirit Continues in MPAI”

最近Leonardo Chiariglione接受了LiveVideoStack的邮件采访,在采访中,我们和他一起讨论了新书 、MPEG 和 MPAI。下面是整理的采访稿。

LiveVideoStack

MPEG MPAI

近期对流媒体技术的思考

从年初到现在跟各领域的朋友们交流后对几个大伙频繁聊起的方向做了一些思考

LiveVideoStack

视频技术 音视频技术

安防视频上云的趋势、痛点及华为云视频接入服务探索及实践

随着视频资源与内容在互联网所占比重不断提升,相应的在视频资源利用水平以及不断提高的业务和产品需求之间的矛盾也会愈加突出。本文来自华为云视频接入服务产品经理齐彦昆在线上分享中的演讲,结合在视频接入服务的实践经验和大家一起探讨了视频上云的趋势、痛点及华为云视频接入服务的探索及实践。

LiveVideoStack

安防 云服务 视频技术 音视频技术

完整声学极简史

偶然得见一篇文章简单介绍了声学发展史,与我之前的几篇文章有很大关联。所以将其添油加醋放到这里,用编年史的形式呈现。显然这里涵盖的仅为声学史的一隅,所以在厚颜无耻的“完整”二字后面,加上“极简”以示谦卑。

LiveVideoStack

音频技术

奈奎斯特采样定理中的奈奎斯特到底是谁?

当用手机和家人通话、视频的时候,你有没有想过你的声音、影像为什么能传送到千里之外的地方?

LiveVideoStack

音频技术

「线上圆桌 – 科天云」兼容海量设备、应对复杂网络

后疫情时代,云会议已经被越来越多的企业熟知、使用,正在成为企业数字化办公的“新基建”,而支撑云会议的底层技术,RTC、音视频技术等也备受关注,正在赋能更多行业提升数字化管理和无接触服务能力。

LiveVideoStack

RTC 视频编解码 IoT

应用深度学习使用 Tensorflow 对音频进行分类

在视觉和语言领域的深度学习方面取得了很多进展,文中一步步说明当我们处理音频数据时,使用了哪些类型的模型和流程。

LiveVideoStack

AI 音频技术

LiveVideoStackCon 2021北京站 9月再次启航

2021年9月3~4日,LiveVideoStackCon北京站再次来袭!各路音视频技术大咖将齐聚北京,一起分享宝贵行业经验,探索音视频技术的未来。

LiveVideoStack

视频编解码 AR AV1 网络传输 4K

音乐编解码器的更新情况

在我最近关于高分辨率音频播放器以及为它们提供内容的服务和外部DAC和放大器的报道中,我意识到我向我的读者抛出了很多新的可能不熟悉的术语。自从我上一次深入介绍无损和有损音频压缩标准以来,已经有一段时间了,确切地说,是20年!而且世事变迁,所以这个简短的更新可能是迟来的。

LiveVideoStack

音频技术

音视频算法在淘宝中的应用

近年来,内容业务在行业蓬勃发展。淘宝也在积极进行内容化转型,今天我们邀请到阿里巴巴淘系技术高级算法专家——王立波(庄恕),回顾淘宝从图文到短视频直播的发展历程,介绍音视频算法在其中的应用和未来的投入方向包括编解码、视频处理、音频通讯与互动。

LiveVideoStack

音频技术 算法

音视频技术在云会议场景的拓展和未来

音视频技术不断发展,云会议场景在人们生活中也越来越常见。那么如何将云会议场景中的音视频技术不断提升改善?本次分享会我们邀请到了来自腾讯会议的商世东先生,他将与我们分享云视频技术在腾讯会议里面的一些领域使用情况和他们对未来的一些思考。

LiveVideoStack

实时音视频 视频会议

在线提问:音视频技术开发是事业还是热爱所在?

网易云信资深音视频引擎开发工程师王兴鹤专访。

LiveVideoStack

QoS WebRTC AI

算法也浪漫——我们和声网音频专家聊了聊美声、降噪与超高音质

与其说音频技术小众,不如说大家对周围最常用的东西太过习以为常,反而没意识到这些“习以为常”背后的音频技术的存在。

LiveVideoStack

音频技术

WebRTC 系列之音频会话管理

WebRTC(Web Real-Time Communication)是一个支持网页浏览器进行实时语音对话或视频对话的 API。W3C 和 IETF 在2021年1月26日共同宣布 WebRTC 1.0 定稿,促使 WebRTC 从事实上的互联网通信标准成为了官方标准,其在不同场景的应用将得到更为广泛的普及。

陶金亮

WebRTC 音频技术 iOS

如何为我们的应用程序提供一个更小、更快的视频通话库

在研究如何使视频通话在未来更高效,更易于扩展时,Facebook意识到,最好的方法是从头开始重新设计库并重写整个库,也就是Rsys。

LiveVideoStack

WebRTC 视频会议

云原生时代——华为云音视频质量监控与优化实践

本文详细介绍了基于大数据的音视频全流程质量监控评估体系和各个环节的优化实践,以及面向不同的业务和场景,如何通过不同的关键数据指标改进音视频服务的体验质量和产品成本。

LiveVideoStack

QoE 网络传输 QoS RTC

使用VoiceFliter-Lite改进设备上的语音识别

语音辅助技术使用户能够使用语音命令与他们的设备进行交互,并且依靠准确的语音识别来确保对特定用户的响应。但是在许多实际的使用案例中,这类技术的输入一般由重叠的语音组成,这给许多语音识别算法带来了巨大的挑战。

LiveVideoStack

AI

Decode the Week|20 1123

苹果降低应用商店收入一半分成、Twitter视频分享功能 Fleet、百度36亿美元收购 YY

LiveVideoStack

AI 视频技术 视频处理 直播

淘宝直播“一猜到底”

淘宝移动端实时语音识别技术方案及应用

LiveVideoStack

移动应用 直播连麦 网络传输 5G

非线性声学回声消除技术

本文详细介绍华为云音视频团队推出的双耦合的声学回声消除算法以及实验检验结果。

LiveVideoStack

音频技术 AI 非线性声学回声

“视频AI产品今后几年将是一片蓝海”

专访RealNetworks中国执行总裁乐永升

LiveVideoStack

AI 4K

通过视频着色进行自监督跟踪

在本文中,我们将学习一种新颖的自监督目标跟踪方法。

LiveVideoStack

AI 计算机视觉 机器学习 CNN

互动协作白板与音视频实时同步技术实践

本文整理自即构科技互动白板技术负责人陈晓聪在LiveVideoStack的线上分享,内容主要围绕白板与音视频的同步和白板的多端实时互动两个角度,深度解析即构在互动白板方面的技术探索实践。

LiveVideoStack

音频技术 互动白板 实时音视频

FFmpeg深度学习模块的历史、现状和计划

本文详细介绍了FFmpeg中深度学习模块的历史、现状及未来计划,并针对深度学习模块总体架构与代码实践做详细解析。

LiveVideoStack

FFmpeg AI OpenCV

Decode the Week | 20 0803

微软TikTok与白宫协商、2020最佳程序语言排名、科技巨头听证会、苹果季度财报超预期等

LiveVideoStack

Decode the Week 实时音视频 网络传输 5G

VVC专利池:MC-IF正召集专利拥有者

四大专利池有望在VVC时代统一。

Ant

VVC HEVC 视频编解码 MC-IF 包研

Decode the Week | 20 0727

TikTok两亿美元支持创作者、Netflix特效制作云平台、Alphabet热气球供网非洲等

LiveVideoStack

Decode the Week AI 网络传输 视频会议

视频生产环境下的音视频解决方案

音视频处理在生产环境下,对控制精准性有着更高的要求。

LiveVideoStack

转码 视频生产 云剪辑 Media Track 姜雨晴

情感语音合成技术难点突破与未来展望

在语音交互中语音识别、语音合成、语音理解是必不可少的环节。

LiveVideoStack

音频技术 标贝科技 李秀林

守得云开见日出——危机之下的音视频技术驱动产品创新

在全球疫情的今天,大量线上服务短时间内诞生或极速扩张。身处在云计算的时代,如何用远超以往的基础音视频云服务快速构建海量稳定的在线应用,以应对一场全人类的危机就显得尤为重要。本次LiveVideoStackCon 2020线上峰会我们邀请到了腾讯云音视频通信业务总经理李郁韬,他将从视频会议、在线教育和在线娱乐等典型场景来看音视频技术推动下的产品创新和机遇。

LiveVideoStack

在线教育 视频会议 WebRTC AI 腾讯云 李郁韬 视频会议 在线教育

坚守音视频领域多年:是偶然,也是必然

十几年持续专注于音视频领域的在国内确实不多,我能坚守是偶然也是必然。早期的坚持是兴趣加上偶然因素,现在看到能够通过技术来极大的提升人类在各方面应用的效率时,更多的则是必然。网易云音乐音视频实验室负责人刘华平在采访中说到。

LiveVideoStack

视频技术 音频技术 丢包补偿 网易云音乐

喜马拉雅贺雯迪:基于端到端TTS实现更具生动、富有情感的语音合成表现

现如今,随着TTS技术不断发展,用户对于语音合成的音质质量、流畅度等拥有更高追求。语音合成中的风格控制、音色转换、歌声合成等技术是目前业界的难点和共同追求的方向。本次采访邀请到了喜马拉雅的音频算法工程师贺雯迪,她将从语音合成领域、TTS技术的发展状况和应用场景等方向与大家一同探讨。

LiveVideoStack

贺雯迪

聊五分钟未来——视频会议音频技术的下半场

下一代音视频会议系统必须处理好无缝衔接智能手机、平板电脑和PC桌面系统的问题。视频会议系统应该做到可以随时随地接入转换。这种移动性的需求要求对异构终端设备间的一致性问题进行解决。

LiveVideoStack

视频会议 音频技术

“不要随便打扰一个正在开视频会议的人”

“不要随便打扰一个正在开视频会议的人”——因为你永远不知道他下一秒会不会被老板call out。

LiveVideoStack

视频会议 视频技术 音频技术 LiveVideoStack

抖音智创语音团队三维菁彩声助力总台中秋晚会沉浸式直播

2022年中央广播电视总台中秋晚会首次采用三维菁彩声 (Audio Vivid)进行制作,通过“百城千屏”超高清公共大屏传播体系进行播出。

LiveVideoStack

空间音频 视频技术

由“深”至“广”,探索2022音视频技术的无限可能

LiveVideoStackCon 2022 音视频技术大会 上海站的主题——「音视频 + 无限可能」

LiveVideoStack

5G 传输协议 网络传输 开源 4K 视频编解码 视频生产

什么是闭合GOP和开放GOP?

在本文中,我们将了解闭合GOP和开放GOP的概念。这两种类型的GOP在视频流化中非常常见,并会影响视频压缩效率、错误恢复以及ABR的切换能力。

LiveVideoStack

GOP

音视频领域或将开启”外卷“之路

如果说让我们聊一聊2021年音视频技术领域在这一年中的变化,莫不如从LiveVideoStackCon 2021 音视频技术大会 上海站 & 北京站,这两场大会缩影来看。

LiveVideoStack

外卷 音视频技术 视频编解码 开源技术 系统架构

直播时代的下一个江湖

直播时代的下一个江湖在哪儿?欢迎来到LiveVideoStackCon 2021 音视频技术大会北京站一起探索……

LiveVideoStack

RTC 音视频技术 视频编解码 传输协议 开源

Decode the Week|21 0524

苹果亚马逊同一天公布无损音质服务、 Google与Flutter、Snap 的 AR 战事等

LiveVideoStack

AI AR UWB

实时音视频技术的演进与应用

本次分享我们邀请到了来自腾讯云实时音视频TRTC后台的研发负责人薛笛,他向我们分享了腾讯云TRTC在架构升级和产品实践中的经验。仔细讲解了混音引擎最初的制造源、在整个优化过程中发现的问题以及解决方法,为后来做腾讯会议和云呼叫中心打下了一个良好的基础。

LiveVideoStack

TRTC 网络传输 音频技术

Decode the Week|21 0322

Facebook 最新可佩戴 AR 设备、AR 设备未来五年市场扩张、语音社交新创Swell等

LiveVideoStack

AR VR 音频技术 网络传输

在3kbps的带宽下还能清晰地语音聊天?

Google最新推出的音频编解码器Lyra,不仅实现了以每秒3kb网络宽带提供听起来自然清晰的语音聊天,还可以在仅90ms延迟的情况下在从高端云服务器到中端智能手机的任何设备上运行。

Teresa

音频技术 视频编解码

Decode the Week|21 0308

TwitterSpaces赶超Clubhouse 、比尔 · 盖茨称自己使用Android手机等

LiveVideoStack

Android 音频技术

Decode the Week|20 1109

Netflix测试有线电视频道、字节11亿入股掌阅、快手香港IPO、王者荣耀日活破一亿等

LiveVideoStack

Decode the Week | 20 1012

巴基斯坦封杀TikTok、Q3全球消费者App支出创纪录、百度进军短视频领域等

LiveVideoStack

视频处理 视频生产

美摄科技助攻小米10,MI剪辑功能可一键生成大片级VLOG

二月中旬,小米10系列手机正式发布,作为小米10周年的诚意之作,“科技突破极限”正式进军高端市场。小米10系列不仅搭载了目前为止性能最为强劲的高通骁龙865处理器,更拥有LPDDR5内存,1亿像素主摄,横向振动马达等顶级配置。

LiveVideoStack

AI 图像处理 音频技术 北京美摄网络科技有限公司 LiveVideoStack 音视频

课程推荐

轻松掌握WebAssembly视频播放器

紧抓多媒体生态趋势,将浏览器、WebAssembly和Rust等热点结合;熟知播放器工作原理,为实现商业化H.264/H.265播放器打下坚实基础;课程包含图文、代码、视频,降低学习门槛; 李超精准讲解,及时详细解答

阅读排行
  • 2周
  • 4周
  • 16周