随着手机相机功能日益强大,4k,8k,各类特色短视频的拍摄,编辑、播放需求日益增长,短视频应用的火爆也对当前的手机音视频技术提出了更高的要求,如何更好地提高用户体验成为了行业共同的命题。LiveVideoStackCon 2023 上海站邀请了小米的吴昊,从一名开发者的角度为大家分享他关于手机端音视频技术的一些思考与经验。
爱奇艺近年推出的明星陪看直播业务打造了明星真人与观众围绕影视剧综艺近距离实时互动的新体验,逐渐吸引了用户关注。而在技术落地方面,爱奇艺通过与第三方音视频服务供应商深度合作,各尽其能,最终实现了成本最小化,效果最大化。LiveVideoStackCon 2023 上海站邀请了来自爱奇艺的施幸东,为大家分享爱奇艺明星陪看直播业务的整体技术架构,以及爱奇艺从剧集版权管理、复用已有基础设施、高可用性保障等方面的作出的一些优化考虑 。
在音视频行业蓬勃发展的大环境下,触觉如何带动视听,为用户带来更沉浸式的体验?LiveVideoStack 2023上海站邀请到陆其明,和大家分享“触”手可及的视听新体验。分享内容包括触觉的生理基础、触觉生态发展现状、怎么做好的触感、触感应用开发的平台支持、国际标准,最后介绍RichTap为解决触感生态两大痛点提供的一体化方案。
根据权威数据表明,65%的行业数字化信息来自视频,基于此,音视频技术对于行业数字化来说是至关重要的。今天我想借此机会向大家介绍一个重量级的客户端产品——MediaBox,它将致力于实现行业音视频数字化再加速。
LiveVideoStackCon 2022 上海站大会我们邀请到了北京灵动音科技有限公司(DeepMusic) CTO 苑盛成博士为我们详细介绍了这种新型音乐创作引擎的研究成果和技术实践。
Max
LiveVideoStackCon 2022上海站大会邀请到了爱奇艺 AI算法高级经理 李海老师,为我们分享现代影视剧配音面临的挑战,以及面向影视剧的AI配音技术 —— 奇声(IQDubbing)的技术实现与应用实践。
Max
元宇宙作为当前热门话题之一,受到了业界广泛地关注,不少企业纷纷开始依托现有业务与技术能力布局元宇宙领域,迎接这个新的风口。
LiveVideoStack
我们很荣幸地邀请到了来自安谋科技,视频编解码处理器研发负责人周华老师,来和我们聊一聊编解码硬件的机遇与挑战,以及介绍今年新推出的“玲珑”VPU处理器有哪些亮点。
LiveVideoStack
火山语音团队在基于无监督预训练的语音识别技术落地过程中,针对三大痛点进行了算法改进和工程优化,形成一套完整易推广的落地方案。本文将从落地流程、算法优化以及工程优化等环节展开详尽介绍。
LiveVideoStack
LiveVideoStackCon2022上海站大会邀请到了复旦大学微电子学院的范益波老师和和大家一同探讨了针对新一代视频编码标准VVC的芯片设计和思考。
LiveVideoStack
入局元宇宙需要具备哪些能力?以及用AI技术驱动的虚拟人从建模到渲染,再到场景应用,当前遇到的瓶颈是什么?腾讯音乐天琴实验室在AI驱动虚拟人方面又做了哪些工作?在本篇采访中,董治老师分享了很多观点和相关经验。
LiveVideoStack
火山引擎支撑起了字节跳动旗下的音视频能力,支持数亿DAU,为每天数千亿次播放与互动提供保障,他们是如何做好这一切的?除了数据驱动、A/B测试还有哪些深度的思考与方法呢?
LiveVideoStack
“低代码是时代发展的产物。”宣利民表示,很多中小型公司内部没有一个成建制的音视频技术团队,导致在业务中引入音视频服务的研发门槛和周期都比较不理想,这是推出低代码平台的初衷。
LiveVideoStack
LiveVideoStackCon 2022 音视频技术大会 北京站将延期至11月25日-26日举行。
LiveVideoStack
我们很荣幸地邀请到了PPIO边缘云的联合创始人&CTO 王闻宇老师,一同聊一聊边缘计算与元宇宙的交集,以及目前的发展情况。
LiveVideoStack
“美摄科技近几年已经在AI与传统视音频技术相结合的方向上走出了一条具有美摄特色的道路”。——美摄科技研发总监 李磊
LiveVideoStack
LiveVideoStack采访到了腾讯音乐天琴实验室的音频技术负责人赵伟峰,请他来跟大家聊聊天琴实验室在音频技术上所取得的各类创新、与高校开展的研究合作、天琴所获得的多项技术专利以及他对音频技术发展的未来展望。
LiveVideoStack
在Meta RTC场景中如何让不同人也能畅想“身临其境”的感觉?3D在线互动场景空间音频的实时渲染又有哪些应用?
LiveVideoStack
本次分享将详细介绍腾讯云音视频客户在出海过程中所遇到的挑战,以及RT-ONE™网络的应对策略,为出海应用的音视频技术实践提供参考借鉴。
LiveVideoStack
QRTC产品作为流媒体流量入口之一,背后有一套完整的支撑体系。而在整个体系中,核心是要保障业务场景的稳定运行,保障音画质量的正常展现,那么业务与音画质量提升的实践方法有哪些呢?
LiveVideoStack
LiveVideoStackCon 2022音视频技术大会上海站邀请到了视杏科技的李志强老师,为我们分享影视级跨平台视频制作技术的落地实践。
LiveVideoStack
LiveVideoStackCon 2022音视频技术大会上海站邀请到腾讯云香农实验室编解码器研发负责人张贤国老师,为大家介绍腾讯自研AV1编解码器。
LiveVideoStack
本次分享将从VR/AR的核心指标及实现,云与边缘架构、编解码、网络传输路径等多个维度,全面分析元宇宙的音视频技术脉络,探讨元宇宙时代产业结构变化,介绍PPIO边缘云未来如何为元宇宙提供强大的基础设施服务。
LiveVideoStack
七牛云智能视频服务AI技术负责人宋宏亮,在LiveVideoStackCon 2022 音视频技术大会上海站为我们分享音画质量分析系统的行业前瞻。
LiveVideoStack
近期,LiveVideoStack采访到了被人们称为“MP3之父”的Karlheinz Brandenburg教授。
LiveVideoStack
在这三十年中,MPEG的音频组向市场输入了一代又一代的音频编码标准。作为MPEG最佳传统,这些标准在某种意义上是通用的,可用于纯音频或者音频+视频应用程序。随着新一代音频编码标准构建在前代编码标准之上,这些编码标准通常可进行扩展。
LiveVideoStack
近日,LiveVideoStack邀请到了即构科技视频处理工程师李凯,请他来跟我们聊聊即构自研移动端实时超分辨率技术的优势与应用场景,在移动端实现此技术所遇到的挑战与困难,即构所采取的应对策略等。
LiveVideoStack
WebRTC会是替代RTMP的最佳方案吗?在开发者中,这句话已经成为了流行语。正如我将在下文所解释的那样,它取决于你所使用的支持部署的技术和你想达成的目标。
LiveVideoStack
空间音频是一种新技术:当你只是戴上耳机,它也能重现影院级别的环绕声。对于Clubhouse这样的群组通信app,空间音频不仅能带来很棒的音效,还能使你与他人轻松对话。
LiveVideoStack
在本篇文章中,我们将学习如何使用FFmpeg把视频从AVI格式转换为MP4格式(在重新/不重新编码AVI文件的情况下)。
LiveVideoStack
来自美摄科技的算法工程师侯康,他向我们介绍了过去的一年美摄科技在音视频领域关注的重点、在美摄汽车智能剪辑方案开发过程中所做的工作、研发过程中遇到的“坑”以及最近推出的桌面端深度视频编辑解决方案“美映PC版”等。
LiveVideoStack
任何想要理解DRM的人都要遇到AES、CDM、CENC、EME等缩略词。对于初学者来说,这些词很容易混淆,但只有理解了它们,才能真正地理解DRM。
LiveVideoStack
近日,我们有幸采访了首都在线的首席网络架构师刘铮,聊一聊首都在线目前提供的服务、在音视频行业关注的重点以及如何助力中国企业出海等话题。
LiveVideoStack
在去年北京站大会筹备过程中,我曾经采访过一些技术人,有问到这么一个问题:“您认为目前我们所处的“后疫情时代”,音视频技术领域的下一个风口在哪里?”
LiveVideoStack
2022年2月4日晚8点,一场美轮美奂的冬奥开幕式如约而至,作为本次奥运盛会的播控系统,澜景公司旗下的Hirender全媒体总控系统为全世界观众呈现出了最完美的视觉效果。
LiveVideoStack
视频传输 信号处理 播控系统 北京澜景科技有限公司, 李林,
在此次与LiveVideoStack的对话中,王教授分享了过去几年音频领域的重要发展和创新、音频编解码器的独特之处、AI与音频编码技术结合的突破以及目前音频领域人才培养和输出所面临的困境等。
LiveVideoStack
近日,FFmpeg 5.0正式发布。这一新版本代号被命名为“Lorentz”,主要为纪念伟大的荷兰物理学家亨得里克·安顿·洛伦兹(Hendrik Antoon Lorentz)。此次重大发布包括大量API更改,并增添了一些新的特性。
本篇为WebRTC技术专家Tsahi Levent-Levi发布在BlogGeek.me上的文章,我们翻译了其中部分内容发布在LiveVideoStack的公众号上。感谢Tsahi的授权。
LiveVideoStack
最近几年,以TikTok为首的泛娱乐出海企业的成功让大家看到了中国之外的巨大市场和机会。但面对紧张的国际形势,严格的监管措施,很多跃跃欲试、想要开启出海业务的公司却望而却步:要不要出海?向哪里出海?如何应对“水土不服”?本地化如何开展?海外员工在管理上与国内有何不同?各种不确定性和疑问随之而来。
LiveVideoStack
本次分享聚焦在字节跳动视频通过性能体验优化促进业务增长的实践。包括在分析方法上的探讨,如何衡量和预估体验优化对业务增长的贡献,以及具体的体验优化实践分享。
LiveVideoStack
在本次LiveVideoStackCon 2021音视频技术大会 北京站,快手短视频架构负责人黄琦结合多年来对行业的观察与在快手的自身实践,和大家一起探讨视频大时代下基础架构的演进。
LiveVideoStack
实时视频系统对于时延的要求极高,视频编码器必须满足实时性的要求。新一代视频标准AV1相比主流H.264在Rate-distortation性能的提升上是以复杂度的上升为代价的,当前应用设备的碎片化非常严重、设备的运算能力差异巨大,这些都是新技术落地实时系统面临的挑战。本次分享将围绕拍乐云在设计Pano Venus实时AV1通信系统时的一些技术实践展开深入分析与讲解,期望和大家共同探索实时视频技术的未来。
LiveVideoStack
在此次LiveVideoStackCon 2021 音视频技术大会 北京站,我们邀请到了网心科技首席架构师——曾伟纪,与大家分享一些实践历程和关键问题,以供参考。
LiveVideoStack
近日,三星电子推出X-net,这是一种联合学习的Scale-down和Scale-up架构,用于语音编码中的预处理和后处理,作为在带宽受限的语音通话信道上扩展带宽的一种手段。
LiveVideoStack
本文来自即构科技行业解决方案总监 陈曦在LiveVideoStack公开课的分享,结合即构科技在实时合唱场景中实现极致工程化的经验,对超低延迟体验的优化思路进行了详细解析。
LiveVideoStack
GVoice为腾讯旗下的主流游戏提供低延迟语音通话服务,其特点是高并发、覆盖全球。本次分享的嘉宾许路平是GVoice后台负责人,他会详细介绍游戏业务的特点,以及GVoice针对性的架构与协议的设计原则和方法,高可用保障与成本控制,重点性能突破和未来展望等。
LiveVideoStack
an Interview with Jamieson Brettle and Jan Skoglund from Google
LiveVideoStack
最近Leonardo Chiariglione接受了LiveVideoStack的邮件采访,在采访中,我们和他一起讨论了新书 、MPEG 和 MPAI。下面是整理的采访稿。
LiveVideoStack
随着视频资源与内容在互联网所占比重不断提升,相应的在视频资源利用水平以及不断提高的业务和产品需求之间的矛盾也会愈加突出。本文来自华为云视频接入服务产品经理齐彦昆在线上分享中的演讲,结合在视频接入服务的实践经验和大家一起探讨了视频上云的趋势、痛点及华为云视频接入服务的探索及实践。
LiveVideoStack
后疫情时代,云会议已经被越来越多的企业熟知、使用,正在成为企业数字化办公的“新基建”,而支撑云会议的底层技术,RTC、音视频技术等也备受关注,正在赋能更多行业提升数字化管理和无接触服务能力。
LiveVideoStack
在我最近关于高分辨率音频播放器以及为它们提供内容的服务和外部DAC和放大器的报道中,我意识到我向我的读者抛出了很多新的可能不熟悉的术语。自从我上一次深入介绍无损和有损音频压缩标准以来,已经有一段时间了,确切地说,是20年!而且世事变迁,所以这个简短的更新可能是迟来的。
LiveVideoStack
近年来,内容业务在行业蓬勃发展。淘宝也在积极进行内容化转型,今天我们邀请到阿里巴巴淘系技术高级算法专家——王立波(庄恕),回顾淘宝从图文到短视频直播的发展历程,介绍音视频算法在其中的应用和未来的投入方向包括编解码、视频处理、音频通讯与互动。
LiveVideoStack
音视频技术不断发展,云会议场景在人们生活中也越来越常见。那么如何将云会议场景中的音视频技术不断提升改善?本次分享会我们邀请到了来自腾讯会议的商世东先生,他将与我们分享云视频技术在腾讯会议里面的一些领域使用情况和他们对未来的一些思考。
LiveVideoStack
与其说音频技术小众,不如说大家对周围最常用的东西太过习以为常,反而没意识到这些“习以为常”背后的音频技术的存在。
LiveVideoStack
WebRTC(Web Real-Time Communication)是一个支持网页浏览器进行实时语音对话或视频对话的 API。W3C 和 IETF 在2021年1月26日共同宣布 WebRTC 1.0 定稿,促使 WebRTC 从事实上的互联网通信标准成为了官方标准,其在不同场景的应用将得到更为广泛的普及。
陶金亮
在研究如何使视频通话在未来更高效,更易于扩展时,Facebook意识到,最好的方法是从头开始重新设计库并重写整个库,也就是Rsys。
LiveVideoStack
本文详细介绍了基于大数据的音视频全流程质量监控评估体系和各个环节的优化实践,以及面向不同的业务和场景,如何通过不同的关键数据指标改进音视频服务的体验质量和产品成本。
LiveVideoStack
语音辅助技术使用户能够使用语音命令与他们的设备进行交互,并且依靠准确的语音识别来确保对特定用户的响应。但是在许多实际的使用案例中,这类技术的输入一般由重叠的语音组成,这给许多语音识别算法带来了巨大的挑战。
LiveVideoStack
本文整理自即构科技互动白板技术负责人陈晓聪在LiveVideoStack的线上分享,内容主要围绕白板与音视频的同步和白板的多端实时互动两个角度,深度解析即构在互动白板方面的技术探索实践。
LiveVideoStack
Decode the Week≠音视频技术周刊
LiveVideoStack
Decode the Week≠音视频技术周刊
LiveVideoStack
十几年持续专注于音视频领域的在国内确实不多,我能坚守是偶然也是必然。早期的坚持是兴趣加上偶然因素,现在看到能够通过技术来极大的提升人类在各方面应用的效率时,更多的则是必然。网易云音乐音视频实验室负责人刘华平在采访中说到。
LiveVideoStack
现如今,随着TTS技术不断发展,用户对于语音合成的音质质量、流畅度等拥有更高追求。语音合成中的风格控制、音色转换、歌声合成等技术是目前业界的难点和共同追求的方向。本次采访邀请到了喜马拉雅的音频算法工程师贺雯迪,她将从语音合成领域、TTS技术的发展状况和应用场景等方向与大家一同探讨。
LiveVideoStack
贺雯迪,
下一代音视频会议系统必须处理好无缝衔接智能手机、平板电脑和PC桌面系统的问题。视频会议系统应该做到可以随时随地接入转换。这种移动性的需求要求对异构终端设备间的一致性问题进行解决。
LiveVideoStack
2022年中央广播电视总台中秋晚会首次采用三维菁彩声 (Audio Vivid)进行制作,通过“百城千屏”超高清公共大屏传播体系进行播出。
LiveVideoStack
在本文中,我们将了解闭合GOP和开放GOP的概念。这两种类型的GOP在视频流化中非常常见,并会影响视频压缩效率、错误恢复以及ABR的切换能力。
LiveVideoStack
本次分享我们邀请到了来自腾讯云实时音视频TRTC后台的研发负责人薛笛,他向我们分享了腾讯云TRTC在架构升级和产品实践中的经验。仔细讲解了混音引擎最初的制造源、在整个优化过程中发现的问题以及解决方法,为后来做腾讯会议和云呼叫中心打下了一个良好的基础。
LiveVideoStack
Google最新推出的音频编解码器Lyra,不仅实现了以每秒3kb网络宽带提供听起来自然清晰的语音聊天,还可以在仅90ms延迟的情况下在从高端云服务器到中端智能手机的任何设备上运行。
Teresa
二月中旬,小米10系列手机正式发布,作为小米10周年的诚意之作,“科技突破极限”正式进军高端市场。小米10系列不仅搭载了目前为止性能最为强劲的高通骁龙865处理器,更拥有LPDDR5内存,1亿像素主摄,横向振动马达等顶级配置。
LiveVideoStack
紧抓多媒体生态趋势,将浏览器、WebAssembly和Rust等热点结合;熟知播放器工作原理,为实现商业化H.264/H.265播放器打下坚实基础;课程包含图文、代码、视频,降低学习门槛; 李超精准讲解,及时详细解答