技术文章

水下图像质量评价与画质增强研究

海洋面积占据地球总面积的大部分,而且海洋世界蕴藏着丰富的资源,围绕水下成像的相关研究和应用越来越重要。但是,收到水下光照散射、吸收以及噪声等影响,获取的水下图像普遍存在颜色偏差、清晰度差等问题。LiveVideoStackCon 2023 深圳站邀请到福州大学赵铁松老师讲解水下图像质量评价与画质增强研究案例。

2024年01月31日 水下图像质量评价 画质增强

智能音频能力移动端落地实践

端上智能音频能力包括语音识别和声音事件检测等技术,此技术对互联网社交、游戏直播等场景非常重要。但端上智能音频技术也存在效果、性能、数据等方面问题。LiveVideoStack2023深圳站邀请到趣丸科技的马金龙老师讲解智能音频能力移动端落地实践,对这几个问题一一进行回答。

2024年01月30日 智能音频

于AI中见天地:从大模型到内容生成

近日,国际知名研究机构Gartner发布2024年十大战略技术趋势,人工智能成为其背后共同的主题。全民化的生成式人工智能、AI增强开发、智能应用......我们正在进入一个AI新次元。

对话阿里云何亚明:多媒体的未来,正迎面未知的高速列车

大模型、降本、出海,是多媒体从业者交流的高频词,内容与交互的需求层出不穷,大模型与AI的演进目不暇接,让增速低走的视频云迎面新的机遇和挑战。作为一个跨越中美多媒体行业20年的亲历者(阿里云视频云负责人何亚明),与他的对话展现出一番场景,他没有否认多媒体生态当下的问题,但他说新的机会就在眼前,更重要的是,他对多媒体满怀希望。

2024年01月22日 多媒体

如何打造“面向体验”的音视频能力——对话火山引擎王悦

随着全行业视频化的演进,我们置身于一个充满创新与变革的时代。在这个数字化的浪潮中,视频已经不再只是传递信息的媒介,更是重塑了我们的交互方式和体验感知。作为字节跳动的“能力溢出”,火山引擎正在飞速奔跑。根据2023《中国视频云市场跟踪,2023上半年》报告显示,在视频云解决方案市场上,火山引擎的市场占有率排在第五位。

详解Enhanced-RTMP支持H.265

很长时间以来,国内CDN都是通过“CodecID=0xC”的设置来实现H.265支持,但这未能彻底解决CodecID只有4个bits的尴尬,未来RTMP无法支持更多的编码标准。Enhanced-RTMP会彻底解决这一问题。

2024年01月15日 Enhanced-RTMP H.265

深度神经网络压缩与加速技术

深度神经网络是深度学习的一种框架,它是一种具备至少一个隐层的神经网络。与浅层神经网络类似,深度神经网络也能够为复杂非线性系统提供建模,但多出的层次为模型提供了更高的抽象层次,因而提高了模型的能力。深度神经网络是一种判别模型,可以使用反向传播算法进行训练。随着深度神经网络使用的越来越多,相应的压缩和加速技术也孕育而生。LiveVideoStackCon 2023上海站邀请到了胡浩基教授为我们分享他们实验室的一些实践。

更多文章
阅读排行
  • 2周
  • 4周
  • 16周
特别推荐

一文读懂GPU的过去、现在和未来

大模型AI席卷全球,推理创新的APP、场景落地越来越多。当训练达到一定阶段,推理必然会形成一个爆发。推理的产品要起来,必然要把推理的成本降到今天 1/ 10 甚至 1/100。此时该如何选好、用好 GPU ,进而影响推理成本?

音频技术周刊

每周一期,纵览音视频技术生态 与行业动态。