技术文章: AI人工智能

特别策划:我们距AIGC的“奇点”还有多远?

AIGC可能是当前科技圈最不容许忽视的趋势。根据咨询公司预测*,2023年中国AIGC产业规模约为143亿元,随着底层算力与大模型的完善,有望在2030年突破至惊人的万亿级。

AIGC

美图AI动漫功能的落地探索

2022年可以说是AIGC技术的元年,LLM领域的GPT和图像领域的Stable Diffusion,都属于行业的颠覆性技术。在图像领域,业界出现了如DALLE,Midjourney等基于简单描述文本生成图像的模型和工具。美图在2022年以来,发布了多项AIGC相关应用,LiveVideoStackCon 2023深圳站 邀请到了美图 影像研究院李骈臻老师分享相关经验。

AIGC

AI新范式下,阿里云视频云大模型算法实践

在AI技术发展如火如荼的当下,大模型的运用与实践在各行各业以千姿百态的形式展开。音视频技术在多场景、多行业的应用中,对于智能化和效果性能的体验优化有较为极致的要求。如何运用好人工智能提升算法能力,解决多场景业务中的具体问题,需要创新地探索大模型技术及其应用方式。LiveVideoStackCon2023深圳站邀请到阿里云智能高级算法专家刘国栋,为我们介绍阿里云视频云的大模型算法实践。

AI 大模型

AIGC底层数据探索——高质量数据助力大模型迭代升级

近年来,大模型的概念逐渐受到更广泛的关注,而谈及大模型就离不开对底层数据的探索。大模型训练数据痛点与中文数据集现状;高质量数据定义;对话式数据模型实验;晴数智慧高质量数据解决方案。

AIGC

从规模化到全智能:智能媒体服务的重组和进化

上海站大会邀请到阿里云视频云的邹娟,为我们分享演讲《从规模化到全智能:智能媒体服务的重组与进化》。本次分享分为以上四部分,一是媒体服务(Mediaservices)面临的技术难题;二是如何使用统一“顶设”进行媒体服务的架构重组与规划设计;三是阿里云视频云服务不同企业客户不同场景需求面临的技术挑战、解法以及关于智能化演进的思路和实践;四是关于智能媒体服务的未来展望。

AI 多媒体

LVS2023 | 从 AIGC 到多模态媒体大模型

AIGC大模型的发展正逐渐为音视频、游戏等产业赋能,而多模态大模型作为它的下一个重要发展方向,正被业界高度关注。LiveVideoStackCon 2023 上海站邀请了来自上海交通大学的宋利教授,为大家从多模态媒体生成、多模态媒体编码和多模态媒体交互三个方面展望新一代多模态媒体的特点以及未来基于大模型的智能跨模态编码的新趋势 。

AIGC 多模态大模型

AIGC音视频工具分析和未来创新机会思考

相较于前两年,2023年音视频行业的使用量增长缓慢,整个音视频行业遇到瓶颈。音视频的行业从业者面临着相互竞争、不得不“卷”的状态。我们需要进行怎样的创新,才能从这种“卷”的状态中脱离出来?LiveVideoStack 2023上海站邀请到了PPIO边缘云的创始人王闻宇,和我们分享了他针对这一问题进行的思考。本次分享包括近年音视频行业的分析、国外4款AIGC应用工具介绍、最新论文情况介绍,以及王闻宇对行业的看法和展望,以期为音视频从业者提供更具广度的行业视角。

AIGC 音视频技术

AI自动剪辑生成视频探索实践

网易云音乐 音视频算法专家 赵剑,详细介绍网易云音乐结合多年音乐领域多模态算法能力积累与实际业务需求,实现AI自动剪辑生成视频的技术探索与与实践。

Max

AI剪辑 音视频技术

最新日程海报(LiveVideoStackCon 2022 音视频技术大会 北京站 )

LiveVideoStackCon 2022 音视频技术大会 北京站 最新日程。

LiveVideoStack

实时音视频 音频技术 视频技术

对话腾讯音乐天琴董治:聊聊元宇宙与AI技术驱动虚拟人

入局元宇宙需要具备哪些能力?以及用AI技术驱动的虚拟人从建模到渲染,再到场景应用,当前遇到的瓶颈是什么?腾讯音乐天琴实验室在AI驱动虚拟人方面又做了哪些工作?在本篇采访中,董治老师分享了很多观点和相关经验。

LiveVideoStack

数字人 AI 元宇宙

对话天翼云AI产品研发总监陈金,谈谈产品研发与虚拟数字人

本次我们非常荣幸地采访到了天翼云AI产品研发总监陈金老师,和我们聊一聊产品创新所面临的最大难题,并介绍了天翼云研发的基于AI和NLP的数字虚拟老师目前的应用情况。

LiveVideoStack

云计算 AI 数字人

是时候展现“真正”的技术了!

LiveVideoStackCon 2022 北京站将延期至2023年第一季度,一切就绪,只等你来。

LiveVideoStack

视频传输 视频技术 音频技术 视频编解码 AI 元宇宙

AI时代的视频云转码移动端化——更快、更好,更低,更广

即构科技的李凯老师,为我们分享产品架构、移动端视频转码、移动端智能视频处理、四位一体网络模型设计以及具体实施Demo。

LiveVideoStack

AI 视频云 AI转码 即构科技 李凯

美摄汽车图像及视频处理方案

随着智能汽车的不断发展,消费者对车身娱乐系统的要求也不断加强。虽然车身摄像头数量越来越多,但是依然面临画质不佳、存在畸变等问题,那么如何解决这些问题呢?

LiveVideoStack

智能汽车 AI视频处理 北京美摄网络科技有限公司 侯康

七牛云QRTC自研传输协议(QRTP)对音画质量的提升

于佳老师在LiveVideoStackCon 2022 上海站为我们讲述QRTN的网络架构是如何提升用户体验度的,以及分析其中的QRTP协议是如何对音画质量进行提升的。

LiveVideoStack

QRTC 网络传输 传输协议 视频质量 七牛云

8月5日我们一起,聚焦音视频、探秘技术新发展

大会报名倒计时8天,期待见面,会议详情及购票可咨询小秘书:13520771810(微信同号)。

LiveVideoStack

数字人 元宇宙 云游戏 深度学习 AI 开源技术 自动驾驶

专访即构科技李凯:音视频的有趣、行业前沿一直吸引着我

近日,LiveVideoStack邀请到了即构科技视频处理工程师李凯,请他来跟我们聊聊即构自研移动端实时超分辨率技术的优势与应用场景,在移动端实现此技术所遇到的挑战与困难,即构所采取的应对策略等。

LiveVideoStack

超分辨率 音视频技术 即构科技 李凯

什么是视频内容推荐引擎?

在本文中,我们将从OTT服务提供商的角度来了解推荐引擎、它所需的数据、以及它的用途等。

LiveVideoStack

内容识别 推荐引擎

海内外技术人们“看”音视频技术的未来

内含8月5-6日 LiveVideoStackCon 2022 音视频技术大会完整版日程。

LiveVideoStack

音视频技术 元宇宙 视频传输 视频编解码 内容生产

你有一个机会,这里有一个舞台

LiveVideoStackCon 是每个人的舞台,如果你在团队、公司中独当一面,在某一领域或技术拥有多年实践,并热衷于技术交流,欢迎申请成为 LiveVideoStackCon 的讲师。

LiveVideoStack

音视频技术 编解码 编解码芯片 人工智能 网络传输 开源技术

Prime Video如何使用AI确保视频质量

用于检测宏块损坏、音频失真和音视频同步错误的检测器是Prime Video的三个质量保证工具。

LiveVideoStack

AI 视频质量 Prime Video Amazon

音频正当时:我们和声网音频专家聊了聊AI、元宇宙、空间音频和“沉浸感”

近日,LiveVideoStack采访到了声网的音频算法负责人冯建元,请他来跟大家聊聊音频相对于视频的优势、音频在元宇宙中的应用、国内音频技术与AI结合的发展、过去一年声网在音频领域所取得突破和对前沿音频技术的探索等。

LiveVideoStack

音频技术 AI 元宇宙 声网 冯建元

众说元宇宙及其实现

本篇文章不会去过多地讨论现在围绕元宇宙的诸多活动(科技巨头想要通过它们来占有我们更多的数据、金钱以及精神世界)。但我们也必须承认:下一代互联网框架之战已经开始了。

LiveVideoStack

元宇宙 AR VR 人工智能

对话美摄科技侯康:提升技术,拓展场景 美摄智能汽车视频处理方案已就位

来自美摄科技的算法工程师侯康,他向我们介绍了过去的一年美摄科技在音视频领域关注的重点、在美摄汽车智能剪辑方案开发过程中所做的工作、研发过程中遇到的“坑”以及最近推出的桌面端深度视频编辑解决方案“美映PC版”等。

LiveVideoStack

音视频技术 人工智能 智能汽车 北京美摄网络科技有限公司 侯康

Mimir:通过AI向所有人提供视频服务

Mimir 旨在最大限度提升视频播放质量。

LiveVideoStack

Mimir ABR QoE

北京冬奥黑科技; 揭秘虎年春晚硬核科技;全球首款AR隐形眼镜问世;索尼3D显示技术路径曝光

北京冬奥黑科技; 揭秘虎年春晚硬核科技;全球首款AR隐形眼镜问世;索尼3D显示技术路径曝光

LiveVideoStack

AR 3D 索尼

LiveVideoStack年终技术盘点总结

在2021年底,LiveVideoStack策划了一次年终技术盘点,我们向音视频领域的一线技术工作者们发出了约稿邀请,希望他们能够输出一些音视频方向的技术内容。下面让我们再来重温一下2021年的年终技术盘点。

LiveVideoStack

互动白板 QUIC HDR WebRTC Miro 王晶 张昊

B站开源自研动漫超分辨率模型,助力动漫UGC视频高清化

在对大规模高质量二次元画风数据进行质量降低得到模拟的、需修复的原盘数据后,AI得以通过学习从低质图复原原图的逆过程来进行图像修复。当输出图像分辨率大于输入图像分辨率时,该技术被称作AI超分辨率技术,经过该技术处理后的图像可以在指定分辨率实现高清化。

LiveVideoStack

超分辨率 B站 动漫 视频高清化

未来已来,音视频江湖再起波澜

“全真稳”,打通企业音视频“任督二脉”

LiveVideoStack

腾讯云 TRTC CDN SDK 腾讯云专区

从体验出发构建以增长为目标的视频服务体系

本次分享聚焦在字节跳动视频通过性能体验优化促进业务增长的实践。包括在分析方法上的探讨,如何衡量和预估体验优化对业务增长的贡献,以及具体的体验优化实践分享。

LiveVideoStack

体验优化

视频编码器的智能化——AI辅助编解码的ASIC解决方案

在此次LiveVideoStackCon 2021 音视频技术大会 北京站,来自镕铭半导体的刘迅思详细列举了目前常用的AI辅助编解码的方法,论述如何在硬件和软件层面将AI结合编解码的实践,探索新的标准和新一代编码器结合AI应该如何设计。

LiveVideoStack

硬件编码 GPU OpenGL 视频编解码 AI

视频大时代下基础架构的演进

在本次LiveVideoStackCon 2021音视频技术大会 北京站,快手短视频架构负责人黄琦结合多年来对行业的观察与在快手的自身实践,和大家一起探讨视频大时代下基础架构的演进。

LiveVideoStack

实时音视频 音视频技术 AI 系统架构

探讨视频云与边缘云平台的竞争力

华为云媒体服务RTC资深产品专家卢志航老师将从以Serverless为承载平台,以开放、专业的媒体处理能力为价值核心的方向,与大家探讨视频云与边缘云平台的下一代竞争力。

LiveVideoStack

AI 边缘计算 云服务

自监督、半监督学习在内容安全中的应用

在深度学习领域中,半监督、自监督算法通过借助无标签数据与无监督训练任务,可有效改善传统有监督算法中“泛化性能不足”、“模型过拟合”、“严重依赖数据标注质量”等问题。在此次LiveVideoStackCon 2021 音视频技术大会 北京站,我们邀请到了网易易盾资深算法工程师——崔若璇,为我们介绍了半监督学习领域的发展脉络,并展示半监督、自监督算法在网易易盾内容安全业务上的创新应用。

LiveVideoStack

AI 深度学习 算法 半监督学习

MPEG Founder Leonardo Chiariglione: “MPEG’s Spirit Continues in MPAI”

最近Leonardo Chiariglione接受了LiveVideoStack的邮件采访,在采访中,我们和他一起讨论了新书 、MPEG 和 MPAI。下面是整理的采访稿。

LiveVideoStack

MPEG MPAI

06 / LiveVideoStack主编观察:六岁的Frame.io被收购

“连续两周交作业,目标仍然是做到99期。我的邮箱是ant.bao@livevideostack.com,欢迎大家提供新闻线索。”

LiveVideoStack

云游戏

音视频、AI和5G等技术在东京奥运会中的应用

今年的东京奥运会,它将展示大部分科技。OBS承诺为全球观众呈现一场拥有丰富数据的视觉盛宴,其中IP、云、5G和人工智能都打破了广播制作的传统框架,改变了内容交付和观众体验的基础,让观众即使不亲临现场观看比赛也能获得最逼真的体验。

LiveVideoStack

AI VR 5G

应用深度学习使用 Tensorflow 对音频进行分类

在视觉和语言领域的深度学习方面取得了很多进展,文中一步步说明当我们处理音频数据时,使用了哪些类型的模型和流程。

LiveVideoStack

AI 音频技术

LiveVideoStackCon 2021北京站 9月再次启航

2021年9月3~4日,LiveVideoStackCon北京站再次来袭!各路音视频技术大咖将齐聚北京,一起分享宝贵行业经验,探索音视频技术的未来。

LiveVideoStack

视频编解码 AR AV1 网络传输 4K

高性能视频推理引擎优化技术

本文整理自腾讯高级技术专家鲍金龙在LiveVideoStack线上分享上的演讲。他通过自身的实践经验,详细讲解了高性能视频推理引擎优化技术。

LiveVideoStack

深度学习

谷歌 I/O 2021 在音视频领域中有哪些技术值得被关注?

时隔两年Google I/O大会再次与大家见面。虽然去年的大会因新冠疫情被迫取消,但技术的迭代发展却未被打断,反而因疫情的影响促使了技术的创新变得愈加以人们的需求为首要考量,从而变得更具人性化也更具智能化。

LiveVideoStack

I/O AI 3D

解密华为云原生媒体网络如何保障实时音视频服务质量

随着5G和AI的发展,内容表达视频化成为了当今的主流,很多行业对视频分发有非常旺盛的需求。我们非常荣幸地请到了华为云的资深视频架构师黄挺,为大家介绍基于互联网的实时音视频服务所面临的挑战,分享华为云原生媒体网络全方位保障实时音视频服务体验的实践。

LiveVideoStack

5G AI

探讨TensorRT加速AI模型的简易方案 — 以图像超分为例

本次LiveVideoStack线上分享邀请到了英伟达DevTech团队技术负责人季光一起探讨把模型运行到TensorRT的简易方法,帮助GPU编程的初学者加速自己的AI模型。

LiveVideoStack

AI GPU

Decode the Week|21 0315

美图购入4000万美元加密货币、巴基斯坦再次封禁 TikTok、暂时的芯片短缺、斯坦福AI报告等

LiveVideoStack

AI

快手智能视频图像编码处理服务架构

本文来自于快手视频算法工程师团队负责人闻兴在LiveVideoStackCon2020北京站上的精彩分享。凭借本主题演讲,闻兴老师荣获此次大会评选的优秀讲师称号。

LiveVideoStack

图片压缩 视频编解码 AI

AI视觉在教育场景中的创新应用

本次LiveVideoStackCon 2020线下北京峰会我们邀请到了360AI影像事业部总经理张焰老师来做分享,他会为我们带来目前AI视觉在教育中的创新应用,包括课堂专注度、课堂接受度、疲劳提醒、姿态纠正等在线教育场景解决方案。

LiveVideoStack

AI 在线教育

ECCV 2020 亮点摘要(上)

2020年欧洲计算机视觉会议(ECCV)于8月23日至28日在网上举行,由1360篇论文组成,包括104场orals,160场spotlights以及1096篇posters,共进行有45场workshops和16场tutorials。与近年来的ML和CV会议一样,产出了大量精彩的论文。

LiveVideoStack

AI 图像处理 内容识别

实时高密度AI辅助视频编码的ASIC解决方案

在LiveVideoStackCon 2020 SFO线上大会上,我们邀请到NETINT公司的周炎均老师(Daniel Zhou)同我们分享通过在同一芯片上结合视频编码器和DNN引擎,从适应性、可扩展性和延迟三大方面,探讨实时高密度AI辅助视频编码的ASIC解决方案。

LiveVideoStack

AI 硬件编码

从边缘到中心网络,为什么是ASIC?

Cloudflare网络工程师介绍了ASIC在网络方面的关键价值,以点及面,看上去ASIC在边缘大有可为。

LiveVideoStack

ASIC AI 3D 网络传输 视频编解码

AI视觉,视频云新挑战的解决之道

AI就像一个加速器,正在渗透在多媒体应用的方方面面,改进甚至颠覆传统的图像视频处理方法。

LiveVideoStack

AI 视频处理 视频编解码

Decode the Week|20 1123

苹果降低应用商店收入一半分成、Twitter视频分享功能 Fleet、百度36亿美元收购 YY

LiveVideoStack

AI 视频技术 视频处理 直播

“云端一体”的智能媒体生产制作演进之路

智能媒体生产制作的链路当中,生产制作是核心,智能是辅助,那么AI技术是如何融入在整个生产制作流程当中的?

LiveVideoStack

视频生产 视频技术 AI 视频处理

非线性声学回声消除技术

本文详细介绍华为云音视频团队推出的双耦合的声学回声消除算法以及实验检验结果。

LiveVideoStack

音频技术 AI 非线性声学回声

“视频AI产品今后几年将是一片蓝海”

专访RealNetworks中国执行总裁乐永升

LiveVideoStack

AI 4K

客观指标VS主观质量:拨开遮挡高清视频技术的迷雾

并非一个算法可以解决所有的问题。

LiveVideoStack

VR AI VAMF 网络传输

通过视频着色进行自监督跟踪

在本文中,我们将学习一种新颖的自监督目标跟踪方法。

LiveVideoStack

AI 计算机视觉 机器学习 CNN

我在攻读计算机视觉和机器学习硕士学位时学到了什么

读者可以把这篇文章作为一个窗口,用来了解机器学习和计算机视觉的硕士学位课程以及内容。

Richmond Alake

机器学习 CNN 计算机视觉

为什么AI感知与人类感知很难直接比较?

这篇文章是我们对人工智能研究论文的评论的一部分,这是一系列探索人工智能最新发现的文章。

LiveVideoStack

AI 深度学习 图像处理

阿里巴巴淘系开源多模态直播服饰检索数据集

阿里巴巴淘系技术部于9月日正式开源业界首个大规模的多模态直播服饰检索数据集(Watch and Buy),以推动视频多模态检索技术的研究技术的研究。

LiveVideoStack

开源技术

AI加持的竖屏沉浸播放新体验

本文主要讲述通过AI智能的视频画面主体识别能力和字幕识别能力,实现在手机端竖屏全屏观看横拍视频的新体验,给用户提供沉浸视界新体验。

AI 视频技术

Decode the Week | 20 0831

沃尔玛、网飞与TikTok接洽、Mozilla发布 Firefox79​、脸书不满苹果隐私政策

LiveVideoStack

AI 视频技术 视频会议

FFmpeg深度学习模块的历史、现状和计划

本文详细介绍了FFmpeg中深度学习模块的历史、现状及未来计划,并针对深度学习模块总体架构与代码实践做详细解析。

LiveVideoStack

FFmpeg AI OpenCV

OWT(Open WebRTC Toolkit)云游戏自动音视频测试探索

在日益临近的5G时代下,5G网络和新的流视频游戏服务将在未来几年内让云游戏的增长一触即发,云游戏已渐成行业热点。

LiveVideoStack

云游戏 QoE VAMF 5G WebRTC

Decode the Week | 20 0810

苹果应用商店拒绝Stadia和xCloud、Instagram推出Reels挑战TikTok等

LiveVideoStack

Decode the Week 视频技术 AI 网络传输 LiveVideoStackCon2020首届音视频线上峰会

下一代视频编码技术的云视频应用探索

本文从视频编解码技术的趋势、难点和挑战以及华为云视频产品的编解码关键技术实践与成果两方面介绍下一代视频编解码技术优化应用的探索。

LiveVideoStack

5G RTC VR AV1 AVS 华为云 左雯

Decode the Week | 20 0727

TikTok两亿美元支持创作者、Netflix特效制作云平台、Alphabet热气球供网非洲等

LiveVideoStack

Decode the Week AI 网络传输 视频会议

Open WebRTC Toolkit实时视频分析系统

随着物联网技术的发展,实时视频分析技术已应用于智能物联网的各个领域。英特尔基于与GStreamer以及OpenVINO构建了整套实时视频分析方案,为用户提供更加灵活、便捷的实时视频分析服务。本文由英特尔高级软件工程师 吴秋娇在LiveVideoStack线上分享内容整理而成。

LiveVideoStack

AI 视频分析 WebRTC Intel 吴秋娇

一切为了高清——金山云魔镜平台助推5G高清应用

5G时代是超高清的时代,然而,冰冻三尺非一日之寒,在超高清视频直播点播等业务研发过程中,总会遇到很多令人抓狂的难题。本次LiveVideoStackCon 2020线上峰会我们邀请到了金山云高级技术总监蔡媛,她将从金山云魔镜平台本身出发,讲解平台如何帮助使用者提升画质评测效率,保障评测质量,一站式解决用户画质评测的难点。

LiveVideoStack

AI 5G 金山云 蔡媛

守得云开见日出——危机之下的音视频技术驱动产品创新

在全球疫情的今天,大量线上服务短时间内诞生或极速扩张。身处在云计算的时代,如何用远超以往的基础音视频云服务快速构建海量稳定的在线应用,以应对一场全人类的危机就显得尤为重要。本次LiveVideoStackCon 2020线上峰会我们邀请到了腾讯云音视频通信业务总经理李郁韬,他将从视频会议、在线教育和在线娱乐等典型场景来看音视频技术推动下的产品创新和机遇。

LiveVideoStack

在线教育 视频会议 WebRTC AI 腾讯云 李郁韬 视频会议 在线教育

从神话到落地——AI工程化浅谈

这世上本来没有路,走的人多了,也就成了路。 对于AI工程优化,我想说的是: 这世上本来没有你,改着改着,我就成了你。

LiveVideoStack

AI 视频编解码 字节跳动 鲍金龙

魔镜魔镜告诉我,画质评测哪家强?|LiveVideoStackCon2020讲师专访

蔡媛,15年加入金山云, 现任金山云高级技术总监,负责视频云AI 产品线、媒体处理产品线、视频质量评测体系建设的产品及研发工作。核心项目包括媒体云转码、集智高清、画质增强、KSC265、KQoE等。

LiveVideoStack

5G AI AV1 金山云 蔡媛

这条路有多长,有多难 | 专访OnVideo创始人余世兵&刘歧

世界瞬息万变,而我们唯一可以确定的,是面对远方未知的一切,一定还有什么等着OnVideo的创始团队去实现。

LiveVideoStack

开源 视频编解码 云剪辑 AI 刘歧 余世兵

你今天怎么这么好看——基于深度学习的大型现场实时美颜

美颜是当下直播甚至是所有形式对外展示的一个必备条件。手机端的美颜就像私人化妆师,能够帮助我们实现各种心仪的效果。

LiveVideoStack

云演出 视频技术 AI LiveVideoStack

5G+AI时代的高效视频处理

当前互联网上大于75%的流量都来自于视频,据估计5G时代视频流量更是高达90%以上。如何压缩、传输以及分析视频内容成为5G部署及大规模应用的关键。虽然传统的5G部署也有一定市场,但经过AI加持的智能终端/边缘/云计算可以为5G带来更大的收益及降低其部署成本。本次报告主要探索了在硬件层面如何利用传统方法及深度学习方法对视频进行压缩和分析,以及如何在5G信道中传输压缩后的码流。

LiveVideoStack

AI 中兴微电子 徐科

视频会议未来趋势不完全预测

在新年伊始我们开展了视频会议的专题策划,与Cisco WebEx、声网Agora、亿联网络等探讨了视频会议2020年的机遇与挑战,并描画了平台未来的图景。

LiveVideoStack

视频会议 网络传输 AI LiveVideoStack

音视频领域或将开启”外卷“之路

如果说让我们聊一聊2021年音视频技术领域在这一年中的变化,莫不如从LiveVideoStackCon 2021 音视频技术大会 上海站 & 北京站,这两场大会缩影来看。

LiveVideoStack

外卷 音视频技术 视频编解码 开源技术 系统架构

拥抱智能,AI视频编码技术的新探索

本次LiveVideoStackCon 2021北京站我们邀请到了阿里云智能视频云算法专家——王钊,为大家分享阿里云在AI视频编码技术的新探索。

LiveVideoStack

视频编解码 AI 算法

直播时代的下一个江湖

直播时代的下一个江湖在哪儿?欢迎来到LiveVideoStackCon 2021 音视频技术大会北京站一起探索……

LiveVideoStack

RTC 音视频技术 视频编解码 传输协议 开源

XMC-GAN:从文本到图像的跨模态对比学习

Google提出了一个跨模态对比学习框架来训练用于文本到图像合成的 GAN 模型,用于研究解决生成的跨模态对比损失问题。

LiveVideoStack

XMC-GAN AI

Decode the Week|21 0524

苹果亚马逊同一天公布无损音质服务、 Google与Flutter、Snap 的 AR 战事等

LiveVideoStack

AI AR UWB

视频直播/远程会议中的AI关键技术探索应用

本文由NVIDIA深度学习解决方案架构师 吴金钟 在线上分享中的演讲内容整理而成,详细分析探讨了英伟达GPU上的硬编解码方案和CUDA并行计算架构赋能下的音视频AI技术研究与最新实践应用。

LiveVideoStack

视频会议 AI 直播

Decode the Week|20 1228

马斯克称曾试图将特斯拉出售给苹果、Telegram 用户近5亿、Vimeo将上市等

LiveVideoStack

AI

关于深度学习、NLP和计算机视觉的30个顶级Python库

再次感谢艾哈迈德·阿尼斯(Ahmed Anis)为收集这些数据做出的贡献,并感谢KDnuggets的其他工作人员的意见,见解和建议。

LiveVideoStack

深度学习 NLP Python

Decode the Week|20 1207

TikTok测试三分钟视频、Reddit首次公布DAU、谷歌解雇人工智能领头人、年度最受欢迎应用

LiveVideoStack

iOS AI

基于主观感兴趣区域的视频编码实践

结合芒果TV的工程化研发实践经验,对基于主观感兴趣区域的视频编码技术进行了详细解析。

LiveVideoStack

视频编解码 X265 AI 芒果TV 谭嵩

美摄科技助攻小米10,MI剪辑功能可一键生成大片级VLOG

二月中旬,小米10系列手机正式发布,作为小米10周年的诚意之作,“科技突破极限”正式进军高端市场。小米10系列不仅搭载了目前为止性能最为强劲的高通骁龙865处理器,更拥有LPDDR5内存,1亿像素主摄,横向振动马达等顶级配置。

LiveVideoStack

AI 图像处理 音频技术 北京美摄网络科技有限公司 LiveVideoStack 音视频

课程推荐

轻松掌握WebAssembly视频播放器

紧抓多媒体生态趋势,将浏览器、WebAssembly和Rust等热点结合;熟知播放器工作原理,为实现商业化H.264/H.265播放器打下坚实基础;课程包含图文、代码、视频,降低学习门槛; 李超精准讲解,及时详细解答

阅读排行
  • 2周
  • 4周
  • 16周