技术标签： AI

文章

用互联网发展视角看元宇宙创新

元宇宙创新浪潮下，各类热点涌现，虚实难辨，争议较大。本次分享主要立足于互联网软硬件的发展规律，澄清元宇宙概念，分析当前的技术架构形态，展望技术与商业的发展路径，同时分享AI技术在元宇宙中的应用。

龙明康

元宇宙 AI 科大讯飞，

探讨TensorRT加速AI模型的简易方案 — 以图像超分为例

详细介绍GPU编程的基本知识，探讨把模型运行到TensorRT的简易方法，帮助GPU编程的初学者加速自己的AI模型。

季光

AI GPU 季光，

百度媒体云智能编码技术实践

短视频、小视频行业蓬勃发展，各个平台之间的竞争更加激烈，提升视频质量、降低带宽成本，成为每个平台提升竞争力的重要手段。在本次分享中，将对百度云智能编码技术进行深入介绍。结合该技术在百度APP视频FEED、好看视频、全民小视频中的应用实践，进一步介绍AI技术在云转码中的应用探索。

LiveVideoStack

视频编解码 AI LiveVideoStackCon 2018

魔镜：使用无监督式学习来辨识Twitch用户社区中繁复多样的网络状况

作为一个国际性的互动直播平台，Twitch服务的观众分布在世界的很多国家，从而具有千差万别的网络状况。这种差异性给我们试图提高服务质量亦或是发布任何前、后端的新功能都带来巨大的挑战。所以说如能建立起一个用户社区典型网络状况的知识库，那将对我们优化观看体验以及缩短软件部署周期都具有非同一般的意义。根据平台收集到的海量播放质量指标，我们提出一个无监督学习的方法先对播放行为进行分组，因为每一个细分的播放行为集群都代表一类网络状况。下一步是用仿真和配对的方法来模拟出符合每种播放行为的网络模型。最后我们试图利用仿真出的结果来开发针对移动网络用户的ABR播放算法优化，同时加速它的灰度发布。

沈悦时

AI ABR LiveVideoStackCon 2018

基于英特尔架构的实时视频流分析系统的设计与优化

随着实时媒体流分发技术的发展，在医疗，监控，社交和教育等领域，对多媒体数据进行基于深度学习的实时视频流分析的应用场景日益丰富。端到端的实时视频流分析涵盖视频流接入，视频编解码，视频帧前后处理以及深度学习网络推导等一系列流程，流程的复杂性以及深度学习网络调优的需求极大提高了实时视频流分析应用的门槛。为解决这一问题，面向WebRTC的英特尔协同通信开发套件设计了一个端到端的全流程实时视频流分析系统，它具有分布式可扩展的特性，同时实现了基于英特尔平台全加速，并提供了用户对深度学习网络的自由定制，帮助开发者使用极简的代码快速实现符合自身需求的高效实时视频流分析应用。本议题会对该系统的设计原理和优化方法以及所涉及的组件进行详细介绍，同时也会简要介绍其应用开发方法。

LiveVideoStack

AI 视频编解码 WebRTC 网络传输 LiveVideoStackCon 2018

AI在视频增强中的技术以及应用

随着全民直播时代的到来，主播对视频质量和创意需求增多，由此产生了视频增强技术的巨大需求。基于360在视频领域的开发经验和技术积累，本次分享为大家介绍人工智能在视频增强中的技术以及相关应用。在算法层面，主要向大家介绍在移动平台中，应用人工智能技术解决人脸，手势，肢体识别等问题，以及相应的技术挑战；其次在应用层面和落地场景中，应用face 贴图，手势特效，人脸美颜，背景抠图等对视频进行渲染和增强，让我们的视频更加生动和有趣。

LiveVideoStack

AI 视频增强人脸识别 LiveVideoStackCon 2018

面向QoE的感知视频编码

近年来，随着智能终端的发展以及在线视频等新型业务的普及，无线网络中所传输的图像视频数据量呈爆炸式增长的趋势，网络带宽供求矛盾日益尖锐。视频编码理论是突破无线网络带宽瓶颈的重要途径之一。传统编码理论一直沿着数字信号处理的思路演进，难以突破“边际效应”。事实上，当前终端计算能力飞速发展，为解决带宽供求矛盾提供了契机。因此，另一种新的研究思路是从人类视觉感知模型出发，利用机器学习的计算工具，在视频大数据驱动下构建人类视觉感知模型，面向人类用户体验（QoE），研究基于视觉感知模型的视频编码关键技术，以智能媒体协同计算换取无线视频通信带宽。本报告将介绍徐迈课题组在面向QoE的感知视频编码方面的工作，主要包括：（1）基于关注点大数据的视频显著性感知模型；（2）基于感知模型的视频压缩方法；（3）基于深度学习的HEVC视频编码优化；（4）数据驱动下的全景视频质量评价与编码优化。

徐迈

视频编解码 AI 感知编码 HEVC LiveVideoStackCon 2018

AI硬件中的声学问题剖析

人工智能产业领域的技术着眼点会更关注神经网络和深度学习算法以及数据，但是随着技术的落地，不可避免的要涉及到硬件产品的基础体验问题。而由于使用场景、使用方式的差异，以及人际通讯和人机对话的技术要求差异，使得人工智能硬件和传统具有音频功能的硬件又有所不同。本次分享拟从声学硬件系统的角度来剖析声学信号处理算法、声学硬件指标及相关技术对于语音交互体验的影响。

邓滨

AI 音频技术 LiveVideoStackCon 2018