对话美摄科技侯康:提升技术,拓展场景 美摄智能汽车视频处理方案已就位

LiveVideoStack 2022年3月21日

美摄科技成立于2014年,是一家专注智能视音频整体解决方案的国家高新技术企业,致力于视音频与AI技术的融合与创新,目前已服务海内外数千家企业客户。在视音频领域深耕多年,美摄科技凭借雄厚的技术实力,在当今视频化浪潮下不断拓展应用场景,将服务扩展到了智能手机、智能硬件、智能汽车、智慧广电等众多领域,助力平台为用户带来更丰富、更便捷的视频创作体验。本次,LiveVideoStack有幸采访了来自美摄科技的算法工程师侯康,他向我们介绍了过去的一年美摄科技在音视频领域关注的重点、在美摄汽车智能剪辑方案开发过程中所做的工作、研发过程中遇到的“坑”以及最近推出的桌面端深度视频编辑解决方案“美映PC版”等。

图片

侯康:北京美摄网络科技有限公司 , 算法工程师

LiveVideoStack: 侯老师,您好。请您介绍一下您在美摄科技所负责的工作和您近期所关注的技术方向。

侯康: 我目前负责美摄AI算法团队的管理,技术方面主要是针对智能剪辑和图像处理算法的开发。当前我主要关注一些新的AI研究方向,例如transformer在智能剪辑系统方面可能会涉及到的应用点,同时继续拓展和优化美摄的智能剪辑能力。

LiveVideoStack:在过去的一年,美摄科技在音视频领域中关注的重点是什么?取得了哪些成绩?

侯康: 美摄在音视频领域主要关注智能剪辑在各个领域的拓展和应用。美摄在2019年开发出了面向生活类和旅行类视频的智能剪辑系统,并获得了市场的热烈反响,因此后续我们针对各种不同场景进行了大量优化工作。例如在智能汽车领域,我们针对汽车视频拍摄场景的特点和汽车的硬件系统做了大量适配和优化工作,并且加入了面向汽车的特色算法,收到了客户的一致好评。

去年,美摄除了在智能手机、智能硬件、社交平台、政务媒体以及出海等领域持续发力以外,还将服务领域扩展至了智能穿戴、智能汽车等新行业。技术方面我们也取得了新的突破,在国家广播电视总局举办的首届“广播电视和网络视听人工智能应用创新大赛”中,美摄基于深度学习框架的智能视频内容生产平台经过层层评选,最终斩获一等奖。

LiveVideoStack:在这里道一声恭喜!我们也很欣喜地发现美摄开始在智能汽车领域发力,是怎样的契机想到去开发这个场景?

侯康: 随着车辆的普及、硬件升级和用户的认知提升,汽车用户对车辆的诉求也从基础的驾驶代步向全面的驾乘体验转变,简单的车内娱乐已经无法满足用户需求,围绕汽车的生活内容分享变得越来越重要。当前的拍摄硬件大都还是使用手机、相机等外部设备,驾驶过程中用户使用的便利性不佳,拍摄视角也极为受限。此外,目前很少有适合车辆场景的制作工具,用户在利用手机、PC软件进行后期处理时,需要导入长段视频,后期制作难度大,也无法进行实时分享。在此背景下,美摄汽车智能视频处理方案应运而生。

LiveVideoStack:作为全新视频生产平台,汽车进行视频处理与互联网场景下通过移动端、PC端等进行视频创作有什么区别?

侯康: 汽车本身没有像手机和PC那样方便的用户操作界面,因此对于自动化的剪辑方案需求更加迫切。汽车的处理平台和系统目前还是百花齐放的状态,因此需要做大量的适配工作,来满足不同厂家的需求,美摄目前拥有全平台适配的能力。此外,汽车无法像手机和PC那样随时更新软件,并且对安全性和稳定性的要求更高。美摄做了大量工作来满足汽车厂商对于稳定性和安全性的要求,目前我们的SDK和整套智能剪辑系统已经能够稳定地运行在主流厂商的车载操作系统上。

LiveVideoStack:在智能汽车场景下智能视频生产平台研发的过程中遇到的“坑”是什么?如何解决?

侯康: 在智能剪辑系统的开发过程中,主要的难点在于如何针对不同场景进行调优。目前AI技术还无法像真正的导演那样面对不同场景、不同类型的片子都能完成剪辑,因此针对不同场景需要设计不同的框架和算法来达到最优的效果。此外在进行汽车智能剪辑系统开发时,最大的问题还是不同系统和硬件架构的适配过程。由于汽车硬件、处理平台、系统还没有像手机和PC那样较为统一,因此需要做大量工作来进行适配和调优,才能达到流畅稳定的运行状态。

LiveVideoStack:有看到美摄近期推出了桌面端深度视频编辑解决方案“美映PC版”。其实无论是PC端还是移动端,面向内容创作的视频编辑工具也涌现很多,那么美摄是处于怎样的考量去推出这样一款产品呢?

侯康: 美映PC版是一款面向企业用户的深度视频编辑工具,具备全面且高效的专业编辑功能,接入方式简单,支持企业添加自研或其他第三方技术。基于跨平台的美摄SDK,企业可以搭建互通协作的平台及方案产品,输出多场景专业编辑应用产品。

美摄推出这款产品跟当下的视频领域发展趋势是分不开的。现如今随着长、短视频平台之间的竞争进一步加剧,中视频内容已成为平台的重点发力方向。中长视频对创作工具及场景的要求更为严苛,不同平台的风格调性也决定了创作者很难通过Pr、Final Cut Pro这样的传统视频编辑工具直接生产出所需内容,打造自有视频编辑工具是不少平台的选择。但PC端视音频编辑开发难度大,所需投入和后期维护成本过高。基于这样的背景,我们推出了美映PC版,助力平台快速搭建自有视频创作平台,构建系统化的产品生态。

LiveVideoStack:美摄科技的下一步规划是什么?重心会放在技术研发方面,还是在场景拓展方面呢?

侯康: 作为国家高新技术企业,美摄致力于成为全球最具影响力的智能视音频技术企业。美摄的核心研发团队在视音频领域有着丰富的研发经验,专注视音频引擎、图形图像处理和计算机视觉领域开发二十余年。与此同时,我们也在不断探索新的应用场景。去年我们在智能手机、智能硬件、广电及通信运营商等的基础上,成功将业务领域拓展到了智能汽车、智能穿戴等行业。

在我们看来,技术研发和场景拓展二者是相互促进的关系。领先的技术水平能够支撑我们开拓更广泛的应用场景,同时新的场景需求和应用中遇到的新情况、新问题也会促使我们不断提高技术能力。今年,我们推出了美映PC版、一键成片等多种新方案,能够适配更多应用场景,敬请期待。

LiveVideoStack:本次大会您将分享哪些精彩内容呢?您可以剧透一下吗?

侯康: 本次大会我将会分享美摄的汽车智能剪辑系统相关的解决方案,包括图像画质增强、智能视频剪辑以及虚拟场景娱乐三部分。

LiveVideoStack:好的,谢谢您接受采访,期待您在大会上的精彩分享。


采访、编辑:Teresa

▼扫描下图二维码了解音视频技术大会更多信息▼

图片

还可输入800
全部评论
作者介绍

LiveVideoStack

音视频技术社区

文章

粉丝

视频

阅读排行
  • 2周
  • 4周
  • 16周
热门视频

用互联网发展视角看元宇宙创新

龙明康/AI工程院常务副院长

单目3D人体姿态估计的挑战和探索

宋波/人工智能高级工程师