音视频技术开发周刊 | 306

Max 2023年8月21日

音视频技术开发周刊 | 306

 LiveVideoStack LiveVideoStack 2023-08-13 12:01 

每周一期,纵览音视频技术领域的干货。
新闻投稿:contribute@livevideostack.com。


人工智能研究人员声称,通过Zoom音频检测击键的准确率为93%

通过记录按键并训练深度学习模型,三位研究人员声称,基于单个按键的声音特征,他们在解释远程按键方面的准确率达到了90%以上。

https://arstechnica.com/gadgets/2023/08/type-softly-researchers-can-guess-keystrokes-by-sound-with-93-accuracy/

GitHub 1.1万星,模拟软件开发流程,开源框架MetaGPT爆火

随着大型语言模型(LLM)的日渐成熟,利用其构建 AI 智能体成为一个新的研究方向。已有研究使用 LLM 驱动多智能体自主完成了一些任务。然而,现有研究主要集中在简单任务上,缺乏对复杂任务的探索。这主要是因为大型语言模型存在「幻觉」问题,特别是当多个智能体相互作用时,幻觉会进一步被放大,以至于无法用于复杂任务。最近,一个名为「MetaGPT」的开源框架尝试解决这个问题。

对话Sam Altman与Greg Brockman:初心和过去,信念和现在,责任和未来

近日,硅谷著名投资人Reid Hoffman和Aria Finger联手对Sam Altman和Greg Brockman进行了一场访谈,访谈涉及到主题有:OpenAI的使命,人工智能对教育、医疗等行业的变革性影响,人工智能如何面对监管,OpenAI成功的关键,未来的发展畅想。 


麦肯锡:ChatGPT等生成式AI加速,美国30%工作时间将实现自动化

全球顶级咨询调查机构麦肯锡发布了《生成式AI与美国未来工作》的深度调查报告,详细分析了生成式AI对美国劳动力市场的影响。

AI日报|ChatGPT更聪明了;为什么苹果不主动在AI领域炫技?

此前有消息称,OpenAI 购买了 AI.com,以便将其重定向到 ChatGPT 网页界面,这引起了一阵骚动。

OpenAI CEO亲自示范!自定义指令上手攻略,调教专属定制化AI助手

OpenAI推出了ChatGPT的自定义指令功能后,似乎没有收到用户们的热情回应,Altman本人都下场亲自教大家使用。

NeRF与三维重建相关

本文对室外神经辐射场使用深度先验进行了全面的研究和评估,涵盖了常见的深度传感技术和大多数应用方式。