5月28日,硅谷新锐公司AKOOL发布全球首款实时摄像头Akool Live Camera,集虚拟数字人、AI视频翻译、实时换脸、实时AI视频生成四大功能于一身,重新定义了AI视频生成的“实时性”和“沉浸感”。
真正的“实时AI视频”它来了!
在传统AI视频生成工具还在“预制化”生成视频时,Akool Live Camera已经实现从“文本视频”到“实时动态生成”的跨越。
生成方式上,传统AI视频生成工具通常需要依赖固定文本指令,预先编写脚本按照设定好的内容生成视频,而Akool Live Camera无需预先录制、编写脚本和复杂后期制作,可直接捕捉人类实时互动数据,如面部表情、语音、动作手势等即时生成视频,达到无延迟体验。
延迟情况上,传统AI视频生成工具在生成视频时延迟较高,动态响应能力有限,尤其是处理复杂场景或大量数据时,可能出现明显卡顿和等待时间。对比人类眨眼需要300毫秒,Akool Live Camera最低延迟只有500毫秒,能确保每一次互动都与现实几乎同步交互体验更流畅,在盲测中94%的人无法区别真假生成内容。
功能特性上,传统AI视频生成工具的功能相对单一,主要聚焦于视频的生成,实时翻译和换脸等功能需要结合其他软件才能实现。Akool Live Camera则是集成多种功能,具备虚拟数字人实时驱动、150+语言实时翻译、精准实时换脸技术和动态视频即时生成四大核心功能,可满足多种场景需要。
智能交互能力上,传统AI视频生成工具多为静态逻辑,按照预设程序运行,无法感知环境变化和用户实时反馈,缺乏互动性。而Akool Live Camera具备环境感知能力,可以根据环境光线自动调整面部光影;嘈杂环境中增强语音清晰度;实时解析用户情绪,如用户皱眉时,虚拟形象会放慢语速重复重点。
应用场景上,传统AI视频生成工具通常用于广告制作、动画制作等对时效性要求不高,且有充足时间进行脚本编写和后期制作的场景。Akool Live Camera的四大技术突破使其更适用实时性要求更高的场景。除广告营销、直播、跨国会议、影视作品创作、在线教育等应用场景外,神经翻译引擎技术模块创新声纹保留+肌肉运动建模,可用于跨国医疗会诊;4D数字人技术模块创新微表情电流感应,可用于虚拟教师情绪反馈;换脸算法技术模块创新皮下血管层模拟,可用于电影替身数字化;环境感知AI技术模块创新声学透镜降噪99% ,可用于工地远程巡检等应用场景。
Akool创始人兼CEO吕家俊表示:“Akool Live Camera不仅在改进视频创作技术,更在改变视频制作方式。从全球产品发布会到企业会议,甚至医疗保健,我们正在为实时视频开辟新的可能。”
解码创始团队的技术基因
Akool成立于2022年,总部位于美国硅谷,在中国上海设有子公司“艾库尔科技”,是一家专注于企业级AI视频生成技术的初创公司。
Akool致力于打造下一代AI视频生产平台,通过实时生成、编辑和交互技术,赋能广告营销、影视制作、跨国会议等商业场景,目标成为“视频领域的Adobe”。至今已有500万用户,年度经常性收入(ARR)达4000万美元。其合作行业涉猎科技、食品饮料、影视娱乐、咨询服务等,合作包括我们熟知的苹果、可口可乐、麦当劳等企业。
堪称行业黑马Akool的创始人吕家俊是一名90后中国人。他先是毕业于浙江大学研究3D建模及用AI辅助3D建模,接触AIGC领域,后在伊利诺伊大学香槟分校(UIUC)师从人工智能领域泰斗大卫•福塞斯深造,获得计算机科学博士学位。
创立Akool之前,吕家俊曾供职于苹果和谷歌这样的科技巨头公司,担任视觉影响部门核心成员。从2018年毕业到2022年创立Akool年间,分别参与苹果的Face ID戴口罩识别技术开发、谷歌专注视频处理与人体动作识别以及担任Xreal顾问推进AR手势控制技术。
从浙大 CAD&CG 实验室到 UIUC 深造,再到苹果与谷歌这样的科技巨头公司的淬炼,吕家俊拥有超过十年的顶尖技术积累和实践经验。从大厂走向创业之路,他始终对“最好的商业视频生产平台”的愿景执着追求,推动AI在商业场景的深度应用,目标构建全球领先的商业视频生产平台。
(审核编辑: 光光)