E12 和 Memories.ai 创始人 Shawn 聊:如何给 AI 做一套“视觉海马体”?
Aug 13, 2025
过去几年,AI 的巨大突破赋予了机器语言的力量,而下一个前沿在于赋予 AI 关于世界的记忆。当大模型只能分析短暂的视频内容时,一个根本性的鸿沟依然存在:虽然 AI 能够处理信息,但却无法真正地“记住” 信息。可如今 AI 的发展瓶颈已不再是“看见”,而是如何保留、索引并回忆来构成我们现实世界的视觉数据流。
我们认为,Memories.ai 正在构建一条不同的路径。这家公司成立于 2024 年,由前 Meta Reality Labs 的华人研究科学家沈俊潇(Shawn Shen)博士和周恩旻(Ben Zhou)联合创立,他们致力于打造一个基础性的视觉记忆层,目标是成为所有 AI 的“海马体” 。
上个月,Memories.ai 推出了大型视觉记忆模型 LVMM,这不是单一的端到端模型,而是仿照人脑、通过工程化实现的视频记忆系统,能压缩、索引、查询无限量视频数据,让 AI 不止能看,更能真正记住和回忆。
Memories.ai: 是一家专注于长期视频语境理解和视觉记忆建模的 AI 初创公司,公司核心技术 Large Visual Memory Model 为 AI 构建类似人类的“视觉记忆层”,让 AI 能在海量视频数据中持续存储、理解、检索并建立关联记忆。与传统仅能处理短视频的系统不同,Memories.ai 的平台可分析高达 1000 万小时的视频内容,实现噪声压缩、索引、自然语言搜索、标签化和内容聚合等功能。
LVMM( Large Visual Memory Model):是 Memories.ai 推出的核心技术系统,目的是为 AI 打造类人的视觉记忆能力,被称为所有 AI 的 “海马体”。但这个模型并非单一的端到端模型,而是一个受人脑记忆系统启发的复杂系统,主要功能是通过工程化方式实现对无限量视频数据的压缩、索引、查询和记忆。
今年 5 月,前谷歌 CEO Eric Schmidt 投资的 AI lab FutureHouse 推出了四个 AI scientist agent,一个月后,他们又宣布自己的 AI 系统 Robin 成功开发出了新的 dAMD 药物。就在两天前,OpenAI 也专门发布博客强调 AI 在生物学领域的能力正在不断增强。
本期内容我们邀请到了斯坦福大学 CS 博士生、AI scientist Biomni 核心贡献者黄柯鑫一起聊 AI Scientist。柯鑫的学术背景兼顾了生物和计算机研究,有多篇论文发表在 Nature 系列期刊及 ML 顶会上。
本节目是全球投资平台拾象科技和开源研究平台「海外独角兽」共同出品的声音栏目。「全球大模型季报」是「海外独角兽」和「张小珺商业访谈录」的共同制作的 AI 领域观察栏目,以季度为单位,梳理行业 LLM 领域的重要信号,预测未来。
2025 Q1 中美 AI 领域都相当火热:DeepSeek R1 催化了 RL model 的热潮,头部模型厂商连续发布 SOTA reasoning models,推出 deep research;Manus 的火爆又把 Agentic AI 的讨论带到 AI 社区中心。本期内容是我们对 2025 年第一季度的回顾以及对 AGI 竞争格局、roadmap 的再思考:
本期内容是我们和「张小珺商业访谈录」的串台节目,拾象科技 CEO 李广密和商业作者张小珺一起讨论了 2023 年的大模型军备竞赛、接下来的格局变化,以及在 2024 年大模型领域值得期待的重要事件。拾象团队在过去一年中积极追踪着全球一线大模型公司、顶级 AI research lab 的动态,本期内容也是我们持续研究的浓缩总结,我们相信,“新摩尔定律时代”才刚刚开始,随着模型智能能力的进化和算力成本的持续优化,在 2024 年还会有更多惊喜涌现。 点击查看本期对谈的文字版内容。