Manus' Final Interview Before the Acquisition: Oh,
### 章节 1:开场与少年得志:App Store时代的“猛浏览器”与第一桶金 📝 **本节摘要**: > 本节包含了访谈的开场花絮与正式介绍。Manus联合创始人兼首席科学家季超(PK)首先分享了他的家庭背景——父亲是北大教授,母亲是连续创业者,这种“混合基因”塑造了他。 > > 核心内容聚...
Category: Podcasts📝 本节摘要:
本节包含了访谈的开场花絮与正式介绍。Manus联合创始人兼首席科学家季超(PK)首先分享了他的家庭背景——父亲是北大教授,母亲是连续创业者,这种“混合基因”塑造了他。
>
核心内容聚焦于他在高中时期的第一次创业经历:利用2009年App Store兴起的红利,他开发了一款名为“猛浏览器”(Meng Browser)的付费应用,在高中时期便获得了30多万美金的收入。他对比了当年移动互联网的“草莽时代”与如今AI时代的差异,认为当年有明确的新平台(iOS/App Store)红利,而现在的AI创业则缺乏一个全新的硬件媒介平台。
季超:
因为虽然(Manus)的宣传片基本是我出镜,然后呢这时候呢自然有人支持有人骂,对吧?他们看着人骂多(会觉得):“这小红太坏了。”(但)你会发现小红有个非常稀缺的特质——什么?他很正常。他身心健全,没有任何不良嗜好,没有任何极端、极端的思想。这不是一个……这不是一个正常的指标,这已经很难得了,你知道吗?就是我觉得现在整个这个行业有很多人比较偏(执)或者怎么样,但是讲真其实就你没有乔布斯的命,却得了乔布斯的病。
张小珺:
你在说你自己吗?
季超:
呃,对。我觉得别的创始人都太艺术家了。(关于)这个问题要非常郑重的回答一下,就是我可以直接这么说:如果我们在三月份发布的时候,如果没有任付费的宣传,我死全……(花絮结束)
张小珺:
这是VARR吗?Hello 大家好,我是小珺。2025年初,Manus以通用Agent的身份引发了全球的关注,随后走过了惊心动魄的一年。那2025年也被认为是Agent的元年。过去一年我们访谈了前OpenAI、现腾讯的姚颂,月之暗面(Moonshot AI)的杨植麟,Manus的肖弘,LiveKit的陈穆等。那站在2025年的尾巴上,我邀请了Manus联合创始人兼首席科学家季超,来和我们一起聊聊Manus的魔幻故事和Agents的进展与前瞻。Hello PK,先给大家打个招呼,并且做一个简单的自我介绍。
季超:
好,大家好,我叫季超,朋友叫我PK。我是Manus的Co-founder and Chief Scientist(联合创始人兼首席科学家)。然后今天很荣幸能参与这个节目的录制。
张小珺:
你从小的经历感觉就很与众不同,就是很小四岁就去了美国,然后二年级就回国,高中开始创业,大学辍学了又创业,然后又读完了研究生。你讲讲你的这段经历吧。
季超:
首先得从我家庭背景(说起)。就我觉得我很幸运,就是我的父亲是北大物理系教授,就是传统意义上的科学家;然后我母亲算是老一辈中关村连续创业者,当然现在可能可以叫企业家吧,对。所以就是我从小在一个这两种……怎么说,不讲文化吧,就两种不同的风格中一块去成长。我可能就在两者中取了一个中间点,就是所谓的科技创业者。
然后我从小的话其实就是不是那种聪明孩子,就学习也就一般。但是呢就是比较喜欢自己瞎捣鼓(东西)。(我是)偏科吧,偏科吧,对。就是其实我不知道我学习到底好不好或者聪明不聪明,因为我觉得我就没怎么学,对。
然后我比较幸运的是就是我很早就找到自己喜欢做的事。就是那时候是大概是2009年,然后就是苹果其实出了iPhone之后的第二、第二年,对。然后那时候对我来说有一个很大的改变,就App Store出现了。App Store我觉得是对我来说是特别重要的一个转折点。因为在App Store之前,其实世界上很多人像我一样就喜欢自己捣鼓软件或做东西,但是你其实缺乏一个很好的全球化变现的一个能力。
但这时候对于高中生来说,就如果你只是在瞎捣鼓一些课外的东西的话,这个东西其实表里(如果不被)经看到的话,你知道吗?就是你没有一个很好的第三方指标来证明说我的这个爱好其实是有价值的。而App Store当时的出现给了我一个契机,就是说我可以向我的父母、同学乃至于老师证明说:我瞎搞的这个东西是、是能产生经济价值的。所以呢我就算是中国第一代软件出海的创业者,对,当时那时候还在上高中。
然后我是做了一个第三方的iOS浏览器,叫做Meng browser——猛浏览器。当年小火过一点吧。然后用的是最朴素的那种叫Paid Copy,就是每一份就赚一份固定的销售额的这种模式。然后所以就是很幸运,就很早的时候就有了比较稳定的现金流,对。
张小珺:
这个有多稳定啊现金流?
季超:
那个软件从第一个版本到最后我大概赚了30多万美金。当时我觉得那个对于高二、高三的学生来说已经算是挺开心的一个事。而且关键是就是他的销售的模式很清晰嘛,对吧?我不需要去考虑太多的,比如说这个In-App Purchase,就应用内付款或者提供一些增值的这种模式。我只是非常老实的卖一份Copy然后你给我一份钱。所以其实对于我就是怎么说呢,我就(觉得)维护的成本是比较低的,是一个当时还成立的一种商业模式。
但是后来大家都知道,就是移动端软件已经不太再支持这样特别朴素的商业模式,嗯,因为大家都要先免费获取客户,对。或者就说当时是一个很好玩的情况,因为那个时候从桌面互联网到移动互联网,我觉得是有一次平台或者简单来说就有一个硬件媒介的变化,对吧?所以就是你有一个新的一个媒介出来,即使你是传统的大厂,比如说国内当时的BAT,然后海外这些公司,其实大家都是跟(个人)开发者一样,众生平等,都在做一个全新的一个尝试。
然后那时候其实最后有一段在我看来可能是蛮荒期的一个阶段,所以你有很多的机会去做这样的事,大家还没有反应过来后来的这个诸多的商业模式。但你看反观现在AI——我可能就聊到哪说到哪——你就觉得很难的一点就是:AI虽然是一个新的一个技术突破,但是实际上没有一个全新的一个平台出现。所以你看这回的话,我觉得没有存在那个蛮荒(期)。就是无论是巨头还是创业公司还是个人开发者,大家的反应都一样快,做的都非常的干脆利索,对。所以我觉得我算是赶上了一个好时代吧。
这是为您整理的这份访谈的第二章节。
这一章节聚焦于季超(PK)的第二次创业经历。他从一名依靠App Store红利的少年开发者,转型为深耕NLP(自然语言处理)的技术创业者。这一段内容极具戏剧性:他讲述了自己如何试图通过“垂直整合”的笨办法去挑战Google,最终却在GPT-3横空出世时遭遇了认知的“崩塌”,并深刻领悟了AI发展的残酷规律。
📝 本节摘要:
本节讲述了季超(PK)结束首次创业后,因2013年Word2Vec技术的出现而投身NLP(自然语言处理)领域的故事。他创立了Magi,试图通过构建自动化知识图谱和语义搜索,为可穿戴设备时代打造下一代搜索引擎。
>
这是一个典型的“技术理想主义”故事:团队选择了最艰难的“垂直整合”路径——从爬虫、索引到模型训练全部自研。然而,这段经历以一种震撼的方式终结:当他在2019年拿到GPT-3的早期测试资格时,发现自己辛苦训练多年的专用模型被OpenAI的通用模型轻松“秒杀”。这种“天塌了”的感觉促使他卖掉公司,并深刻反思了“苦涩的教训(The Bitter Lesson)”:在AI领域,通用模型加算力往往胜过精巧的人工设计。
张小珺:
当时这段(猛浏览器)创业是怎么结束的呀?
季超:
这段创业其实我觉得没有一个明确的“结束了”的那一刻。其实它是下一次创业的一个起点。那时候我觉得还不能严格上来说称为创业,因为我只是一个学生个人开发者,用一个最朴素的商业模式去获得了一定的现金流。
但当时的话,你有一定的现金流,同时你要做一定的Marketing(市场推广)。当时我也没团队,就一个人,自己在国内外的论坛上发帖。当时国内没有很成熟的支付渠道,因为你知道现在App Store你可以用支付宝、微信付款,但当时其实只能支持国际信用卡,所以中国国内基本是没有什么付费用户的。这感觉跟现在AI也挺像的。
反正当时呢,我就想那既然国内我很难去获得现金流,那我在国内就只能赚吆喝。所以我那时候会破解自己的软件,然后在国内论坛上发——就是你没钱你就给我捧个人场。然后在这样做的同时,其实你就获得了一些来自于资本界的关注。
那时候也很好玩,我当时高二、高三的时候,参加了一个当时感觉还是比较有创业氛围的活动。那时候在中关村,我参加了一个创业活动,然后就认识了真格基金。这个故事就非常简单,当时徐老师(徐小平)问我:“小伙不错,你想创业吗?”
然后我当然不想创业了,对吧?因为我今天有一个稳定的、我可以边上学边躺着赚钱的现金流,那我何必要创业呢?但我觉得毕竟是徐老师,当时我就回家跟我父母提了这个事。这方面确实感谢我父母,他们就说这个你是值得去好好考虑一下的。然后那个时候对我来说也是陷入一个纠结:我可以有几个选择,也许我可以申请学校去上一个好的大学,走现在跟大多数人一样的那条路;但另外一点就是我觉得App Store给了我一个特别好的正反馈——就是你只要创新也许就能有回报。
当时想的会比较那种……比较天真,就说我只要做成一个好东西,自然就会有一个好结果。当时其实我渐渐意识到这不是一个常态,我是很幸运地踩中了一个时代的机遇。那好,其实我也许什么时候都能继续去读书,所以我就想那其实现在优先考虑应该是机会成本。所以我当时就拿了Term sheet(投资意向书),然后决定这大学我不上了,我要去创业。
张小珺:
第二段创业的方向是什么?
季超:
第二段创业的方向其实应该就是刚才讲的第一次真正的创业。就是因为在做这个浏览器的时候意识到:NLP(自然语言处理)这个领域真的非常有意思。
那时候其实也是很巧,2011年左右,距离一个石破天惊的Paper——我说的不是Transformer,其实是2013年的Word2Vec——当时Google推出一篇Paper叫Word2Vec。就是第一次能够可靠、高效地把离散化的自然语言文本变成稠密向量。这个其实对我来说是我心中最石破天惊的一个转折点,因为它头一次能让我们比较方便地把一些源自其他机器学习和深度学习领域的方法应用在语言处理领域。
当时我觉得这一下新世界的大门就打开了。这让我真正意识到我的兴趣可能其实是在NLP,而不是在继续做浏览器。然后也很感谢当时真格基金,我说我不想做浏览器了,然后真格说:“随便”。
当时我看中了NLP,同时也看中了另一个市场机遇——当然回过头看我觉得是错的。就是当时到2013年其实已经开始有传闻,说苹果在筹备一款可穿戴式设备,其实也就后来的Apple Watch。这个当时给了我特别大的想象空间。因为我当时觉得那个时候的搜索还是你输入一个Query(查询),然后它给你十个蓝色的链接。这个东西能够Work的根本原因是我们正在与电脑这样一个大屏幕进行交互。那假设未来比如可穿戴式设备或者语音界面(Voice Interface)更加成熟的话,那这一个交互模式可能就不Work(奏效)了。
所以当时我想解决的一个问题是什么?就是说我能不能以一种更结构化且更紧凑的形式,把知识跟用户之间的交互进行一次革命。然后这个当时就影响了一个方向,现在可能叫语义搜索(Semantic Search)。这个东西我当时会觉得这就是下一代的Google,我会不会是当年的Google颠覆雅虎那样呢?所以我们团队大家都很兴奋。
张小珺:
你们当时做这些,你的目标是什么呀?因为我感觉一直在顺着这个技术往上爬。
季超:
当时我们选择了一条很苦的路,就是一切我们要“垂直整合”。对吧?就是模型自己做,产品自己做。那好,我其实每一次产品的迭代,我都得等着我底层模型的完成。那时候模型跟现在比简直非常非常小嘛,但是同样Evaluation(评估)也很恶心。你的Infra(基础设施)也要自己去搞。所以我们当时迭代的周期基本是两到三周能有一个模型的迭代。
但是两到三周在当时的外部,这简直是剧变嘛。直到2019年的某一天,我拿到了GPT-3的Early Access(早期测试资格)。我觉得天要塌了。
张小珺:
为什么?
季超:
因为是这样,我刚才讲的,我们当时选择很苦的一条路,就是一切垂直整合。然后拿到GPT-3的时候我测了一下,我觉得天塌了的原因是什么?我们把同样的任务,我拿GPT-3随便写了个Prompt——那时候大家没有什么Prompt Engineering(提示词工程)的艺术,都胡写——我发现它跟我们自己训的端到端模型五五开,你知道吗?
而且我当时就意识到一个问题,就是它虽然现在很贵,但是它是一个通解(General Solution)。那个时候我们在比如NLP领域内大家互相交流,你会有很明确的感觉:比如我跟别人自我介绍说“你好,我是Magi团队的,我们是做信息抽取的”,然后这边可能是做机器翻译的,然后这边是做客服系统的。大家泾渭分明,互相握手互相学习。
但GPT-3出来之后其实它印证了一件事,就是好像我们做的不同的任务是能够“大一统”的。GPT-3出来之后就彻底把我们这颗心给按死了,你知道吧。所以当时我的第一反应就是:赶紧卖掉公司。
张小珺:
卖了吗?
季超:
卖了。
张小珺:
变现了是吧。其实你好先进,我听下来就是你从11年做的事情,感觉和现在大家做的事情差不多,就顺着做了一遍。
季超:
我觉得不能这么说。你应该说大家的每一个阶段遇见的问题是类似的,但是你每一个阶段其实都未能解决未来大家再次遇到的时候的问题。比如说我们当时说的Long Context(长文本)是从512个Token到16K,现在的Long Context可能是指的比如说200K到两个Million。所以我只是说历史的话它会押韵,那肯定不会重复这个东西。
当时我们觉得产品一方面是我们的技术和非技术原因没做好,另外一点我们当时很期望发生的——就是说有一个新一代的可穿戴式设备或者全新的人机界面的出现——这个东西可能到今天为止也许可穿戴没有充分的落地。
所以当时我们就“先烈”了。那一刻,我觉得在那个项目做完的那一刻,我的人生已经圆满了一半。你知道吗?所以在后来像包括现在做Manus这些事,我心里已经没有什么就是那种“我要证明自己”或者“我要做什么这个才能死而无憾”。我早就无憾了,所以现在我就可以以一个很轻松的一个状态来做很多事。
📝 本节摘要:
本节中,季超(PK)分享了他在上一家独角兽公司工作的经历——利用公司资源“囤积显卡”并沉迷于内部模型打榜,享受着单纯的技术乐趣。
>
核心转折点在于他对自我角色的认知升级:他坦言自己厌恶人际管理的复杂性,且容易陷入技术“正道”的执念,因此不再适合担任CEO。这一认知促使他寻找一位能互补的搭档。他最终选择加入肖弘(Red)的团队,并非因为对方也是技术天才,而是因为肖弘拥有AI创业圈极其稀缺的品质——“正常”。他犀利地指出,当前的AI创业更像制造业而非移动互联网时代的艺术创作,需要的是情绪稳定和成本控制,而非“没有乔布斯的命,却得了乔布斯的病”的偏执。
张小珺:
你后来还去工作了?
季超:
对,我工作了一年半。那段工作经历其实非常开心。当时是在一家独角兽公司,相当于在零上市前的一年多。当时又刚好赶上GPT-3出现,我意识到危险嘛,所以相当于我是从ChatGPT出来之前一直干到了ChatGPT出来之后那一段。相当于我在那家公司从零做起了LLM(大语言模型)的业务。
那家公司的一个工作模式当时很多人不喜欢。因为那是家To B的公司,To B的一个经典的问题就是说你如何去量化用户的收益。除了最终的经营指标以外,你其实也需要一些过程指标。那当时有一个部分团队的任务是说,我把所有用户的需求转换为可量化的Benchmark(基准测试)。那这个呢,就是Researcher(研究员)和算法岗最喜欢的事情——就是打榜。
所以那时候我的主要工作就是打榜。然后打榜又很开心,因为当时公司内部的一个激励方案很有趣,就是公司内部有个类似Kaggle那样的榜单系统。你赢得越多,你的奖品是什么呢?你能获得更多的显卡。所以你会进入一种“强者恒强”的状态。我当时一个人能囤好几十张卡。我一堆卡的资源闲置,我就可以去捣鼓很多我想试的东西,因为总有客户会需要嘛。所以我可以做很多的实验,同时我的算力又是最充裕的。我在那一两年半里头,我一直霸榜在第一名。所以我觉得那段经历特别开心的。
张小珺:
你以前上学的时候好像没有这个劲头是吧?你以前上学的时候是那种特别喜欢比分数的学霸这种类型吗?
季超:
不是,因为我好多课我都没上。所以我特别感谢我的高中,当时在北大附中读书。我觉得我特别幸运,就遇见了一群超级开明的老师。有了课不想上,老师说那就别上了。后来学校还给了我一个计算机社团的办公室,有空调有电脑,让我好好的捣鼓我喜欢的东西。所以我觉得太幸运。
张小珺:
你第二段创业终止的那一刻,你在想什么呀?
季超:
我当时的想法是这样:我知道有一个新技术出现可能要杀死我,那这时候我的选择是什么呢?当然是选择加入了。但当时的想法是,我刚刚经历上一次创业的一个创伤——就是你自己要做“垂直整合”真的很痛苦。我常说一个比喻,就是每天醒了之后,你都感觉海水在上涨,但是你不知道会长到什么程度,也许你第二天醒的时候就已经到鼻子这了,就很恐怖的一个感觉。
所以我当时想法还是我喜欢创业的,但是我不想做垂直整合了。所以我当时的目光是看向了基础设施层跟应用层。但这时候其实也有一个问题,就是大家当时一直在说这个事,但是没人知道真正的AI应用该长什么样。所以我当时觉得我不应该自己再从零去以一种“我相信”的态度去做的er事,我应该有一个过程去更多的观察。
张小珺:
后来是怎么加入Manus的?
季超:
其实当时认识了小红(Red),就是我们现在Manus的CEO。我是怎么被说服加入的?或者说为什么我要从第二段创业之后去开始这个事?
首先有一点,就是我意识到我根本不是做CEO的那块料。就是我既不喜欢商业化,也很讨厌人。所以我觉得这是交了一个学费,就是我知道我不该做CEO,我应该找一个比我适合做CEO的人。
张小珺:
那你觉得你是哪些方面不适合做CEO呢?
季超:
我觉得完全就是一个情绪上就很抵触。首先有一点就是,我很喜欢跟电脑打交道,但我觉得人太复杂了。你的组织在随着变大的时候,其实你会发现这个复杂度其实是指数级增长的。我觉得我不是那块料,我搞不清太多人与人之间的更微妙的这些事情。
张小珺:
你看起来比小红E(外向)很多啊。
季超:
不不,其实我们公司除了张涛以外,全都I人(内向)。我只是“开朗的内向”。第二点就是,我有的时会陷入一种特别追求“正道”的思路。什么叫正道?就是你有一个能够赚钱的方向,和一个能够把一个特别有趣的技术走到底的方向,我会毫不犹豫地油门踩死往右走(技术方向)。但我知道这已经是错了。所以呢,我需要有一个人把我给管住,就是在我有这种想法的时候给我按死。
张小珺:
那为什么跟小红合伙呢?
季超:
首先就是我很幸运,跟他交流之后发现他太适合当CEO了。他擅长所有我不擅长的东西。而且其实如果你反过来说,你看当今国内外AI创始人一号位的这个版图的话,你会发现小红有个非常稀缺的特质——什么?他很正常。他身心健全,没有任何不良嗜好,没有任何极端的思想。这不是一个正常的指标,这已经很难得了,你知道吗?
我觉得现在整个这个行业有很多人比较偏执或者怎么样,但是讲真其实就:你没有乔布斯的命,却得了乔布斯的病。
张小珺:
你在说你自己吗?
季超:
呃,对。而且我经过这个惨痛的失败之后,我意识到这一点,但是他们还没有意识到。所以我觉得小红身上最可贵的品质就他特别正常。而且好多事情的判断,他会更加的无论是数据驱动还是直觉驱动,但是他是一个真正的能把公司从一个阶段持续带到下一个阶段的人。而我可能如果自己从头做的话,我只会在我喜欢的那一个阶段很爽。
张小珺:
你是怎么觉得他很正常的?
季超:
我觉得还是对比出来的。我觉得别的创始人都太“艺术家”了。小红非常的现实。或者说包括现在我们公司的这一运行,其实我觉得都是很稳健的,甚至有时候我们内部反思会觉得有点保守。
现在的AI创业,我觉得不是优点。移动互联网时代,我还挺喜欢这(艺术家)类人的,因为你的边际成本很低,你可以去赌一把搞一个大的。但其实我们觉得现在AI这个行业,首先LLM inference cost(推理成本)一直在下降,但其实我们心中隐隐觉得它更像传统的制造业。它一直有一个固定的成本在那,你如果没有优化的的话,其实你随着你用户量的增加,你的成本是线性去提升的。所以这整个对经营的操作能力的要求,是比上一代互联网创业要高很多的。
张小珺:
之后他怎么打动你加入呢?
季超:
还是因为他说:“PK,我知道你做过浏览器,你做过搜索引擎,你做过大语言模型。你想不想在一个产品里把这三个事都重新做一遍?”
我觉得好呀,这听起来也挺吸引人的。然后当时就加入。当然加入之后也非常清晰的一点,就是这次创业其实我不是来做Monica(他们之前的浏览器插件产品)的。Monica是我们大家的一个学费,或者说整个公司的Cash cow(现金牛)。但是我们一定加入,把这个团队团结起来,包括后来张涛还有更多的合伙人加入,我们是要一起搞一个全新的事情的。
这是为您整理的这份访谈的第四、第五章节。
这两章的内容非常核心:第四章探讨了季超(PK)对于AI行业“模型层”与“应用层”终局的深刻洞察;第五章则披露了Manus团队在推出爆款之前的“弯路”——他们曾花费半年时间开发了一款AI原生浏览器,最终却选择亲手“枪毙”了这个项目。
📝 本节摘要:
本节中,季超(PK)深入剖析了“模型公司”与“应用公司”的辩证关系。他提出了一个反共识的观点:未来两者将不再泾渭分明,模型公司会做应用,应用公司也会涉足模型。
>
他认为,做出一款好应用比训练出一个好模型更难。理由在于,硅谷的技术秘密流传极快(“老公在OpenAI,老婆在Google”),模型层面的壁垒是暂时的;而产品的洞察和对用户需求的理解才是真正的护城河。他预言未来会演变成“应用之争”,而应用公司凭借独特的用户数据飞轮,反而能反向定义和优化模型。
张小珺:
但是大家会觉得AI时代不一样的是,可能大模型和产品是一体化的,所以说拥有大模型的公司更有可能做出好的产品。就是他们那个“沿途下蛋”的理论,你从一开始就不认可吗?
季超:
我认可这件事,但是我认为有一个时间后(滞性)。就是我现在的一个观点其实是,可能都不用太久吧,也许比如说六个月之后,其实你不用再分所谓的“模型公司”跟“应用公司”。基本上每一家头部应用公司都有做模型的能力。
其实这个事已经被Cursor给(做)出来了。就是我觉得之前大家还有一种那个“秘而不谈”、泾渭分明的这个状态,但你看Cursor已经跳出来,他们搞了那个他们新那个模型叫什么来著?Co-cursor one吗对吧?
其实我觉得首先就是,做模型或者说做垂直整合这件事,它其实最影响的是你初期的迭代速度。就是我上一次创业的最惨痛的一个教训嘛:你在不确定的时候,你可以做bottom-up(自下而上)的迭代的话,你会被你的模型迭代所影响。其实这个不仅是创业公司的问题,哪怕你强如OpenAI——我非常尊敬他们的点就是他们一直非常尊重这种自下而上的模式,所以他能产生很多新的创新。但是如果你首先以一个“产品引领”的思路来看的话,你某种意义上来说,你(如果先做模型)是在“买模型彩票”。因为即使你有一个比较好的Roadmap,其实你在最后完成Post-training(后训练)那一刻之前,你都不知道这个模型到底能不能deliver(交付)、达到你想象中的那样的需求。
所以很多时候你是因有些突破,所以反向在引导产品的走向。这个我觉得我之前已经吃过这个亏。这是第一点。
第二点就我刚才讲的,就是模型你即使能通过很多的比如说你优化你的Pipeline(流水线),你增加你的人手,或者让你整个这个链条更加的流畅来增加你的迭代(速度)。但其实这个世界上只要有产品经理存在,你一定是追不上产品经理的脑回路的活跃度的。
张小珺:
你从第一天就Pass掉这些大模型公司,你觉得他们的未来会怎么样?
季超:
我觉得其实是这样,就是大模型公司一定最后都会变成“同时做模型和同时做应用”的公司。其实你看美国现在这个版图基本已经是这个方向了。OpenAI我认为他现在更是像两家公司:一个模型公司和一个跟他有强关联但并不绑定的Research Lab(研究实验室)。
而Google的话始终它就是一个双向都很强的公司。而Anthropic它可能之前还一直会比较关注说他做一个B2B Market,比如他做他的Cloud API,但其实Claude Code的巨大的成功给了他们很多正向的一个激励。像他们自从那个Mike Krieger——就他们现在的CPO(首席产品官)加入之后,其实他们对产品的打磨做的非常好。
但是我觉得这可能就是大家都会走向那条路。反过来说,我觉得如果最后不再分大模型公司跟应用公司的话,那我认为其实做出一款好的应用且被大家喜欢的应用,其实比做出一款够好的模型难得多。
因为训模型这个东西,它的知识的流通在业内是非常非常快速的。尤其在硅谷,没有秘密,你知道吗?你可能一个老公在OpenAI,他的老婆在Google,没有什么秘密。所以这个东西一定会流通的。所以我觉得到最后其实会变成一个“应用之争”,然后每个应用背后会绑一些模型。-
张小珺:
所以未来模型公司和应用公司是没有那么泾渭分明的?
季超:
对,我觉得不会那么泾渭分明。
📝 本节摘要:
本节披露了Manus团队在2024年4月至10月期间的一段鲜为人知的“失败”经历。在上一款插件产品Monica取得成功后,CEO肖弘用“在一个产品里把浏览器、搜索引擎和大语言模型重做一遍”的愿景说服了季超加入。
>
团队投入半年时间研发了一款类似Arc的“AI原生浏览器”,但在产品接近完成时,他们陷入了自我怀疑:离线小模型效果不如云端大模型、AI接管浏览器的体验不仅奇怪且效率低下(“抢鼠标”问题)。最终,在看到Arc浏览器宣布停止开发的推文后,团队达成了放弃的共识。这一段经历虽然是“弯路”,但也磨合了包括张涛、Red、潘潘等六位联创在内的核心团队,并让他们彻底想清楚了“不做”什么。
季超:
(加入时)小红说:“PK,我知道你做过浏览器,你做过搜索引擎,你做过大语言模型。你想不想在一个产品里把这三个事都重新做一遍?”
张小珺:
你加入Manus是24年的3月份,然后到24年10月份,你在做什么?
季超:
对,这个其实也是我忘了红(小红)之前有没有跟大家分享过一事。就是他为什么叫我加入且用那句话说服(我),因为当时我觉得我们大家整体做了一个错误的判断。就是因为当时Monica已经有了一定量的用户量,我们会觉得也许我们可能是当前世界上最懂“用户怎么在浏览器里用AI”的团队。那么我们的一个直觉的惯性外推就说:我们要不要做一款浏览器?
因为其实有一点很好玩,就是如果你去看Chrome的插件商店的话,你能看见所有别的产品的活跃和下载量。当时你看整个插件生态里头的头两名分别是Adblock(去广告)和Grammarly。他们做了很多年,产品绝对没有问题,但他们最后都停留在大概5千万左右这个量级。5千万其实对于一家创业公司来说很大,但是如果你跟整体Chrome浏览器的日活——我记得能有20亿吧——相比,我们就觉得好像我们做到死只能渗透到比如不到1%的Chrome用户。
所以我们当时第一直觉是,也许我们被插件这个东西给约束了。而我们当时想的比较天真,想的是能不能跳出插件而变成一款独立的、原生的浏览器在用户的电脑上。同时这能做一些别的事情,比如我们可以做端侧模型。当然这个其实就是一个坑,待会讲的。
张小珺:
当时张涛加入了吗?
季超:
加入了。其实我们团队有六位合伙人。平时在外面可能露脸稍微多一些的是张涛,我们的CPO(首席产品官),他之前也是一个非常Senior的连续创业者。然后是肖弘(Red),他是我们的CEO。然后还有我们的CTO潘潘,以及我们的CMO Jie,他们三个其实是之前就一直在一起创业,做过两三家公司了。然后除了在这之后就是我,还有我们的COO Cici,她是一直负责比如公司运营、财务相关的同事。所以其实我们有六位同事是合伙人。
季超:
(回到浏览器的话题)我们当时做浏览器,大家都很兴奋,从4月份搞到了大概九月份。我们做出来的产品形态其实跟现在的ChatGPT Search、Atlas,还有像那个Arc Search已经很像了。,
当时我们想的切入点有几个。一就是我们要训练一个端侧的模型,来让一些操作能够在用户的电脑上去完成。既不产生API消耗,同时也充分尊重用户的隐私。这里就埋了第一个很傻的(坑):拜托,你做的是这款浏览器,浏览器本身就是联网的,你为什么要追求一个离线端侧运行?第二点就是用户其实大部分时候不会关注你到底是离线的还是怎样的,他们要出最好的效果。而当时的话,你在电脑上即使是Apple Silicon芯片,你其实也就跑一个3B左右的模型就差不多是极限了。那用户会拿你跟云端的旗舰模型去对比,你的效果一定会差一些。
第二点其实至今有很多人在做的事情,就是想让AI接管用户的浏览器来完成一些自动化的工作流。这个事我们当时也做了,但我们觉得有几点不对劲。
第一点就是,如果你让AI接管用户的电脑的话,你会发现一种很奇怪的使用体验。比如我让AI帮我在一个网页上完成填表,那这时候比如AI在填一个字段,我一滚屏幕,其实我打破了AI的observation(观测)。这时候Agent可能会把这网页又拉了回来。那这个体验很奇怪,就好比你有一个特别聪明的实习生,但你好像非要跟他一起共用一个电脑。这就是两个人在抢一个系统。而实际上我们现在用的所有操作系统和软件,本质上还是为一个人同时使用设计的。
第二点我们发现,什么样的任务真正是有价值的?如果你让他去完成一些你通过简单几次点击就能完成的任务的话,你觉得是很亏的。因为你的决策其实比AI还要快。真正有价值的应该是那种长任务(Long horizon task)。但这时候会有一个问题,因为你做的是一款原生的AI浏览器,AI在你的电脑上运行,你就很尴尬——我不能把我的电脑盖上。我电脑一盖之后,电脑就休眠了,就卡死了。那怎么样?在AI在持续进行长时任务时候,我还要一直盯着他们,保证我电脑不睡眠吗?我自己又不好干别的。所以我觉得这两种体验我们用都觉得非常的奇怪。-
其实更大的问题是我们觉得团队没能回答一个核心讨论:到底做了这样一款原生的AI浏览器之后,有什么是我们本来的Chrome加Monica做不到的吗?话想像好像没有。
然后我们越想觉得这事不对。直到后来老天帮忙,有一天我们上网看Twitter,发现我们很尊敬的一家美国创业公司叫The Browser Company,他们做了一款浏览器叫Arc。突然那个创始人Josh Miller说:“我决定Discontinue Arc(停止开发Arc)。”这是一个很大的决定。他说Arc做了这么久,我甚至无法说服我的亲戚朋友从Chrome换成Arc。
我们觉得好吧,他已经把我们心里的担忧黑纸白字的写出来了。我们就觉得可能真的浏览器不适合创业公司去做颠覆。-
张小珺:
小红说他当时就觉得浏览器有点不对,但是不敢跟团队说,原因是因你们都是被他用浏览器忽悠进团队的。
季超:
对,我觉得这确实也是小红比较好的一点,他非常会考虑大家的一个感受。但是那段时间其实反过来看,我们觉得特别宝贵。就是大家在一个很自然而然的形成共识的过程中,逐渐逐渐放下了浏览器这件事,处于一种几乎无所事事的状态。当一群不太笨的人无所事事的时候,就会产生很多很好的(想法)。-
这是为您整理的这份访谈的第六、第七章节。
第六章揭示了Manus诞生的核心洞察——从观察用户如何“错误”地使用Cursor中找到了灵感,并解释了“通用Agent”的技术哲学;第七章则直面了产品发布后的巨大争议,包括“饥饿营销”背后的算力崩塌真相,以及对“买通营销号”指控的激烈回应。
📝 本节摘要:
本节详细讲述了Manus产品的诞生过程。在放弃浏览器项目后,团队通过观察非技术人员使用代码编辑器Cursor的行为,意识到“编程是解决通用任务的媒介”,从而确立了将Agent搬上云端的新方向(项目代号“Airbnb”——Browser in the Air)。
>
季超(PK)解释了“Manus”一词源自MIT校训“Mens et Manus”(手脑并用),寓意在AI拥有智力(心)之后,Manus要成为接触现实世界的“手”。他从技术角度定义了Manus的本质:通用模型 + 虚拟机(图灵完备的计算环境),并指出做通用Agent并非为了营销,而是为了避免在垂直领域重复造轮子,让用户去定义使用场景。
张小珺:
为什么这些产品都是M开头啊?还包括你之前的公司。
季超:
对,这个我觉得是很好玩。就是我第一个产品叫猛浏览器(Meng Browser),M开头;第二款产品叫Magi,M开头;然后Monica,M开头;Manus也是M开头。然后我觉得这完全就是一个巧合。当然M可能有点私心,因为名字是我起的。
张小珺:
怎么取的这名字?
季超:
这个名字其实当时我们纠结过很多名字,但是后来是真正让我们想通这件事的一个点是:我们想明白了自己该做什么。
就是当时的话其实做浏览器,我们已经隐隐有一个感觉,就是模型在解决的是智力,但是再强的智能,你也不能把环境给内化掉。所以你一定是需要一个“手”来去触及到现实世界中。否则你再强的思维,你只是一个理论物理学家,或者说甚至你可以说是一个“缸中之脑”。
所以我们做的是让智能真正真正去触及现实世界。所以让我想到了其实MIT的校训叫“Mens et Manus”,Manus是一个拉丁语,翻译成中文一个叫“心与手”,或者“知行合一”。我们觉得别人都已经在“心”或者说心智这件事上做了很远的探索——所有基座模型公司使命如此。而我们要做的其实是那个“手”。所以Manus就是拉丁语“手”的意思,。
张小珺:
所以说你们在那段闲散的、无所事事的时间里怎么产生Manus这个idea吧?
季超:
对,这个其实是一个渐进的过程。然后我觉得又一次是上天赏饭吃。就是当时大家就是在正常的运营Monica,同时也会做一些别的实验。但是当时我们会发现那个阶段下已经有一些AI产品受欢迎,尤其是coding(编程)领域的。那时候像那个Cursor、Winsurf,后来的Devin其实有很多用户。
然后我们作为工程师,我们肯定会用嘛。然后我们发现其实公司里和很多非工程师都在用Cursor。这个就让我们很意外,因为Cursor它的产品形态仍然是一个IDE,就是集成式开发环境,就是写代码人才用的一个东西。让我们发现比如公司的运营同事,他居然在用Cursor去写博客;我们的数据分析同事在用Cursor进行数据分析和可视化。然后这个就让我们非常意外,就是因为它本来是一个最专业的产品形态,却有很多它非原始设定的目标用户群在用。
然后我们就去站在他们身后去观察他们:你们到底在怎么用Cursor?很好玩,就是因为左边都是代码,右边是那个跟AI聊天的窗口嘛。很多这些同事他们也不会写代码,他们根本不看左边的东西,他们就是在不断的跟AI去交流,让他去把一个事情完成。AI通过编程的方式,以编程或者代码为媒介去完成一些非编码任务。
那我们觉得这个其实是非常重要的一点,是让我们意识到其实编程不是一个垂直能力,编程其实是一个通用能力,它是解决通用任务的一个媒介,。
季超:
那这时候我们要想的就是Cursor这个形态其实对他们来说不是最优的。有几点:一个是我们在刚在做那个浏览器这个尝试的时候学到的,就是说它不应该跑在你的电脑上。要不然他不能解放你在长任务中的注意力问题。其实老说Attention is all you need,我们希望解脱用户的Attention,让模型能在——对不起,让Agents在云端去运行,去异步的去执行。
第二点就是代码这件事应该作为一个工具,而不是它一个主要的呈现。因为对于很多人来说,看见代码是有点天然的紧张感的。所以我们觉得不行,应该用同样的技术,但(把)技术复杂度包装起来。
然后很幸运的是当时在浏览器中做了很多的技术积累,比如说道我们对Chromium内核非常了解,然后我们自己做了整套这Agent的调度系统。那好,对我们来说好像这个事也没有那么难。我们要做的就是把整体AI浏览器这个东西搬到云上。所以我们当时内部立了一个项,然后也是我瞎拍脑袋起了一个项目代码叫“Airbnb”。是什么意思呢?叫 Browser in the Air(云端浏览器)。就是理唸运行的浏览器跑在云上。
张小珺:
为什么你们要做一个通用的Agent?
季超:
对,这也是一个特别好的问题。按照传统的创业的理念,大家可能是这样:选中一个niche market(利基市场)或者找进一个垂直领域扎进去做深。这可能是更正常的一个做法。但实际上我是有几个不同的角度的观察。
首先一点是技术层面。就是我上一次创业其实就经历了一种专用模型被一个大一统模型吃掉的这样一个体验。所以现在这套技术体系之下,即使你在做一个垂直的agent,你背后用的是什么?无非还是通用基座。
另外一方面,Manus本质上是什么?它其实是一个通用的模型加上一个计算机。因为每个Manus的session(会话)背后都会有一个单独隔离的虚拟机沙盒。虚拟机这个东西学名叫图灵机,理论上来说它是能够去模拟或者运行任何算法。首先这样我们看到底层的两个技术供给其实是通用的。那么走垂直其实是在上面加约束,。
第二点就是我们一开始像做Monica一样,我们好像没有做特别大的使用场景上的bet(下注),而是一种类似于达尔文的形态在观察。就说如果我给用户提供的是一套通用的技术架构的话,我获得的优势是什么?就是用户可以按他的想象力去使用这个产品。同时我们作为创建这个产品的人,我们的使命是通过观察用户的整体的collective(集体)的一个行为模式去捕获到头部的场景,再让我们的产品团队去做最后一公里的优化。
📝 本节摘要:
本节聚焦于Manus发布后的两大争议:邀请码机制与营销炒作质疑。
>
季超(PK)澄清了使用邀请码并非为了“饥饿营销”,而是因为Agent对算力的消耗模式(输入输出比高达100:1)导致云厂商并未准备好,甚至在发布前夕恳求他们不要放开,被迫通过物理搬运GPU来扩容。
>
针对国内“买通营销号”的指控,他情绪激动地以“死全家”发誓绝无付费推广,解释称国内的热度是意外的“出口转内销”,产品原本是为北美市场设计的。他还指出App Store上出现的Manus应用均为假冒产品。
张小珺:
说你们发布的时候的考虑吧。你知道外部对你们最大的几个质疑之一就是为什么要弄邀请码?以及是不是过度营销?
季超:
嗯,好。这两个问题我终于可以回答了。
首先我觉得邀请码这个东西是我们背(锅)了很重要的一口“黑锅”。我不是说创造了邀请码这个概念,是这样:当时我们以前不是做Chatbot嘛,Chatbot我当时讲到了它的消耗量可能是Agent这个形态消耗量的几十几百分之一。
然后当时Manus我们做完之后,我们为什么要用邀请码这个机制?且没上线前我们就决定得用这个东西。是因为我们在最后决定发布之前,我们跟所有的云厂商和我们这个Inference provider(推理供应商)聊了之后,我们惊讶的发现了一个事实:就是世界上能够在第二天立即到位的算力比(想象)中少太多了,。
所以就是当时的情况是所有我们使用的这云和模型厂商没办法提供这个。所以当时比如我们用Claude,Claude说你们千万别放开,你如果放开我们会挂。所以对我们来说,我们唯一选择方法就是去控量。
大家意识到:哦,Agent原来它这个消耗的算力这个模式跟Chatbot是不一样的。就刚才讲的这个Prefilling(预填充)跟Decoding(解码)从3比1变成比如100比1。所以逐渐逐渐就因为Manus出现,大家去适应Agent workload这样的一个工作负载。
张小珺:
所以你觉得当时是因为云厂商没有准备好?
季超:
云和模型厂商都没有准备好。当时那个情况我给你描述一下,当时比如我们跟云厂商打电话,我们说我们现在需要加到多少多少TPM。他们说没问题,你们是要下个月还是下下个月要?我们说今天下午要。然后大概这就没办法。所以真的就那头一段时间就是真的:是他们在物理层面上由于搬卡插到机柜上给我们用。然后这才让Manus撑过了第一个月。
张小珺:
炒作呢?
季超:
炒作。好,这个问题要非常郑重的回答一下。就是我可以直接这么说:如果我们在三月份发布的时候,如果有任何付费的宣传,我死全家。对,这个是我可以说到这个程度。
因为我们要这宣传有必要吗?因为我们要即做的是什么?我们要做的海外的Prosumer(专业消费者)的市场。那我们该做的是什么?应该是去让那些真正我们要用的用户去用起来。而如果我们在这个国内,比如有人觉得我们买这些自媒体,其实对我们来说没有任何的好处。
那有人就问,那这些文章到底是从哪来的?我觉得有两点回答很重要。第一点就是我们自己都觉得很酷的东西,我相信大家一定会觉得很酷,对他们来说这是一个内容,他们值得去写。第二点是什么?就是我觉得可以套用涛哥(张涛)一句话说:这是我们多年广结善缘的结果。我们都是不是第一次创业了,我们这么多年一直比较积极无私的去分享我们很多东西。那这时候他看见你的朋友在做一款产品的时候,大家就会愿意帮你一下。
张小珺:
但我觉得Manus火一天,它的热度好像迅速就降低了,你觉得为什么?
季超:
因为我们在国内没有任何持续的这个(运营)。就我们其实在国内是处于一个我们可以讲“灭火”的这样一个状态。因为我们觉得如果你把我们这个东西比如过度的比如进行一些曲解,或者对我们来说没有好处。
那在海外呢?在海外的话我觉得这个就是我们想要看到的。就当时说有人说我们在海外做营销,我拜托,Andrew Karpathy(前OpenAI/Tesla AI大神)你能买吗?这些东西你不可能买到的对吧。就是我们首先让我们的用户群就是最Pro这些人看到这个产品的价值,他们先用起来,然后他们去自上而下的去影响更多人去使用Manus。
张小珺:
你怎么看待你们为什么被骂?
季超:
哦,我觉得有几点。首先一点是我最近意识到的一个事,这是我觉得是最惨的一个点——就是很多国内用户骂我们的根本原因是:你用的根本不是Manus。
然后藉这个机会,我一定要非常非常郑重的强调一下:你在国内去App Store搜到的所有Manus都是假的。那都不是Manus,那都是来蹭我们(热度)的人。所以就是我们有一部分被骂的原因是你用的那个东西就是一个赝品。
然后另外一点其实我也能理解,就是因为一个产品如果是突然火的话,大家天然会觉得你是一个比如什么很营销或者怎么样的一个东西。但我刚才我也回应了,如果我们当时有这种行为的话,我先死全家。
这是为您整理的这份访谈的第八、第九章节。
这两章深入探讨了Manus的核心产品哲学与组织架构。第八章聚焦于“通用Agent”与“纯血派”的技术信仰,解释了为何不走垂直赛道;第九章则揭秘了Manus独特的团队分工、决策机制以及季超(PK)对于全球AI竞争格局(从CBA到NBA)的终局思考。
📝 本节摘要:
本节中,季超(PK)深度阐述了Manus的产品哲学。他认为垂直Agent本质上是在做新的“工具”(如给司机做的车),而通用Agent是在模拟一个“人”——通过标准接口(屏幕、键盘、鼠标)操作计算机来完成任务。
>
他提出了“纯血派Agent”(Pure-blood Agent)的概念,坚决反对依靠人工堆砌规则的“Agentic Workflow”。他认为只有让智能主导流程,而非依赖硬编码的SOP(标准作业程序),才能符合AI发展的“苦涩教训(The Bitter Lesson)”并触达更高的天花板。此外,他还提到了Agent的未来形态应具备“主动性(Proactiveness)”,即在用户未指令前主动创造价值。
张小珺:
为什么你们要做一个通用的Agent?按照传统的创业理念,大家可能是选中一个Niche Market(利基市场)或者找进一个垂直领域扎进去做深。
季超:
对,这是一个特别好的问题。但我有几个不同的角度的观察。首先一点是技术层面。Manus本质上是什么?它其实是一个通用的模型加上一个计算机。
我们发现其实做Agent就很有意思的一点就是:它不是在做工具。至少对于我们来说,如果你做款通用的Agent的话,你不是在做工具,你其实在做一个类似于“人”的东西。如果你做一个垂直Agent,你可能还是在做一种新的工具。
比如做垂直工具,比如说汽车公司做的是(给)司机的(工具),像Figma做的是(给)设计师的(工具)。但它其实是设计师用的一个工具。而Manus作为一个通用Agent,我甚至可以用“L”Art(此处指代一种通用艺术或技能)。因为Manus的抽象层级是什么?就是我在设计说让Agent能使用哪些工具,或者你跟外界交互的边界是什么的时候,我们一直是这样一个类比:就说我是一个人,一个普普通通的人,我能做很多事,因为我有一个电脑。
我跟电脑之间的Interface(界面)是什么?我的右手能够用鼠标,我的左手能够用键盘,我眼睛能看见屏幕上的内容,我的耳朵能听见它的声音。没了。就是一个远程工作者用这样简单的、标准的接口,其实就能完成几乎无穷无盡的种类的任务。
张小珺:
你觉得Agent最后的生态会是什么样的一个格局?
季超:
我觉得如果考虑到Agent有更多的Proactiveness(主动性)的话,那Agent网络可能会形成。……但我觉得这可能只是OpenAI的观点吧。我们可能还是从更务实的角度去出发。
我觉得Proactiveness(主动性)这个词其实是Agent这个词的本意。Agent的本意其实来自于Agency,就是能动性、主动性。但之前的话因为大家可能更关注的是一个结果的呈现,但其实现在又到了该关注Context(上下文)这个问题了。
我们觉得不应该做成像Chatbot的那样,就是它每天推很多东西,这个其实在占用用户的时间。而真正现在能够为Manus付钱、真正获得价值的用户,他其实需要生产力效率提升的。所以我们更关注的应该是如何让Agent主动去完成更多的事。
张小珺:
你之前提到你坚信“纯血派Agent”,什么叫纯血派Agent?
季超:
对,Agent这个词的定义其实是一个很含糊的事。我觉得大体上说大家会把两个概念混在一起谈:一个叫做Agentic Workflow(Agent工作流),一个叫做Agent。
这方面Anthropic有一个Blog写得特别好,就说很多人说Agent要追求一个稳定性的话,那你可能更多的是在以一个Workflow的方式去做Agent。但在我们眼中这个不叫Agent,这个就是Workflow。
而我们认为什么叫纯血的Agent?就是说它其实没有“人为加的约束”,而是说完成一个任务的所有过程和方式是由智能本身决定的。这个的话我觉得它的天花板会非常非常的高。但你跟现在此刻来对比的话,可能Agentic Workflow的可复现性会好一些。
但是我觉得这是一个可以解决的问题。所以我们非常坚持是要做纯血的、由智能主导的Agent,而不是以规则主导的Agent。Agentic Workflow这才是更符合我们刚才讲的The Bitter Lesson(苦涩的教训)的这一个事:用通用的方法、投入更大的算力去解决问题,而不是加入更多的人为的知识。
张小珺:
这在你们实际工作中有做过这样的选择吗?有舍弃过什么吗?
季超:
有,这是我们每天都要讨论的一事。比如我们要让一个Agent做数据可视化。比较简单的、纯产品驱动的做法应该是说:好,我要保证所有语言下的数据可视化的效果非常非常好。那你不能因为有不同的语言而产生比如字体乱码这些问题。那之后他可能把这块写成一个Sub-agent tool(子Agent工具),或者说写很多的单独的Prompt——就说当你要数据可视化,你要注意什么什么东西——写一大堆的Guard(守卫规则)。
你每增加一条约束,其实你都在减小模型的Diversity(多样性)。那这时候我们的做法是什么呢?其实就是我刚才讲的,我们只不过是加入了一条“查看图片”的能力。
而这样的话我们期望的是什么?是智能能够通过自己查看这张图,自己发现说:“哦,我原来有自己选择的错误,导致中文显示失败”,而去修改这张图。这样我其实解决的不只是一个问题,比如它还能检查到:“哦,不行,我画的这个图表,它其实有两个元素重叠了”,那其实能够去修复它。
所以这样的话,你应该能变成一种——不是“打地鼠”那种在堵缩的漏洞——而是变成一种你在让智能的泛化性在帮你解决更多你还未发现的问题。所以我觉得这是纯血派Agent的一个思维方式。当然,做那种直接去修补(规则)的事永远很有吸引力的,而且这更符合传统软件工程和产品经理的直觉。那这时候就是我要站出来的职责,就拦住所有人,不要这么干。
📝 本节摘要:
本节重点介绍了Manus独特的组织架构和应对全球竞争的心态。
>
1. 团队架构:Manus没有采用传统的后端研发分类,而是建立了专门的Sandbox Team(负责维护给Agent使用的操作系统,类似教不会电脑的人用电脑)和Agent Team(负责架构设计和跟进模型进步)。
2. 技术决策:为了适应模型快速迭代,团队采用“弱到强”的衡量方法——锁定Agent框架,用同家族模型的弱版本和强版本进行消融实验,确架能放大模型的进步。
3. 竞争心态:季超将这次创业比作从“CBA打到了NBA”,虽然已有一亿美元ARR,但在全球顶尖选手中仍需谦卑学习。
4. 未来展望:他认为AI行业目前更像制造业,竞争没有终点。对于2026年的展望,他预测Agent将跨越“生产力工具”的门槛,成为更多人的主力工作伙伴。
张小珺:
你们的组织有发生过变化吗?
季超:
有的。而且我觉得这个其实不仅不该说叫变化吧,就是我们也在探索一种新的(可能性)。因为其实在此之前也没有所谓真正的那种就纯粹的Agent公司。
我们现在的结构可能有几个比较特色的点。比如我们现在还是大部分都是研发,但是团队的话会比以前的这种软件开发会更奇怪一点。我们会有两个很好玩的团队:
一个团队叫做Sandbox Team,其实就是负责虚拟化跟运行环境的团队。他们要维护的是一套给Agent使用的操作系统。
然后另外还有一个我们叫做Agent Team,由Agent工程师组成。他可能负责的就是说整体架构的开发。
还有一部分是Evaluation就是评估团队。
这三部分人共同组成Agent Team,大概有十几二十个人。
我觉得Sandbox team跟Agent team可能是传统意义上来说会被融入比如广义的后端研发当中,但我们后来发现它其实比较不一样,因为它在做的事情不是面向人的,是面向模型的一个工作。
好像Sandbox团队在做的事情更像是在“教一个不会用电脑的人如何更好的用电脑”。而这个Agent team在做的事情其实是说:如何设计一套稳健但统一的架构,让我们能够持续的跟上模型的进步。
张小珺:
你们如何保证能跟上模型的进步?
季超:
我们自己有一套比较好玩的方法论,我们叫做“弱到强的衡量”。
就是你其实整个Agent中有两个重要的变量影响你的质量:一个是模型,一个是Agent框架。那这块你要做消融对比(Ablation Study)。
因为模型的未来的变化,我们要保证每一次模型迭代,我们的框架能够受益最多。那我们做法就说:我们先把一个当前版本的Agent框架进行锁死,然后呢选一个同源的模型家族——比如同样你都选择Gemini或者选择Claude——你拿它的弱版本跟它强版本进行对比,跑同样的Benchmark,然后你不断调整你的Agent框架来让它之间的Delta(增量/差值)最大。
这样的话我们能够期望就说:当下一代模型变强的时候,我的获得的增幅是最大的。这块就是我们的Agent team跟Eval team要经常关注的一个点。
张小珺:
这次创业跟你之前两次有什么不一样的地方?
季超:
我觉得首先现在创业的成本比以前还是高不少的。比如从Manus上线第一天起,那基本就是几十万美金的消耗。
然后第二点就是我觉得这是一次让我们充分的参与全球竞争的一次创业。然后我们甚至经常内部开玩笑说:有一种从CBA打到了NBA的感觉。
确实验觉可能我们之前哪怕在做Monica的阶段,经常会觉得好像我们做得还不错了。然后到现在的虽然我们就说Manus现在可能已经100个Million ARR了,但是如果你在横向看同样的这些各行各业的头部的选手的话,我们好像又不数十么。就可能这就是一个NBA的平均水平,所以就觉得还是在学习中。
张小珺:
过去一年对Red(肖弘)有什么新的认识吗?产品和技术谁的话语权更大?
季超:
我觉得比较符合预期,情绪依然很稳定。但他可能比我没有我那么没心没肺,他很多时候还是比较容易受到这些事的影响,会比较低落。
至于产品和技术,我们首先明白技术是要服务于产品的,但是技术基本对很多事有一票的否决权。比如产品可能会有一些非常诱人的“快糙猛”的做法,是否要放弃纯血Agent这个想法而采用一种比较快速的Fix?但这种情况无论是还是技术都会直接阻止这件事发生。
其实讨论的过程中没有人强势,但我们会期待Red来做一个最终的拍板。我们非常反对投票这个概念,因为我觉得投票这件事其实是在异化团队。大家如果目标是一致的话,那一定能去达成一个共识。
张小珺:
你对10年后的Agent或者AI的世界有什么想象?2026年的AI市场会有什么变化?
季超:
我不甘想象,因为我觉得我们的视野只能有三个月的视野。
如果你问2026年,我觉得一定会进一步爆发。现在AI处于的一个状态是场景大家都在挖,但其实每一个场景可能都还差一口质量的气。这一口气可能是质量决定的,是完成度决定的。
目前比如1.5之后,让我觉得最开心的一个反馈是用户觉得这个版本越过了生产力工具这条门槛。因为之前大家会觉得Agent是帮我提效,但是它不是我的主要生产要素。但现在很多用户真的就在拿Manus 1.5作为他的工作的主力应用来帮他产生收入。我觉得接着会有更多的应用迈过这条坎。
张小珺:
你觉得AI Bubble(泡沫)存在吗?
季超:
我觉得AI Bubble一定是客观存在的。但不是说因为AI是Bubble所以这波AI就没用。我觉得就是你是会有一些比如过度建设或者怎么样这个东西,但我觉得这都是在可接受的范围内。我们人类历史上干得比这个疯狂的事多了。
这是为您整理的这份访谈的第10、11章节。
这一部分进入了访谈的深水区,内容兼具对产品哲学的深刻思考与极具“反差萌”的幕后趣事。第10章探讨了Agent从“被动响应”到“主动服务”的进化,并披露了“通用Agent”这个名字背后荒诞又真实的诞生故事;第11章揭示了Manus的技术克制,包括对热门协议MCP的保守态度以及“连接者”的定位。
📝 本节摘要:
本节讨论了Agent发展的下一个阶段——主动性(Proactiveness)。季超(PK)认为目前的Agent大多還是像Chatbot一样等待指令,而真正的Agent应该具备“能动性”,例如在用户醒来前主动整理好会议记录。
>
此外,他分享了一个极具戏剧性的幕后故事:Manus被称为“通用Agent(General Agent)”并非深思熟虑的战略定位,而是因为拍摄宣传片时一位保洁阿姨突然闯入镜头,导致素材无法使用,团队被迫插入黑屏字幕来遮盖剪辑点,临时拍脑袋想出了这个名字。这一插曲解构了外界对所谓“宏大叙事”的过度解读。
张小珺:
长远来看,理想状态的Manus应该是什么样的?
季超:
其实我想回到刚才我们谈了一个问题但没说完,就是边界是什么。我们觉得接下来这三个月内,我们会关注一点:其实用户也是一种瓶颈。
现在无论Agent有多么智能,Manus跟Chatbot相比最大的变化是它输出的不简单是一段话,而是一个Action(动作)或一系列Action。但实际上它的起点到目前为止,大家看到的好像还是一个Prompt(提示词)。但实际上对于用户来说,输入Prompt是很闹心的一件事,而且它有更多的问题是很多Context(上下文)没能带入进来。
所以张涛哥的一个梦想是做一个7x24小时推理的机器。我们接下来比较投入的一个方向,也可能代表未来一段时间的Manus,就是我们在做 Proactiveness(主动性)。
这个词其实是Agent这个词的本意——Agency,就是能动性。之前大家可能更关注的是一个结果的呈现,但其实现在又到了该关注Context这个问题了。我们觉得不应该做成像Chatbot那样每天给你推很多东西,这其实在占用用户的时间。而真正现在能够为Manus付钱的用户,他其实需要生产力效率提升的。所以我们更关注的是如何让Agent主动去完成更多的事,。
张小珺:
怎么主动完成?
季超:
比如我们自己每天面试完人之后,我们可能用一些第三方的HR服务,需要去写Review(评价)。但其实我们在面试的过程中,可能用的是Notion或Granola进行记录。如果没有这套新的AI,我们就得自己基于昨天的记录去填写这些评价。
但实际上有了Proactiveness之后,Manus其实可以每天早晨在我醒来之前,先自己看我的Notion,帮我直接把记录填到HR系统里头,然后只问我接受与否。所以其实应该解放出来的是用户的这层瓶颈,让Agent的能动性逐渐发挥出来。
张小珺:
开始我觉得是你们想让大家能够更方便的去理解你们,所以你们用了一个“通用Agent”这个概念。你觉得通用Agent是长期来看最合适的描述吗?
季超:
呃,我觉得不一定。甚至说不是为了让用户更好理解。你知道我们的视频做的非常...整个工期大概就三天。
张小珺:
为什么那块有一个黑屏说“World's First General Agent(全球第一个通用Agent)”呢?
季超:
因为中间那块其实发生了一个很傻的事。当时我们是在我们办公室一楼拍的,背后一个保洁阿姨走进来了。所以我们必须在这掐一个,就是得剪一帧,得有一个黑屏。
那完了,那这就只能给一个定义了。大家一想,Manus一开始也没想好这玩意到底是这个...你在这个节点怎么定义它对吧?因为我们想的是去观察嘛,做一个达尔文式的实验。
那好,责任就到了我,因为我得写那个视频的稿。我想那这个我们管它叫什么?对,所以整个这个概念就我拍脑袋想的,然后就被大家采纳了。
张小珺:
真的是因为挡住保洁阿姨?
季超:
对。所以我觉得特别对不起大家(笑)。但我们觉得这个词其实它偏技术了,因为它来自于所谓的 General Purpose Agent。这个看上去好像是为了占一个位置设计的词,因为我都说2025年是Agent元年嘛,看上去你们想占那个最大的生态位。其实不是唯理(论)性,是因为挡住保洁阿姨。
这从市场角度来说,我觉得不是一个很好的选择。因为对于不了解技术人来说,这是什么东西?这是一个很奇怪的东西。
📝 本节摘要:
本节重点阐述了Manus的技术克制与生态哲学。季超(PK)明确表示Manus不会做“Agent OS(操作系统)”,因为这是一个尚未有资格触碰的“圣杯”。
>
他详细解释了为何Manus在技术决策上非常保守,例如拒绝盲目跟风MCP(Model Context Protocol),认为这会污染模型的动作空间。相反,Manus将自己定位为“连接者(Connector)”:不与Notion、Slack或设计软件竞争,而是通过模仿人类操作API或浏览器,将这些孤立的工具串联起来。他强调,Manus的优势在于“多做一步”,即利用通用能力将垂直工具的产出进一步整合,形成协同效应。
张小珺:
你们为什么做通用Agent而不是做一个Agent OS?
季超:
我觉得首先作为一个有职业素养的程序员,我们会尽量回避OS这个词。
这是一个圣杯,我不配。这是第一点。
第二点就是我们觉得OS这个东西其实你如果严格定义来说,它是一个中间层。但实际上我认为现在Agent还没有到这一步,就用户的文件的、软件其实不在你这。这是一个客观的现象。所以在你没有获得这些东西之前,你不要称自己为一个OS。
张小珺:
你觉得Agent最后的生态会是什么样的格局?
季超:
我觉得垂直领域的Agent最后应该是一个百花齐放的状态。但Manus作为一个通用Agent,我们有一个概念叫 Connector(连接者) 或者叫 Integration(集成)。
其实Manus之所以是一个通用Agent,他就能模仿一个人。他能模仿人使用各种的工具。
比如我们自己内部经常拿Manus调试Manus。实际上如果你是一个设计师,你其实你的工作每天也不是100%都在设计。比如你需要基于一个产品需求去做出一个设计,那你甚至也许有一个用法:你们在用Slack来讨论一个产品,你可以让Manus去帮你盯着这个Slack,然后让Manus去用设计软件去完成这个事。
所以Manus跟所有人我觉得都不是一个竞争的关系。我们是一个网络中的节点,但很多时候价值其实不是在网络节点,是在网络的边(Edge)上。
张小珺:
你过去这大半年做的最重要的几个技术决策是什么?
季超:
我觉得有几个。第一个就是我们没有盲目的去追Reasoning(推理模型)这条路。就是其实你按现在比如广义意义上的Reasoning model,你会导致Instruction Following(指令遵循)跟Hallucination(幻觉)的增加。所以我们当时做了一个比较另类的方法,有一个单独的Planning stage(规划阶段)来做的这个事。
然后还有一个比较大的一个点,是我们对于MCP(Model Context Protocol)的决策是非常保守的。
MCP出来之后,整体业界都非常High,然后很多人就开始去接。但实际上我们当时觉得这个会严重污染你的Action Space(动作空间)。而且会导致你的这个Cache(缓存)命中率下降。因为你每次去动态发现工具和卸载工具,都会导致你这个KV Cache命中率下降,而缓存命中率下降会严重影响你的成本。
所以当时我们也是花了一些精力,我们去研究了一套“不在原生Action Space内”的MCP调用方法,。
张小珺:
你有后悔的决策吗?在模型角色上。
季超:
有一点,比如一开始有点太盲信小模型。
当时的想法是,小模型跟大模型里头一部分参数量都用在了参数化的记忆或者知识上。那对于Agent来说,是不是参数化知识没有那么重要?而如果你想有足够强的工具使用能力的话,知识是可以动态弥补的。
但后来发现实验结果是不是的。我们在反思为什么,也许是因为你很难去完全分离什么是知识、什么是记忆、哪些是泛化能力、哪些是参数化的背板。后来发现这是不现实去区分的,所以大参数量还是有用,。
季超:
对于第三方Agent来说,你不用为Manus或者未来的通用Agent做任何的设计,应该是我们去适配你。Manus的选择是说:如果有MCP当然很好;如果一个程序能通过API的形式去调用,Manus可以去自己学习这个API文档;如果不计你这个服务连API都没有,那你总是给人用的吧?那你大概有个网页,那Manus会再一次降级,通过浏览器去模拟人的方式去使用这个东西。
这两章涵盖了关于公司全球化布局的争议回应、创业团队的真实工作状态,以及季超(PK)个人充满趣味的快问快答与终局思考。
📝 本节摘要:
本节季超(PK)正面回应了关于公司“跑路”的传言。他解释选择新加坡作为总部并非为了逃避,而是为了服务全球市场并满足SOC2、ISO、GDPR等严格的合规要求,这与Temu、Shein等出海企业的逻辑一致。
>
他还描述了创业团队高强度的生活状态——每天工作到晚上10点半,限制他们工作时长的唯一因素是商场WeWork的空调在那个时间点会关闭。此外,他谈到了对“AI泡沫”的看法,认为泡沫客观存在,但这在人类技术史上是常态,并不否定AI的价值。
张小珺:
新加坡的生活怎么样?便利吗?
季超:
新加坡我觉得便利度其实还是挺好的。它其实跟国内(很像),我觉得是中国团队在新加坡可以非常快的适应,没有一个非常本质的区别。而且我觉得有点无聊,这反而对创业公司来说是一个很大的加分项。
张小珺:
你建议公司第一天去新加坡吗?
季超:
我觉得这个东西其实看你的目标用户是什么。我们去新加坡的原因其实也讲过,有两点。
第一个前提就是我们团队其实可能因为管理能力比较差,我们之前在国内比如北京跟武汉两地时候,我们会觉得沟通成本很高。那我们首先有一个希望是大家能在一个地方办公。
但另外一方面,就我们既然要服务全球市场,我们其实要做很多的 Compliance(合规)方面的工作。比如像现在Manus SOC2 Type 2、ISO 27001、GDPR全都通过了。但这块你就需要——就你今天要服务哪个市场,就要需要选择一个合适的总部。
所以我觉得这都是一个很正常的一个选择吧。对于如果你要做全球市场的话,你可以早点考虑这个问题;但如果你是主要做国内市场,那肯定没有必要。
张小珺:
怎么看别人说你们“跑路”了?
季超:
我觉得跑路这个词就不对。因为我们其实一直就有新加坡这个实体,而且我们一直就做的是一个全球的市场。所以你既然你的客户在哪,你就去哪嘛。就好比像Temu跟Shein他们也没有国内的业务一样。我觉得这是中国出海企业大家都会做的一件事,只不过可能因为我们是AI公司,大家可能获得了一些额外的关注。
张小珺:
你现在工作时长是多长时间?
季超:
我现在每天大概10点半到公司,晚上干到几点就完全看情况了。
张小珺:
几点一般来说?
季超:
一般来说我们大家基本办公室人大家都会待到大概10点半后。其实这也是为什么我们选了一个在一家Mall(商场)里头的一个WeWork。
因为在Mall里头,空调会一直开到10点。10点以后就没有空调了。所以大家待多久,主要看在没空调情况下还能待多久。
张小珺:
最近有很多人开始讨论AI Bubble(AI泡沫),你怎么看?
季超:
我觉得AI Bubble一定是客观存在的。但不是说因为AI是Bubble所以这波AI就没用。我觉得就是你是会有一些比如过度建设或者怎么样这个东西,但我觉得这都是在可接受的范围内。我们人类历史上干得比这个疯狂的事多了。
📝 本节摘要:
在访谈的最终章,通过一组快问快答展示了这位首席科学家生活化的一面:他最爱的食物是Mac & Cheese(通心粉),最喜欢的地点是北京,并坚持普及“海带不是动物”这个冷知识。在推荐书籍时,他出人意料地推荐了《线条小狗》画册。
>
访谈以季超对当前AI发展最关键的信念作结:他认为AI接下来的进步,不再仅仅依赖模型或算力,而是需要用户的参与。
张小珺:
最后几个快问快答。一个全球范围内你喜欢的食物?
季超:
Mac and Cheese(芝士通心粉)。垃圾食品。
张小珺:
一个全球范围内你喜欢的地点?
季超:
北京。
张小珺:
一个少有人知道,但必须知道的知识点,可以是一个冷知识。
季超:
呃,海带不是动物。
张小珺:
是谁不知道?
季超:
啊,我周围人都不知道。因为我海鲜过敏,我经常跟大家解释海带不是动物,所以我可以吃。
张小珺:
基于所有读过的书,推荐两本必读书。
季超:
我其实平时读书特别少。我现在读《线条小狗》的画册。
张小珺:
你心目中影响AI进程的几篇论文?
季超:
第一个讲的就我刚才说那个Word2Vec那篇。然后......Flan-T5那篇。
张小珺:
基于你当下的认知,一个关键的重要的Believe(信念)是什么?
季超:
AI接下来的进步需要用户的参与。