一句话总结
这期播客是AI公司Manus联合创始人季超(Peak)在被Meta收购前的最后一次深度访谈,复盘了从浏览器插件Monica到通用AI智能体Manus的创业历程,揭示了产品决策背后的技术思考、市场判断与团队协作逻辑。
核心观点
-
AI应用创业应避免过早的垂直整合,优先追求产品迭代速度
[29:13]季超基于上一段创业(Maggie)的教训,认为在技术快速迭代期,自研模型会严重拖慢产品节奏;正确的路径是先用外部最好模型验证PMF,待产品稳定后再考虑模型优化。 -
“通用智能体”的核心优势在于能力间的网络效应与场景延展性
[102:00]Manus选择做通用而非垂直智能体,因为其统一架构能让不同能力(如研究、编程、设计)相互增强,从而在任一垂直任务上都能“多做一步”,服务更广泛的高价值脑力工作者。 -
当前大模型主要为聊天场景优化,与智能体任务的需求存在根本错位
[85:00]聊天模型倾向于单轮完整回答,而智能体需要多轮、异步、基于环境反馈的“反应式”思考;模型缺乏对长上下文的压缩意识、错误恢复能力和进行“交错式思考”的耐心。 -
拥有正向现金流的成熟产品,是进行高风险、高成本创新探索的底气
[70:00]母公司旗下产品Monica的稳定盈利,让Manus团队在探索浏览器和后来的通用智能体时,能保持“既大胆又理智”的决策心态,敢于放弃不靠谱的项目。 -
AI时代的创业更像制造业,对经营和成本控制的要求远高于移动互联网时代
[38:00]由于AI推理成本随用户量线性增长,且竞争反应速度极快,创始人需要极度理性、尊重常识和具备精细运营能力,“艺术家”型创始人更容易失败。
多维度洞察
🧩 产品经理视角
洞察:浏览器插件是观察AI真实使用场景的绝佳“画布” [33:00]
“浏览器插件的绝妙之处是什么?它的功能的分发其实是基于context的…它其实消解了功能增加带来的复杂度爆炸问题。所以我觉得浏览器插件是一个绝妙的观察用户到底在怎么用AI的一个窗口。”
解读:Monica作为浏览器插件,能无侵入地观察用户在真实工作流(如Gmail, YouTube)中如何自然地调用AI,这种无偏观测为后续产品方向提供了关键数据支撑。
洞察:定义“好”的标准是产品最深的护城河 [48:00]
“大家常說品味,我覺得該怎麼體現出來呢?品味可能體現在你的evaluation或者你內部的benchmark上…甚至我覺得這可能是創業公司…所有AI公司唯一的護城河。”
解读:无论是模型还是产品,团队内部选择的评估指标(Benchmark)决定了迭代方向和最终品质。Manus非常看重用户主观评分和真实任务完成度,而非单纯的自动化测试分数。
🚀 创业者视角
洞察:连续创业者的核心价值是“知道不做什么” [78:00]
“我覺得不做什麼真的特別重要…AI時代大家好像眼中的機會很多,AI又充分解放了生產力,所以我觉得每天都要回答就是不做什么。”
解读:AI能力泛化导致机会看似无穷,但资源有限。Manus团队从放弃AI浏览器到谨慎增加功能,都体现了基于经验和数据的克制,避免陷入功能膨胀和自证循环。
洞察:CEO与CTO的互补是健康创业公司的关键 [30:00]
“我既不喜歡商業化我也很討厭管人…我有的時候會陷入一種特別追求正道的思路…我需要有一個人把我給管住,就是在我又想發癲的時候給我摁死。”
解读:季超自认不适合做CEO,而擅长产品与商业的CEO萧红(Red)和擅长技术的他形成了有效制衡。这种基于自我认知的团队搭建,避免了单一视角的决策风险。
洞察:发布时的“邀请码”机制是应对云基础设施不足的无奈之举 [134:00]
“世界上能够在第二天立即到位的算力比想象中少太多了…所有我们使用的这些云和模型厂商没法提供这个量…我们唯一选择方法就是去控量。”
解读:Manus初期采用邀请码,并非营销策略,而是因为智能体的工作负载(输入输出token比例10:1)与聊天机器人不同,云厂商当时没有准备好相应的算力储备。
💰 投资人视角
洞察:大模型公司与应用公司的界限将迅速模糊,最终是应用之争 [46:00]
“如果最后不再分大模型公司跟应用公司的话…做出一款好的应用且被大家喜欢的应用其实比做出一款够好的模型难得多…到最后其實會變成一個應用之爭,然後每個應用背後會綁一些模型。”
解读:模型能力会快速扩散,但构建优秀应用需要深刻理解用户、工作流和生态。拥有独特数据飞轮和用户反馈的应用公司,在长期竞争中可能更具优势。
洞察:AI应用的数据飞轮价值独特,且留存于应用层 [94:00]
“对于agent这种特别长链路跟环境强相关的场景下,其实用户是非常关键的。但是用户的使用轨迹以及feedback是留存于应用层而不是流动到模型层的。”
解读:智能体在执行复杂任务时产生的成功与失败轨迹,是优化其表现的关键数据。这些数据沉淀在应用公司手中,能形成模型公司难以复制的迭代优势。
洞察:评估智能体的终极指标应是“经济价值替代率” [108:00]
“对于通用agent的衡量指标就是它能完成多少远程工作者能够完成的事…虽然我们现在只有2.5%在Benchmark上,但是那是不是说我们也许能够去让全世界2.5%的GDP获得加速。”
解读:像Scale AI的RLI(远程劳动力指标)这类基准,衡量的是AI完成的工作是否能让真实客户付费且无法区分是人还是AI完成的。这直接指向了AI创造经济价值的核心。
反常识 & 认知挑战
反直觉结论:更长的上下文(Context Window)可能不如让模型学会“压缩意识”重要 [86:00]
“比起更长的context,我觉得更重要的应该是让模型具备compression awareness…让模型知道说我现在context已经很长了,我看看我能不能把我一些context中的信息去offload(外化)到比如文件系统中。”
⚡ 主流观点:追求更长的上下文窗口(如100万tokens)是提升模型能力的关键。这里不同:无限拉长上下文效率低下,应让模型学会主动将信息压缩、外存并知道何时取回,这需要专门的训练,且对智能体场景更实用。
反直觉结论:为追求“推理能力”而训练的模型,可能不利于智能体任务 [88:00]
“如果你直接把一个为了就是解决竞赛编程或者数学而设计的reasoning model平移到agent场景下之后,你会发现其实效果是下降的…它的instruction following能力其实下降,幻觉和胡乱调用工具的概率提升。”
⚡ 主流观点:更强的推理能力(如O1系列模型)对任何复杂任务都有益。这里不同:纯数学/编程推理的训练目标与智能体所需的多轮、工具集成交互模式不匹配,可能导致其遵循指令能力下降,在真实环境中表现反而更差。
可执行的行动清单
- 审视产品决策的“可逆性”:在资源投入前,先判断这是“双向门”还是“单向门”决策。对于高风险、难掉头的技术投入(如自研大模型),在早期应极度谨慎。
[66:00] - 建立产品独特的评估体系:不要盲目追随学术界的Benchmark。定义一套贴合自己用户真实满意度(如五星评分、任务完成度)的核心指标,并以此驱动迭代。
[105:00] - 为“不做”和“删除”功能设立机制:定期回顾产品功能,思考哪些可以删减或合并。警惕“每增加一个东西都会稀释所有价值”的复杂性陷阱。
[78:00] - 在团队中明确“BDFL”(仁慈的独裁者)领域:在目标(Goal)、优先级(Priority)、方案(Alternative)的不同决策阶段,采用专制、民主等混合模式,明确谁在何时拥有最终拍板权,避免议而不决。
[57:00]
延伸思考
- 通用智能体的“主动性”边界在哪里? 季超提到Manus正在探索让智能体主动工作(如自动整理会议记录),这如何在提升效率与避免打扰用户、甚至引发隐私担忧之间取得平衡?
[124:00] - 当所有操作系统都内置智能体能力后,独立的“智能体OS”或超级应用还有生存空间吗? 像Manus这样的第三方通用智能体,与微软、谷歌等巨头将Agentic能力深度融入其生态的战略,长期是共生还是竞争关系?
[115:00] - “纯血派”智能体(由智能主导)与“工作流”智能体(由规则主导)的路线之争,最终会收敛还是分化? 在追求稳定可靠的企业级场景下,哪种路径更能率先实现大规模商业化落地?
[166:00]
和 AI 深入讨论
讨论始于播客中Manus创始人Peak的观点,他认为垂直Agent的创业路径价值有限,更像"工具"而非"模拟一个人" [29:13]。其核心论据是:垂直场景用户心智建立难、技术护城河浅(依赖通用基座模型)、价值天花板低。
AI在此基础上进行了反向论证,指出垂类Agent的真正价值可能在于:
- 深度集成与工作流:嵌入特定行业的软件生态、数据格式和审批流程,工程复杂度高
- 领域知识库与数据飞轮:用私有数据持续微调,形成独特能力
- 降低门槛与建立信任:在高风险领域(金融、医疗)通过可解释性和审计建立信任
- 监管与合规壁垒
讨论的焦点在于,创业公司应选择Peak倡导的"通用Agent,模拟人"路径,还是死磕"功能聚焦但极度可靠、深度集成"的垂直工具路径。后者虽然看似局限,但在专业领域,深度、可靠性和信任远比"通用性"重要,许多成功的垂直SaaS公司已证明了这一点。
针对用户关于垂类Agent核心价值(集成、数据)可能被Skill或插件生态替代的尖锐质疑,讨论深入分析了"被取代"假设的局限性。
技术上,Skill提供的是标准化接口,但真正的"深度集成"涉及大量非标准化适配、跨系统状态管理与业务逻辑编码,这本质上是服务而非可轻松打包的产品。Peak在 [119:33] 提到通用Agent作为"调度层"可灵活组合最优解,但垂直领域往往需要确定性的规则而非模型的自由发挥 [185:30]。
数据方面,高质量、实时产生的私有数据及由此形成的数据飞轮仍是核心壁垒,如同Bloomberg的独家数据生态难以复制。
因此,垂类Agent的价值正在转移:
- 成为**"领域操作系统"**,封装复杂异构系统
- 成为**"合规与信任的载体"**
- 成为以编排为核心的**"工作流自动化平台"**
其胜负手应从"比拼模型能力"转向"比拼领域深耕、工程化和建立信任的能力"。
在Crypto这个数据公开透明的领域,CEX Agent的"深度集成"内涵已发生根本变化。结合播客中Peak强调的 "环境"比"模型"更重要 [55:55] 以及 "原子能力的网络效应" [151:55] 概念,这种集成体现在四个核心层面,构成了评估其Know-How的维度:
- 安全与风控系统集成:实时风险敞口计算、用户行为基线监控、细粒度权限管理,这是生命线
- 订单执行与流动性系统集成:对高级订单类型、智能路由、拆单算法的深度理解,以优化执行性能
- 合规与审计系统集成:实时合规检查、全链路审计溯源,满足金融级监管要求
- 用户资产与账户体系集成:提供跨业务线资产视图和一站式金融操作
评估时需关注团队是否理解私有数据流、内部系统接口、复杂规则引擎及跨部门协作流程,而非仅停留在调用公开API。这种集成创造的是一个 "在严苛规则下实现最优执行的专用智能" 环境,其形态更接近受控的自动化云服务。
讨论切换至用户视角,指出Agent的核心价值在于成为 "一个不知疲倦、绝对服从、且拥有交易所内部超能力的专属交易员"。其颠覆性价值分三层:
- 解放注意力与情绪:用户从"手动操作者"变为"策略指挥官",用自然语言下达指令,由Agent 7x24小时严格执行,克服人性弱点
- 获得机构级能力:借助深度集成,Agent能为用户争取最优执行滑点、进行复杂的组合管理与风险管理,实现公平性跃升
- 实现跨域复杂工作流自动化:执行以前难以手动完成的策略(如结合舆情监控、链上数据和交易执行)
对用户而言,这是从"我操作"到"我下令"的能力质变。
然而,用户会质疑信任问题(为何将资产交给AI)和替代方案(为何不用现有脚本或机器人)。这正是深度集成的意义所在:通过与CEX的深度绑定,提供更高的安全背书、更可靠的执行和更丰富的内部功能,以此建立信任和性能优势。
针对直接向用户收费(为盈利或省心付费)模式中权责不清、价值难量化的矛盾,提出的"开放平台"思路极具战略意义。这本质上是将"深度集成"的Know-How产品化为一个面向开发者和策略创建者的API、SDK与运行时环境,从"卖产品"转向"建生态"。
优势:商业模式清晰(收取API调用费、资源费或分成),责任边界明确(平台只对执行环境负责),并能利用独家集成优势构建极高竞争壁垒,激发生态创新。
劣势与挑战:需要培育生态(解决鸡生蛋问题)、承担平台安全责任、面临极高的技术复杂度与监管压力(需建立策略审核与行为监控机制)。
此模式与播客中Peak所言"价值在网络边上" [179:00] 的观点共鸣,交易所旨在构建以自己为核心的专属高价值Agent生态网络。
⚡ 反向论证 此模式最大风险是 “为他人做嫁衣” ,顶尖开发者可能将验证后的策略迁移至更中立、更跨平台的通用框架以获取更大市场。成功关键在于能否通过独家数据、更低延迟、更优执行成本等硬优势绑定顶级开发者。
这一思路跳出了收费思维,直击交易所核心商业模式,将Agent作为 "零边际成本的增值服务" 来换取平台总交易量、手续费收入和用户资产沉淀。
其核心逻辑是从"工具收费"变为"生态补贴":免费提供最强工具(依赖深度集成实现的闭环环境),但规定所有交易必须在自家交易所完成,形成坚固的"生态锁"。可行性极高,优势是降维打击:对用户吸引力巨大;对交易所能带来增量交易、提升用户粘性、吸引专业用户并形成数据飞轮。
然而,面临严峻挑战:
- 成本与规模经济学:需计算激增的云计算成本能否被额外手续费覆盖
- "羊毛党"与资源滥用:需设计防滥用机制
- 生态治理复杂性:需应对Agent策略共振引发的系统性风险、恶意策略及潜在的责任界定难题
- 监管关注:可能被视为鼓励投机
⚡ 反向论证 该模式成功的前提是交易所自身基本盘必须足够稳固(交易深度、币种、体验)。如果缺乏竞争力,免费Agent可能仅沦为“测试场”,策略成熟后用户和资产仍会流向主流交易所。因此,这本质上是一场战略豪赌,需精确计算投入产出比,并决策优先吸引小白用户还是专业开发者来塑造生态基因。
公开讨论区
每位访客可提问一次,AI 回答后对所有人可见