十字路口Crossing

探秘 Claude Code,搞懂 Agent Harness|对谈来新璐

May 5, 2026·47 min
Episode Description from the Publisher

🚥 为什么说 Agent 的上限来自 Harness?当我们讨论 Harness 时,我们究竟在讨论什么?不久前,Claude Code 源代码泄露,许多 Agent Harness 的关键模块得以完整呈现,成了一份极佳的教学标本。而在技术高速变化的红利期,主动理解新技术往往能带来很高的认知增量。因此,本周「十字路口」邀请到来新璐,一起聊聊 Agent Harness。新璐是 ShareAI 开源社区发起人,他撰写维护的《Learn Claude Code》教程在 GitHub 上获得超过 50k Star。在本期内容中,我们把 Agent Harness 从概念词拆解成工程语言,介绍它的三层框架:会跑(执行层)→ 跑久(状态层)→ 跑稳(治理层)。同时,我们也梳理了 Claude Code 中值得借鉴的多个机制:更多 context、更少 control 的思路、“零上下文管理”的哲学、长程任务的接力式交接策略,以及让 Agent 越用越聪明的“做梦”式记忆维护与迭代机制等新璐作为典型的一人公司,刚完成 300 万美金融资;他也分享了自己对 OPC 的独特观点,甚至认为“未来只有 0 人公司,没有 1 人公司”,颇具启发。🎬 我们的视频播客已同步上线于 @Koji杨远骋 的视频号、小红书、哔哩哔哩、Youtube 等平台。📒 文字版已发布于 @十字路口Crossing 公众号。🟢 00:49 快问快答:年龄、毕业院校、MBTI、星座、一句话介绍公司、融资情况、团队规模、创业前经历🟢 01:52 模型以外都是 Harness机甲、大脑、机器人、智商120——Harness 到底是什么模型以外都是 HarnessAgent 上限由 Harness 决定吗?模型智商已在 120–170 之间;Agent Harness 像机甲——不提升智力,但极大扩展能力🟢 02:47 GitHub 50k star,是怎么来的?这个Agent教程,其实不只是写给别人看的——它本来是新璐自己整理的"造 Agent 心法"。9 个月前动笔,出发点是"把 Claude Code 套网页壳就能得到一个强大 Agent 产品"的简单直觉开源社区当时流行 LangChain、LangGraph等 prompt pipeline 做法开发“伪Agent”,是一场派系之争——"Prompt Flow-Driven vs Agent Native-Driven"LangChain 过时了吗?🟢 04:02 Bash is all you needClaude 推出 Manager Agents 之后,大家还需要自己搭 Harness 吗?就像 Next.js出现后大家不再关心底层运行原理,两三年后 Agent Harness 也会收敛为开箱即用但现在是技术周期红利窗口——不懂 Agent Harness,做出来的Agent产品"缺乏灵魂"今天的 PM 和过去的 PM,指的根本不是同一种人🟢 07:04 Harness 三层拆解用两周时间、多 Agent 协作,从零写出一个 C 编译器——这个经典案例背后,到底走了哪三层?第一层:执行能力层 ——文件增删读写、浏览器、语言解释器;配错权限后果是什么?第二层:上下文与状态层 ——system prompt、skills、memory,以及上下文窗口满了之后 Agent 如何"接力交棒"第三层:治理与编排层 —— 数百上千 Agents 如何组织协作?测试 Agent 为什么不能同时拥有修改代码的权限?🟢 12:05 KB 的 K 系列Agent工具链他们公司叫 Komputer Blue,代号KB,目标是构建By Agents & For Agents的整套开源InfraKomputer:用 TypeScript 重写 Unix 文件系统和 bash,给 Agent 一个"熟悉的生活环境";支持 WebAssembly 时切换WASM实现;Kruntime:Agent Runtime 层,提供让人类开发 Agent 的接口,以及Agent 派生 Agent的接口Kwatch:Agent 观测层,分析 Agent 任务在哪里卡住,反向指导 Agent 设计迭代Krl:把 Agent 在 Runtime 上沉淀的轨迹数据拿来强化学习或做上下文层的自迭代🟢 13:55 vs. AWS AgentCore、阿里云 AgentBay云服务厂商当然也想做这一层K 系列 Agent 工具链的核心理念:在离用户更近的场景运行 Agent,任何能跑 JavaScript 的场景都能用——浏览器、插件、App、Electron、小程序、纯静态网页、全栈 SaaS差异化:把Claw-Agent的运行时轻量到由纯数据结构模拟的 KB 级Unix虚拟计算机环境,而不是把 Linux 和浏览器全塞进去新璐认为要让 Agent 工作好的方法是给每个 Agent 一台专用计算机,一般通过虚机提供,但大多 Agent 完成的大部分工作不需要真的 Linux虚机(且成本高昂),像编译器、浏览器这类重工具原本就不该放进给每个 Agent 的虚机环境🟢 17:38 Memory 的流派完全结构化(知识图谱 + 向量搜索):精细存储的知识结构,支持 pipeline 知识推理,rule-based,新璐不喜欢半结构化(Unix Files + Markdown + Agent 驱动更新):Claude Code 和小龙虾都是这样做的;Claude Code 中的 auto-dream 机制:每隔一天触发后台 Agent 对最近会话做"重放",纠错、合并、更新记忆——就像做梦模型内化 —— 距真正生产落地还需要~ 3 年时间,且记忆难批量提取 & 无损转移,容易被单边模型提供商绑定🟢 22:49 共识与非共识共识:CLI is all you need——"Bash is all you need" 这句话是新璐 9 个月前写在开源仓库里的标语,现在成了行业共识非共识:大部分23年 ~ 25年诞生的主流开源 Agent 框架仍在用 PromptPipe + Node Graph的老路线 —— 就像齿轮与传送带编织的流水线Unix 从 1971 年就存在,LLM预训练语料中 Linux 命令有数十亿条sample;MCP 提出才两年,预训练占比不到 0.1%——这解释了为什么 CLI 工具的任务完成率比 MCP 高,并且 shell 具备对CLI命令的可组合性 & 二次编程空间🟢 26:33 Claude Code 源码泄露:最大的惊喜是什么

Podzilla Summary coming soon

Sign up to get notified when the full AI-powered summary is ready.

Get Free Summaries →

Free forever for up to 3 podcasts. No credit card required.

Listen to This Episode

Get summaries like this every morning.

Free AI-powered recaps of 十字路口Crossing and your other favorite podcasts, delivered to your inbox.

Get Free Summaries →

Free forever for up to 3 podcasts. No credit card required.