[{"data":1,"prerenderedAt":380},["ShallowReactive",2],{"blog-post-/zh/blogs/ai-became-my-operating-system":3},{"id":4,"title":5,"body":6,"description":362,"extension":363,"meta":364,"navigation":375,"ogImage":366,"path":376,"seo":377,"stem":378,"__hash__":379},"zh/blogs/zh/26.ai-became-my-operating-system.md","在去加州的特斯拉上，我把工作交给了 Codex",{"type":7,"value":8,"toc":352},"minimal",[9,13,16,19,22,25,28,31,34,37,40,47,51,54,57,60,63,66,72,75,98,101,104,108,111,119,125,128,131,134,137,140,146,149,152,155,161,164,167,170,174,177,180,183,186,189,192,198,201,204,208,211,214,217,220,223,226,229,232,235,238,241,247,250,253,256,259,262,265,268,271,274,277,280,283,286,289,292,295,298,301,304,307,313,316,319,322,325,328,331,334,337,340,343,346,349],[10,11,12],"p",{},"特斯拉自动驾驶载着我们一家去加州的路上，我打开手机上的 Codex，对着它说了一句话：",[10,14,15],{},"去我的 Notion task tracker 里，处理那个博客分析 task，用 Superpowers skill 执行。",[10,17,18],{},"我不在书桌前，也不在 IDE 里。我和家人在路上，看着车窗外的风景往后退。与此同时，另一个 thread 里，Claude Code 刚刚完成了我最新的开发任务，前后大概跑了 1.5 小时。",[10,20,21],{},"有些工作在我的机器上跑。有些工作在云端环境里跑。有些 agent 在读本地文件，有些在查 docs、API 和网页。有些在写 plan、改代码、生成内容，或者把前一次运行的结果沉淀成下一次 workflow 的反馈。",[10,23,24],{},"这听起来像未来工作的 demo。",[10,26,27],{},"但不是。这已经是我现在工作的样子。",[10,29,30],{},"过去两个月，Claude Code 和 Codex 改变的不只是我的编程方式。它们改变了我和“工作”之间的接口。最开始我还是主要用它们写代码，因为编程是最自然的入口。但很快，同样的模式从 IDE 里跑了出来，进入写作、图片生成、视频制作、数据分析、行政任务、Notion task、scheduled jobs，以及我管理日常的方式。",[10,32,33],{},"最大的生产力变化，不是 AI 让我把每个任务做快一点。",[10,35,36],{},"更大的变化是：工作的基本单位变了。过去是“我完成一个任务”。现在越来越像是“我设计一个可以执行、汇报、学习的工作系统”。",[10,38,39],{},"这就是 AI 从工具变成个人操作系统的那个时刻。",[10,41,42],{},[43,44],"img",{"alt":45,"src":46},"从单一 AI 工具到分层 AI 操作系统的对比图","/blogs-img/2026-06-20-ai-os-01.webp",[48,49,50],"h2",{"id":50},"编程是第一个入口",[10,52,53],{},"编程最先让我感受到这个变化，因为软件开发天然适合 agent 工作：有文件、有 spec、有测试、有 diff、有 branch、有日志、有可以 review 的 artifact。",[10,55,56],{},"现在我用 Claude Code 或 Codex，很少只是让它写一小段代码。我更常做的是给它一个工作目标：读这个 repo，理解现有模式，写 plan，实现改动，跑检查，告诉我改了什么。如果任务变得模糊或者风险太高，就停下来。",[10,58,59],{},"最近一个例子是 Excel add-in 的 UI 升级。这个任务不是简单的“把界面弄漂亮一点”。它涉及把 web app 的设计系统迁移到 add-in panel，port design tokens，重做 chat panel 的视觉，改善 first-run state，整理 settings，统一 login，调整 ribbon 分组，打包资产，还要保留 benchmark gate。",[10,61,62],{},"这不是一个 prompt 能解决的任务。",[10,64,65],{},"它是一次 run。",[10,67,68],{},[43,69],{"alt":70,"src":71},"一次长时间编程任务被展示成带有 review gates 的 agent 执行轨道","/blogs-img/2026-06-20-ai-os-02.webp",[10,73,74],{},"一次 run 有持续时间，有上下文，会接触文件，会产生中间假设。它可能先阅读，再计划，再编辑，再测试，再修正。等它完成时，我关心的不只是最后回答听起来好不好。我关心它改了什么、有什么证据、跳过了什么、哪里还需要我的判断。",[10,76,77,78,85,86,91,92,97],{},"这也是为什么 ",[79,80,84],"a",{"href":81,"rel":82},"https://docs.anthropic.com/en/docs/claude-code/overview",[83],"nofollow","Claude Code 文档"," 会强调 long-running tasks、parallel work、browser 和 iOS 访问，以及“任务完成后再回来检查”。Anthropic 也写过 ",[79,87,90],{"href":88,"rel":89},"https://www.anthropic.com/news/enabling-claude-code-to-work-more-autonomously",[83],"subagents、hooks、background tasks"," 如何让 Claude Code 更自主地工作。OpenAI 也把 Codex 描述成一个 agentic coding 的 command center，并且支持通过 ",[79,93,96],{"href":94,"rel":95},"https://openai.com/index/work-with-codex-from-anywhere/",[83],"mobile app 监控、引导、批准跨设备任务","。",[10,99,100],{},"产品方向和我的实际体验是一致的：接口正在从“和模型聊天”转向“管理 agent 工作”。",[10,102,103],{},"我的角色也因此变了。我仍然需要懂代码，仍然需要 review，仍然需要审美、标准和风险判断。但我不再总是那个敲下每一行代码的人。更多时候，我是在设计工作可以在什么条件下离开我继续往前走。",[48,105,107],{"id":106},"然后这个模式跑出了-ide","然后这个模式跑出了 IDE",[10,109,110],{},"当这个模式在编程里跑通之后，我开始在所有地方看到同样的结构。",[10,112,113,114,118],{},"我的博客 workflow 已经不只是“写一篇文章”。它是一条 pipeline。一个粗糙想法先变成 ",[115,116,117],"code",{},"idea.md","，再变成 researched content plan，再变成写作 outline。然后生成英文文章、中文版本、X post、standalone tweet、newsletter teaser、YouTube script 和 metadata。后面还可以继续进入配图和视频流程。",[10,120,121],{},[43,122],{"alt":123,"src":124},"AI 工作从编程扩展到写作、视频、数据分析、行政任务和日常管理","/blogs-img/2026-06-20-ai-os-03.webp",[10,126,127],{},"这表面上是内容生产，但更深层是 workflow design。每一步都有自己的 contract。brainstorm skill 应该输出 content plan，而不是正文。outline skill 应该输出文章结构，而不是社交媒体文案。writing skill 应该产出完整 package，并且在交给下游之前做 depth check。publishing skill 应该检查 taxonomy 和 growth tracking。",[10,129,130],{},"视频也是一样。",[10,132,133],{},"我最近做了一个 Seedance video lab。第一步很克制：验证火山方舟 Ark 中国区 endpoint 能不能提交 Seedance 2.0 任务，异步轮询，下载 MP4，并估算成本。那个 smoke test 是 4 秒、480p、9:16、无音频、无水印，大概 1.85 RMB。",[10,135,136],{},"然后 workflow 开始长大。我们生成 storyboard-grid 首帧，把它们交给 Seedance，产出 15 秒竖屏有声视频，同步到 iCloud，检查媒体参数，生成 contact sheet，再写 critique 和 lessons。后来其中一个方向又变成了一分钟的 prototype。",[10,138,139],{},"重点不是 AI 生成了视频。重点是视频系统开始“记住发生了什么”。它保存 prompt、request、summary、output、critique、next variations。这个差别很大：一个是在玩模型，一个是在搭创作机器。",[10,141,142],{},[43,143],{"alt":144,"src":145},"一个创作视频实验室的 contact sheet，展示 prompt、生成画面、critique 和下一轮变化","/blogs-img/2026-06-20-ai-os-04.webp",[10,147,148],{},"Notion 里也是同样的模式。",[10,150,151],{},"Notion 很适合作为任务入口。我有一个 task tracker，里面有 blog、Aaron Studio、VGPT、self-improvement 等 project。里面有像“video lab 的搭建”、“aaronguo.com 的 self-enhancement 学习”、“Excel UI 升级”、“如何构架一个可以自我学习的系统”这样的任务。",[10,153,154],{},"但真实情况是，Notion 不是整个系统。很多 Notion 页面只是任务外壳。真正的执行记忆分布在 repo、docs、spec、plan、metrics、生成资产和 agent sessions 里。Notion 是 dispatch layer，工作记忆是分布式的。",[10,156,157],{},[43,158],{"alt":159,"src":160},"Notion 作为任务外壳，下方连接分布式工作记忆的分层架构图","/blogs-img/2026-06-20-ai-os-05.webp",[10,162,163],{},"所以我觉得“个人操作系统”比“任务管理器”更准确。",[10,165,166],{},"任务管理器保存要做什么。操作系统把意图路由到执行，给 process 分配资源，维护状态，记录发生过什么，并决定下一步谁获得控制权。",[10,168,169],{},"这更接近我现在的 AI 工作方式。",[48,171,173],{"id":172},"新的循环intentskillrunreviewmemory","新的循环：intent、skill、run、review、memory",[10,175,176],{},"我现在的工作模型可以简化成五个部分。",[10,178,179],{},"第一，intent。我定义结果，而不是每一步。“改善这个 UI。”“分析博客。”“写这篇文章。”“生成一个视频概念。”“把这个想法变成内容 package。”intent 的质量很重要，因为模糊的 delegation 会更快地产生模糊的结果。",[10,181,182],{},"第二，skill。我把任务路由进一个可复用 workflow。Superpowers 的价值在于规范工作流程：先澄清，再规划，必要时 dispatch subagents，完成前验证证据，并且留下下一次 run 可以复用的 artifact。",[10,184,185],{},"第三，run。agent 开始读、查、改、生成、调用工具，或者回来要更多上下文。有些 run 几分钟，有些一两个小时。有些会涉及 background process、dev server、外部 API，甚至多个 agent 并行工作。",[10,187,188],{},"第四，review。我检查输出，也检查证据。它改了什么？用了哪些来源？碰了哪些文件？跑了哪些测试？做了哪些假设？它有没有在应该停下来的地方停下来？",[10,190,191],{},"第五，memory。结果应该让系统学到东西。博客文章应该产生指标。视频实验应该留下 critique。失败的 scheduled job 应该变成 setup lesson。好的 workflow 应该变成更好的 skill。",[10,193,194],{},[43,195],{"alt":196,"src":197},"intent、skill、agent run、review gate 和 memory 组成的五段循环","/blogs-img/2026-06-20-ai-os-06.webp",[10,199,200],{},"这就是“AI 帮了我一下”和“AI 改变了我的工作方式”的区别。",[10,202,203],{},"一次性的帮助当然有用，但很难复利。工作系统会复利，因为每一次 run 都能留下结构：更好的 prompt、更好的测试、更好的 checklist、更好的指标、更好的默认设置、更清楚的下一步。",[48,205,207],{"id":206},"self-enhancement-是下一层","Self-enhancement 是下一层",[10,209,210],{},"这是我现在最感兴趣的部分。",[10,212,213],{},"我不想要一个只会帮我生成更多东西的 AI 系统。我想要一个能从生成结果里学习的系统。",[10,215,216],{},"博客是第一个真实例子。我们现在有了 blog growth model，把网站当成一个 content product，而不是一堆 markdown 文件。这个循环很简单：",[10,218,219],{},"发布内容。分发内容。抓取指标。计算质量加权的 reward score。做 postmortem 和 weekly review。把学习结果反馈到选题、写作、视觉、视频和分发 workflow 里。",[10,221,222],{},"第一版刻意没有做成完整的 reinforcement learning 系统。它更实际：扫描 content，写入 Turso，读取 Rybbit 指标，跟踪 pageviews、unique visitors、scroll depth、outbound clicks 和 UTM 分发链接。它让每篇文章发布后都可以回答更好的问题：",[10,224,225],{},"读者真的读了吗？",[10,227,228],{},"他们有没有 scroll？",[10,230,231],{},"哪个渠道把他们带过来？",[10,233,234],{},"哪些 topic 带来的不是浅层流量，而是 engaged audience？",[10,236,237],{},"哪个 hook 把注意力转成了阅读深度？",[10,239,240],{},"价值不在 dashboard 本身。价值在于下一篇文章不必完全凭感觉开始。",[10,242,243],{},[43,244],{"alt":245,"src":246},"博客增长反馈循环，把分发指标转化成下一篇内容计划","/blogs-img/2026-06-20-ai-os-07.webp",[10,248,249],{},"这才是 AI 对个人生产力真正有意思的地方。大多数 productivity tools 帮你 capture tasks。有些帮你 automate tasks。但很少有工具能帮你从工作结果中学习，并改变下一次 run。",[10,251,252],{},"AI agents 可以补这个空缺。",[10,254,255],{},"系统可以读指标，可以比较文章，可以更新 content plan，可以提出更锋利的 hook，可以发现实用 AI explainer 比空泛反思更有效，可以记住某次视频实验里 storyboard-grid 更容易筛出 winner，然后把这些记忆变成下一次 workflow 的默认动作。",[10,257,258],{},"这不是魔法，也不是科幻意义上的“AI 自我进化”。它只是一个有更好记忆力的人类-agent feedback loop。",[10,260,261],{},"但这已经足够重要。",[48,263,264],{"id":264},"人的角色变得更重要了",[10,266,267],{},"一个很合理的反对意见是：这听起来像更多工具、更多 dashboard、更多自动化，也可能只是另一种逃避真正工作的方式。",[10,269,270],{},"这个风险是真的。",[10,272,273],{},"AI operating system 也可能变成迷宫。它可能制造一种“事情都在推进”的感觉，但其实没有方向。它可能产生比任何人有时间 review 的 artifact 还多。它可能让薄弱判断变得更危险，因为薄弱判断现在有了更大的杠杆。",[10,275,276],{},"所以我不认为 AI 会降低人的重要性。它会提高人的重要性。",[10,278,279],{},"当执行很贵的时候，瓶颈通常是把事情做完。当执行变便宜，瓶颈就会上移：决定什么重要、设定标准、选择不做什么、知道什么时候停止，以及有足够的 taste 去拒绝那些看起来 polished 但其实错误的输出。",[10,281,282],{},"过去，错误 delegation 可能浪费一个下午。现在，错误 delegation 可以浪费算力，产生错误 branch，发布平庸内容，或者把 noisy memory 塞进系统。",[10,284,285],{},"所以 operator skill 变了。",[10,287,288],{},"最好的 AI 用户不是最会写 clever prompt 的人，而是能设计工作系统的人：让低判断力部分离开自己也能推进，让高判断力部分必须回到自己这里 review。",[10,290,291],{},"这意味着 constraints、permissions、checkpoints、evidence、rollback paths、quality gates。也意味着 taste。",[10,293,294],{},"agent 越强，我越不想把它当成魔法盒子。我希望它在一个行为足够可观察、边界足够清晰、结果可以修复的系统里工作。",[48,296,297],{"id":297},"目的不是永远工作",[10,299,300],{},"这里还有另一个陷阱。",[10,302,303],{},"如果 AI 帮我省出了时间，最糟糕的用法就是立刻把每一分钟都填满更多低质量工作。",[10,305,306],{},"杠杆的目的不是把人变成机器，而是让生活变大。",[10,308,309],{},[43,310],{"alt":311,"src":312},"一个安静的家庭公路旅行场景，AI 任务路线退到背景里","/blogs-img/2026-06-20-ai-os-08.webp",[10,314,315],{},"如果 agent 可以在我旅行时 research，我就可以陪家人。如果 background job 可以抓取博客指标，我就可以去运动。如果写作 workflow 可以把一个粗糙想法变成结构化 plan，我就可以把更多时间花在阅读、思考和与人交流上。如果视频 workflow 降低了实验成本，我就能探索以前不现实的创作方向。",[10,317,318],{},"这才是我真正想守住的部分。",[10,320,321],{},"AI productivity 经常被讲成一场竞赛：做更多、发布更多、自动化更多、超过别人。这里面有一部分是真的。杠杆当然重要。但更人性的理解是：AI 可以降低足够多的摩擦，让个人和小团队去尝试以前只有组织才能尝试的事。",[10,323,324],{},"这个世界还有太多问题没有被解决。太多想法没有被做出来，只是因为执行成本太高。太多人把最好的时间花在协调、格式调整、搜索、复制和行政摩擦上。",[10,326,327],{},"AI agents 不会替我们解决 judgment，不会替我们解决 taste，不会替我们解决 courage，也不会替我们定义什么是好生活。",[10,329,330],{},"但它们可以给我们更多空间去练习这些东西。",[10,332,333],{},"这就是我乐观的原因。不是因为 AI 会取代人类 operator，而是因为它能让更多人以更高的层级运作。",[10,335,336],{},"长期优势不会只属于拿到最强模型的人。模型会变，界面会变，今天的工具会被明天的平台替代。",[10,338,339],{},"更持久的优势，是学会搭建更好的 human-agent operating system：一个可以执行、汇报、学习，同时仍然把最值得人投入的工作留给人的系统。",[10,341,342],{},"特斯拉里的那个瞬间对我重要，不是因为它让我在路上也能工作。",[10,344,345],{},"而是因为我第一次很清楚地感到，我不再需要用旧方式在工作和生活之间做选择。",[10,347,348],{},"工作还在推进。",[10,350,351],{},"而我仍然在路上，和家人在一起，看着加州越来越近。",{"title":353,"searchDepth":354,"depth":354,"links":355},"",2,[356,357,358,359,360,361],{"id":50,"depth":354,"text":50},{"id":106,"depth":354,"text":107},{"id":172,"depth":354,"text":173},{"id":206,"depth":354,"text":207},{"id":264,"depth":354,"text":264},{"id":297,"depth":354,"text":297},"过去两个月，Claude Code 和 Codex 把 AI 从编程助手变成了我的个人操作系统：它可以路由意图、执行 workflow，并从工作结果中学习。","md",{"date":365,"image":366,"alt":367,"category":368,"tags":369,"youtube":374,"published":375},"20th Jun 2026","/blogs-img/2026-06-20-ai-os-cover.webp","一个从车内手机启动的个人 AI 操作系统，任务在去加州的路上继续运行","personal-operating-system",[370,371,372,373],"AI agents","Codex","Claude Code","AI 工作流","https://youtu.be/brnl-Ml9iuo",true,"/blogs/zh/ai-became-my-operating-system",{"title":5,"description":362},"blogs/zh/26.ai-became-my-operating-system","USz_Ap3C92zXHD0atPKDQqWmijDIhe97wmd93Qn5WUg",1782063277076]