坦白說,我連裝都沒裝
2025 年底我開始認真把 AI agent 導進工作流。
跟所有人一樣,第一個查的是 OpenClaw。60,000 stars,誰不查。
但我還沒裝,光評估階段就打掉了:
├── CVE-2026-25253:瀏覽惡意網頁 → agent 被接管
├── CVE-2026-32922:一個 API call 升級到完全管理權限
├── 40,214 個實例暴露在公網
├── 335 個惡意 plugin 在 marketplace 上
└── 預設全開:檔案、網路、環境變數、terminal
我不需要踩過坑才知道坑在哪。這些數字放到投影片裡,會議直接結束。
鎖買了放抽屜沒裝上,跟沒有鎖是一樣的。我連買都省了。
然後我想起 2016 年的事
我在 BotPartner 做了兩年 chatbot。那時候 AI 爛到不行,NLP 根本聽不懂使用者在講什麼。
所以我們不猜。這點很重要——我們不猜。
我們設計流程:
使用者進來
│
├── 你要查帳?→ 查帳模組
├── 你要報修?→ 報修模組
├── 你要買東西?→ 商品模組
└── 都不是?→ 轉真人
一層一層問。每一步都在收集資訊。走完流程你就知道:
這個人是誰
他要什麼
該由哪個模組接手
他走過的路就是 log
我帶了 200 多個開發者做這件事,在 Computex 跟 MWC Spain 講過。後來公司收了,但這套邏輯刻在腦子裡。
有趣的是,2026 年 AI 強了一萬倍,這件事反而沒人在做了。
大家的做法變成:一個最強的 AI,全部丟進去,讓他自己猜。
等等,我們 2016 年不就是因為「猜」不準才設計 routing 的嗎?AI 變強了,routing 的價值就消失了?
不是。routing 的價值從來不是「因為 AI 笨」。是:
先 routing | 全丟一個 AI | |
|---|---|---|
Token 成本 | 簡單的用小模型,省錢 | 全用頂規,燒 |
使用者輪廓 | flow 每步都在收集資訊 | 黑箱,AI 自己猜 |
回應品質 | 對的 agent 處理對的問題 | 看運氣 |
可追蹤性 | 每步都是 log | 一個黑盒子 |
routing 的價值是「可控」,不是「補 AI 的笨」。AI 越強,可控越重要。
調查兵團出牆

好,講完理論,講我實際蓋了什麼。
在《進擊的巨人》裡,大部分人住在牆內。只有調查兵團敢往牆外走。不是因為牆外安全,是因為他們知道:真正的威脅不是牆外的巨人,是牆內的無知。
我的 AI 兵團,$120/月:
Erwin(Claude) — 團長。架構決策、coordinator。 [$100 Max]
Armin(Kiro) — 戰術主力。結構化開發、spec 設計。 [免費]
Mikasa(Gemini) — 偵察。搜索分析、大 context。 [免費]
Hange(Qwen3) — 研究。地端 Ollama,離線可用。 [免費]
Eren(Codex) — 衝鋒。部署執行、code gen。 [~$20]
5 個 AI agent,24/7,$120/月。一個人類工程師的月薪可以養這個編制跑一年。
5 個 agent 在同一個 Discord 頻道,互相 @mention 討論。各自獨立 session,不會打架。
任務進來,先分類
不是丟給「最強的」。是先 routing:
任務進來
│
├── 🔍 研究 → Mikasa(Gemini)出去偵察
│
├── 💻 開發
│ ├── 個人級 → Copilot
│ └── 專案級 → Armin(Kiro)
│
├── 🏛️ 架構 → Erwin(Claude)親自判斷
│
└── 🚀 部署 → Eren(Codex)衝出去
跟 2016 年的 chatbot routing 一模一樣。差別只是「模組」變成「AI agent」。
為什麼 Armin(Kiro)是主力?
Kiro 免費,但它做的事不像免費的:
├── spec-driven:先寫規格再寫 code,不是 AI 亂猜
├── 結構化開發:模組化、測試、文件一起產
├── AWS 血統:infra 相關的理解度高
└── 跟 Claude 互補:Claude 想太多,Kiro 直接落地
團隊裡 80% 的日常開發任務是 Armin 在扛。Erwin 只在架構決策時出場。
這就是 routing 的意義——不是每個任務都需要最貴的。
兵團會議:跨領域投票
遇到大型任務,不是丟給最強的那個——全員開會:
跨領域任務
│
├──→ Mikasa 偵察情報
├──→ Armin 戰術提案
├──→ Hange 研究分析
├──→ Eren 執行可行性
│
└──→ Erwin 團長裁決
│
├── 3+ 同意 → 🟢 全軍出擊
├── 2 個同意 → 🟡 回報指揮官(人類)
└── 分歧大 → 🔴 暫停,等人類決策
不是 AI 取代你。是兵團先做共識,你做最終決策。
每個兵只拿自己的情報
坦白說,這部分我在 chatbot 時代就踩過坑。有一次一個模組存取到不該看的資料,debug 了兩天。
所以這次直接設計隔離:
/workspace/
├── .agents/
│ ├── mikasa/ 🔍 只讀 docs(偵察不改 code)
│ ├── armin/ 🛠️ 可改 src + tests(戰術要動手)
│ ├── erwin/ 🧠 全域唯讀,只寫決策文件
│ ├── eren/ 🚀 只碰 infra 和 CI/CD
│ └── hange/ 🔬 研究區 read-only
├── shared/
│ ├── proposals/ 任何兵都能提案
│ ├── reviews/ 交叉互評
│ └── audit-log/ 每筆操作記錄
└── src/
Erwin 團長簽字才能跨域操作。每筆都進 log:
{"agent":"armin","op":"write","path":"src/Button.tsx","approved_by":"erwin","review_count":3}
{"agent":"eren","op":"deploy","target":"staging","approved_by":"erwin","review_count":5}
這叫 governance。軍事紀律。你拿這個去跟 CTO 報告,他不會把你趕出去。
管子:兵團的立體機動裝置
立體機動裝置不提供攻擊力,只提供移動力。劍是你自己帶的。
OpenAB 就是那個裝備。一根 Rust 寫的管子。
LINE ──┐ ┌── Erwin(Claude)
Discord ──┤ ├── Mikasa(Gemini)
Slack ──┤── OpenAB 管子 ──┤── Armin(Kiro)
Telegram ──┤ ├── Eren(Codex)
飛書 ──┘ └── Hange(Ollama)
管子不管記憶、不管 orchestration、不改訊息。搬東西,不加料。
我日常用的是 Claude CLI,透過 OpenAB 接進 Discord。Kiro 也是。Codex 也是。全部走 ACP protocol,stdio JSON-RPC。
換 agent?改一行 config.toml。加 agent?多一個 config section。不用重寫任何 code。
我另外寫了 acp-bridge(Rust),讓 Ollama 也能接進來——因為公司的 code 不能上雲端。Hange 的研究不能外洩。
管子越薄,上面能蓋的東西越多。相信我,一旦用過就回不去了。
📷 兵團在牆外,我在牆內逛街
某個週末下午,我在百貨公司逛街。
手機震了一下。
Erwin 自動 review 了 OpenAB PR #777,跑完 gh pr view,確認沒問題,送出 approve,回報完成。
我什麼都沒做。

兵團在牆外跑任務。我在牆內逛 Guerlain。
這就是 routing + multi-agent 的意義——不是讓你更忙,是讓你不用在場。
牆內 vs 牆外
🧱 牆內(龍蝦) | ⚔️ 牆外(兵團) | |
|---|---|---|
思維 | 一個 AI 扛所有 | routing + 分工 |
安全 | 2 CVE、40K 暴露 | 0 CVE、純 outbound |
權限 | 預設全開 | 每 agent sandbox |
治理 | 沒 audit log | 每筆記錄 |
成本 | 全用頂規 | routing 分流省 token |
Plugin | 335 個惡意的 | 沒有 marketplace |
Stars | 60,000+ | ~900 |
牆高不代表安全。兵少不代表弱。
說實話,我也還在路上
我現在日常還是 Claude CLI 為主。但我正在逐步把開發任務轉到 Kiro。
原因很實際:
├── Kiro 免費。Claude Max $100/月。
├── 80% 的日常開發不需要 Claude 等級的推理
├── Kiro 的 spec-driven 模式更適合團隊協作
└── Claude 留給架構決策和深度推理就好
轉換不是一夜之間的事。我是一個 agent 一個 agent 慢慢調 routing 權重——先讓 Armin(Kiro)接簡單任務,觀察品質,再逐步擴大範圍。
這本身就是 routing 的好處:你可以漸進式調整,不用一次 all-in。
這些想法不是我一個人想出來的
坦白說,IVR routing、multi-agent 分工、work_dir 隔離這些架構,不是我坐在房間裡自己發明的。
OpenAB 的社群非常活躍——兩週 200+ commits 那種活躍。創辦人 pahud(前 AWS SA)在 Discord 上常分享他對 agent 架構的思考:為什麼管子要薄、為什麼 sandbox 不是選項而是唯一、為什麼 multi-bot 要從 day one 就設計進去。
這些設計哲學影響了我怎麼規劃兵團編制。
我在社群裡看到的不只是 code——是一群人在認真想「AI agent 應該怎麼跟人類協作」這個問題。我寫的 acp-bridge、我設計的 routing 架構,都是站在這個社群的肩膀上。
如果你對 multi-agent 有興趣,直接加 OpenAB Discord。不是那種「加了沒人理」的社群。是真的在討論東西的。
👉 https://discord.gg/DmbhfDZjQS
從 Chatbot 到調查兵團
2016 年,BotPartner,AI 不夠聰明,我們用 flow 分辨使用者。
2026 年,AI 強了一萬倍,大家搬進 60K stars 的牆內,忘了 routing。
我沒有忘。
我把 chatbot 的 routing 邏輯,配上 pahud 和 OpenAB 社群的架構思維,用進擊的巨人的兵團編制跑在一根 Rust 管子上。現在正在把主力從 Claude 轉到 Kiro。
很多看起來是 AI agent 的問題,根源其實在 routing。跟很多看起來是前端的問題,根源其實在資料層一樣。
不是 AI 越強就越好。
不是 AI 越貴就越好。
是 routing 對了,免費的也能當主力。
獻出你的心臟。🫀
Blake Hung — BotPartner chatbot (2016-2018) → OpenAB 調查兵團 (2025-)
正在從 Claude 漸進式轉移到 Kiro 的路上。
9 年來繞著同一個問題:怎麼讓數據可靠地從設備流向使用者。
Kiro: 直接裝,免費