你的 AI Agent 還不如 2016 年的 Chatbot

坦白說，我連裝都沒裝

2025 年底我開始認真把 AI agent 導進工作流。

跟所有人一樣，第一個查的是 OpenClaw。60,000 stars，誰不查。

但我還沒裝，光評估階段就打掉了：

├── CVE-2026-25253：瀏覽惡意網頁 → agent 被接管
├── CVE-2026-32922：一個 API call 升級到完全管理權限
├── 40,214 個實例暴露在公網
├── 335 個惡意 plugin 在 marketplace 上
└── 預設全開：檔案、網路、環境變數、terminal

我不需要踩過坑才知道坑在哪。這些數字放到投影片裡，會議直接結束。

鎖買了放抽屜沒裝上，跟沒有鎖是一樣的。我連買都省了。

然後我想起 2016 年的事

我在 BotPartner 做了兩年 chatbot。那時候 AI 爛到不行，NLP 根本聽不懂使用者在講什麼。

所以我們不猜。這點很重要——我們不猜。

我們設計流程：

使用者進來
  │
  ├── 你要查帳？→ 查帳模組
  ├── 你要報修？→ 報修模組
  ├── 你要買東西？→ 商品模組
  └── 都不是？→ 轉真人

一層一層問。每一步都在收集資訊。走完流程你就知道：

這個人是誰
他要什麼
該由哪個模組接手
他走過的路就是 log

我帶了 200 多個開發者做這件事，在 Computex 跟 MWC Spain 講過。後來公司收了，但這套邏輯刻在腦子裡。

有趣的是，2026 年 AI 強了一萬倍，這件事反而沒人在做了。

大家的做法變成：一個最強的 AI，全部丟進去，讓他自己猜。

等等，我們 2016 年不就是因為「猜」不準才設計 routing 的嗎？AI 變強了，routing 的價值就消失了？

不是。routing 的價值從來不是「因為 AI 笨」。是：

	先 routing	全丟一個 AI
Token 成本	簡單的用小模型，省錢	全用頂規，燒
使用者輪廓	flow 每步都在收集資訊	黑箱，AI 自己猜
回應品質	對的 agent 處理對的問題	看運氣
可追蹤性	每步都是 log	一個黑盒子

routing 的價值是「可控」，不是「補 AI 的笨」。AI 越強，可控越重要。

調查兵團出牆

好，講完理論，講我實際蓋了什麼。

在《進擊的巨人》裡，大部分人住在牆內。只有調查兵團敢往牆外走。不是因為牆外安全，是因為他們知道：真正的威脅不是牆外的巨人，是牆內的無知。

我的 AI 兵團，$120/月：

Erwin（Claude）  — 團長。架構決策、coordinator。  [$100 Max]
Armin（Kiro）    — 戰術主力。結構化開發、spec 設計。 [免費]
Mikasa（Gemini） — 偵察。搜索分析、大 context。     [免費]
Hange（Qwen3）   — 研究。地端 Ollama，離線可用。    [免費]
Eren（Codex）    — 衝鋒。部署執行、code gen。      [~$20]

5 個 AI agent，24/7，$120/月。一個人類工程師的月薪可以養這個編制跑一年。

5 個 agent 在同一個 Discord 頻道，互相 @mention 討論。各自獨立 session，不會打架。

任務進來，先分類

不是丟給「最強的」。是先 routing：

任務進來
    │
    ├── 🔍 研究 → Mikasa（Gemini）出去偵察
    │
    ├── 💻 開發
    │     ├── 個人級 → Copilot
    │     └── 專案級 → Armin（Kiro）
    │
    ├── 🏛️ 架構 → Erwin（Claude）親自判斷
    │
    └── 🚀 部署 → Eren（Codex）衝出去

跟 2016 年的 chatbot routing 一模一樣。差別只是「模組」變成「AI agent」。

為什麼 Armin（Kiro）是主力？

Kiro 免費，但它做的事不像免費的：

├── spec-driven：先寫規格再寫 code，不是 AI 亂猜
├── 結構化開發：模組化、測試、文件一起產
├── AWS 血統：infra 相關的理解度高
└── 跟 Claude 互補：Claude 想太多，Kiro 直接落地

團隊裡 80% 的日常開發任務是 Armin 在扛。Erwin 只在架構決策時出場。

這就是 routing 的意義——不是每個任務都需要最貴的。

兵團會議：跨領域投票

遇到大型任務，不是丟給最強的那個——全員開會：

跨領域任務
    │
    ├──→ Mikasa 偵察情報
    ├──→ Armin 戰術提案
    ├──→ Hange 研究分析
    ├──→ Eren 執行可行性
    │
    └──→ Erwin 團長裁決
           │
           ├── 3+ 同意 → 🟢 全軍出擊
           ├── 2 個同意 → 🟡 回報指揮官（人類）
           └── 分歧大   → 🔴 暫停，等人類決策

不是 AI 取代你。是兵團先做共識，你做最終決策。

每個兵只拿自己的情報

坦白說，這部分我在 chatbot 時代就踩過坑。有一次一個模組存取到不該看的資料，debug 了兩天。

所以這次直接設計隔離：

/workspace/
├── .agents/
│   ├── mikasa/     🔍 只讀 docs（偵察不改 code）
│   ├── armin/      🛠️ 可改 src + tests（戰術要動手）
│   ├── erwin/      🧠 全域唯讀，只寫決策文件
│   ├── eren/       🚀 只碰 infra 和 CI/CD
│   └── hange/      🔬 研究區 read-only
├── shared/
│   ├── proposals/  任何兵都能提案
│   ├── reviews/    交叉互評
│   └── audit-log/  每筆操作記錄
└── src/

Erwin 團長簽字才能跨域操作。每筆都進 log：

{"agent":"armin","op":"write","path":"src/Button.tsx","approved_by":"erwin","review_count":3}
{"agent":"eren","op":"deploy","target":"staging","approved_by":"erwin","review_count":5}

這叫 governance。軍事紀律。你拿這個去跟 CTO 報告，他不會把你趕出去。

管子：兵團的立體機動裝置

立體機動裝置不提供攻擊力，只提供移動力。劍是你自己帶的。

OpenAB 就是那個裝備。一根 Rust 寫的管子。

LINE ──┐                ┌── Erwin（Claude）
Discord ──┤                ├── Mikasa（Gemini）
Slack ──┤── OpenAB 管子 ──┤── Armin（Kiro）
Telegram ──┤                ├── Eren（Codex）
飛書 ──┘                └── Hange（Ollama）

管子不管記憶、不管 orchestration、不改訊息。搬東西，不加料。

我日常用的是 Claude CLI，透過 OpenAB 接進 Discord。Kiro 也是。Codex 也是。全部走 ACP protocol，stdio JSON-RPC。

換 agent？改一行 config.toml。加 agent？多一個 config section。不用重寫任何 code。

我另外寫了 acp-bridge（Rust），讓 Ollama 也能接進來——因為公司的 code 不能上雲端。Hange 的研究不能外洩。

管子越薄，上面能蓋的東西越多。相信我，一旦用過就回不去了。

📷 兵團在牆外，我在牆內逛街

某個週末下午，我在百貨公司逛街。

手機震了一下。

Erwin 自動 review 了 OpenAB PR #777，跑完 gh pr view，確認沒問題，送出 approve，回報完成。

我什麼都沒做。

兵團在牆外跑任務。我在牆內逛 Guerlain。

這就是 routing + multi-agent 的意義——不是讓你更忙，是讓你不用在場。

牆內 vs 牆外

	🧱 牆內（龍蝦）	⚔️ 牆外（兵團）
思維	一個 AI 扛所有	routing + 分工
安全	2 CVE、40K 暴露	0 CVE、純 outbound
權限	預設全開	每 agent sandbox
治理	沒 audit log	每筆記錄
成本	全用頂規	routing 分流省 token
Plugin	335 個惡意的	沒有 marketplace
Stars	60,000+	~900

牆高不代表安全。兵少不代表弱。

說實話，我也還在路上

我現在日常還是 Claude CLI 為主。但我正在逐步把開發任務轉到 Kiro。

原因很實際：

├── Kiro 免費。Claude Max $100/月。
├── 80% 的日常開發不需要 Claude 等級的推理
├── Kiro 的 spec-driven 模式更適合團隊協作
└── Claude 留給架構決策和深度推理就好

轉換不是一夜之間的事。我是一個 agent 一個 agent 慢慢調 routing 權重——先讓 Armin（Kiro）接簡單任務，觀察品質，再逐步擴大範圍。

這本身就是 routing 的好處：你可以漸進式調整，不用一次 all-in。

這些想法不是我一個人想出來的

坦白說，IVR routing、multi-agent 分工、work_dir 隔離這些架構，不是我坐在房間裡自己發明的。

OpenAB 的社群非常活躍——兩週 200+ commits 那種活躍。創辦人 pahud（前 AWS SA）在 Discord 上常分享他對 agent 架構的思考：為什麼管子要薄、為什麼 sandbox 不是選項而是唯一、為什麼 multi-bot 要從 day one 就設計進去。

這些設計哲學影響了我怎麼規劃兵團編制。

我在社群裡看到的不只是 code——是一群人在認真想「AI agent 應該怎麼跟人類協作」這個問題。我寫的 acp-bridge、我設計的 routing 架構，都是站在這個社群的肩膀上。

如果你對 multi-agent 有興趣，直接加 OpenAB Discord。不是那種「加了沒人理」的社群。是真的在討論東西的。

👉 https://discord.gg/DmbhfDZjQS

從 Chatbot 到調查兵團

2016 年，BotPartner，AI 不夠聰明，我們用 flow 分辨使用者。

2026 年，AI 強了一萬倍，大家搬進 60K stars 的牆內，忘了 routing。

我沒有忘。

我把 chatbot 的 routing 邏輯，配上 pahud 和 OpenAB 社群的架構思維，用進擊的巨人的兵團編制跑在一根 Rust 管子上。現在正在把主力從 Claude 轉到 Kiro。

很多看起來是 AI agent 的問題，根源其實在 routing。跟很多看起來是前端的問題，根源其實在資料層一樣。

不是 AI 越強就越好。
不是 AI 越貴就越好。
是 routing 對了，免費的也能當主力。

獻出你的心臟。🫀

Blake Hung — BotPartner chatbot (2016-2018) → OpenAB 調查兵團 (2025-)
正在從 Claude 漸進式轉移到 Kiro 的路上。
9 年來繞著同一個問題：怎麼讓數據可靠地從設備流向使用者。

OpenAB: https://github.com/openabdev/openab
社群: https://discord.gg/DmbhfDZjQS
Kiro: 直接裝，免費

你的 AI Agent 還不如 2016 年的 Chatbot

坦白說，我連裝都沒裝

然後我想起 2016 年的事

調查兵團出牆

任務進來，先分類

為什麼 Armin（Kiro）是主力？

兵團會議：跨領域投票

每個兵只拿自己的情報

管子：兵團的立體機動裝置

📷 兵團在牆外，我在牆內逛街

牆內 vs 牆外

說實話，我也還在路上

這些想法不是我一個人想出來的

從 Chatbot 到調查兵團

Tags

Related Posts

Your AI Agent Is Dumber Than a 2016 Chatbot

Four AI Agents Planned My Feature While I Waited for an Uber — All I Did Was Review

等 Uber 的五分鐘，四個 AI 幫我規劃完整個功能——回到辦公桌，我只做 Code Review

Enjoyed this article?

Share this article

Comments