第三十章:模型選擇策略 — 推理 vs 對話、Context window、成本、速度、能力權衡

「我到底該選哪個模型啊?」這大概是所有踏入 AI 領域的玩家,每天都要問自己三遍的靈魂拷問。

看著清單上幾十個、甚至上百個模型,是不是覺得比在手搖飲店選飲料還困難?選最貴的怕破產,選免費的又怕它太笨。今天,我們就來教你一套「選腦袋」的終極心法,讓你在不同的戰場上,都能挑到最稱職的管家!🤔

⚖️ 選腦袋的五大衡量指標

挑選模型就像是買車,沒有絕對的「最好」,只有「最適合」。請把這五個指標刻在心底:

1. 推理 (Reasoning) vs 對話 (Chat)

有些模型(像 OpenAI 的 o1 或是 Claude 3.5 Sonnet)是天生的解題高手,邏輯推理能力點滿,適合幫你寫扣、除錯。有些模型則特別會聊天、有幽默感,適合用來寫文案或當客服。你需要認清這次任務是要找「理科生」還是「文科生」。

2. Context Window (上下文視窗)

這是指管家一次能看多少字。如果你要它讀完一整本《哈利波特》然後寫讀書心得,你必須選一個 Context Window 超大的模型(比如 128k 或 200k Token)。如果你給了金魚腦一個超大檔案,它只會看著你發脾氣並回報錯誤。

3. 成本 (Cost)

「免費的最貴,但太貴的會流淚。」使用頂級模型(如 GPT-4o)執行複雜的自動化任務,你的信用卡可能會發出悲鳴。如果是簡單的日常小任務(比如判斷一句話是正面還負面),用便宜甚至免費的小模型(如 Llama 3 8B)就綽綽有餘了。

4. 速度 (Speed)

天下武功,唯快不破。當你急著要答案,或是你要執行一個包含 100 個步驟的批次任務時,速度就成了關鍵。小模型或是專注於快速推理的模型(如透過 Groq 呼叫的模型)能讓你的工作流順暢無比。

5. 多模態能力 (Multimodal)

需要看圖片或聽聲音嗎?記得選有長眼睛和耳朵的模型!


🛠️ 指令教學:在對的時間,選對的模型

了解了選腦心法後,我們來練習一下如何在不同情境下切換管家的大腦。

介紹指令:使用 --model 進行情境切換

💡 應用練習例子

練習 1:殺雞焉用牛刀(低成本快速任務) 如果只是要請管家翻譯一個簡單的單字,用小模型就好:

hermes run --model "openrouter/google/gemma-2-9b-it" "請把 'Apple' 翻譯成日文"

幽默小提示:小模型跑得飛快又便宜。別為了殺一隻蚊子(翻譯一個字),去借隔壁鄰居的大砲(GPT-4)啊!

練習 2:挑戰極限的長文本閱讀(大 Context Window) 假設你有一個一萬字的超長文字檔 long_document.txt,你要找一個大胃王來吃它:

hermes run --model "anthropic/claude-3-5-sonnet-20241022" "請閱讀目前目錄下的 long_document.txt,並總結出三個核心重點"

Claude 3.5 Sonnet 以超大的 Context Window 著稱。看著它一口氣把一萬字吞下去並給出精準摘要,絕對值回票價!

練習 3:召喚理科天才寫程式(高推理能力) 遇到解不開的 Bug 或需要寫複雜邏輯時,請出最聰明的大腦:

hermes run --model "openai/o1-mini" "請幫我寫一個能解開數獨的 Python 腳本,並加上詳細註解"

像 o1 這種專注於推理(Reasoning)的模型,會花比較多時間思考(也就是俗稱的 Thinking),但吐出來的程式碼品質絕對讓你驚豔!


🎉 幹得好!你現在是模型界的品酒師了!

懂得在「成本、速度與聰明才智」之間取得完美的平衡,是高階玩家的必修課。

不過,如果你對市面上的模型還是不滿意,覺得它們都不懂你的特殊需求?那麼下一章《自訂 Provider》,我們將教你如何突破原廠限制,串接那些奇奇怪怪、甚至是你們公司自己訓練的獨家大腦!我們第三十一章見!🔧