第九章:網路搜尋與擷取 — web_search、web_extract 實戰技巧
在沒有網路的世界裡,AI 管家就像個只讀過百科全書的書呆子,知識永遠停留在它出廠的那一天。但有了網路搜尋能力,Hermes Agent 就插上了翅膀,瞬間化身為走在時代尖端的資訊情報員!😎
在這一章,我們要來學習如何指揮管家在網路上衝浪。不管你是想找最新的科技新聞、查某家公司的財報,還是想抓取某個網頁的完整內容,只要學會 web_search 和 web_extract 兩大絕招,全網資訊都是你的囊中物。
🔍 情報蒐集第一式:web_search (網路搜尋)
當你需要找「不知道在哪裡」的資訊時,這招最管用。 web_search 就像是管家自備了 Google 搜尋引擎。你丟給它一個關鍵字,它會自動去網路上翻箱倒櫃,帶回最相關的搜尋結果與摘要。它不僅會看標題,還會幫你篩選出有用的資訊。
適用情境:查詢時事、比較商品價格、找問題的解答。
🕸️ 情報蒐集第二式:web_extract (網頁擷取)
當你「已經知道網址」,但懶得自己看,想叫管家幫你讀的時候,請用這招! 給它一個 URL,web_extract 就能像個無情的文字吸塵器,把網頁裡的文章內容、表格數據通通吸出來,剔除掉那些煩人的廣告和側邊欄,然後餵給大語言模型去幫你做總結或分析。
適用情境:讀取長篇新聞、抓取維基百科內容、總結 Github 上的說明文件。
🛠️ 指令教學:化身超級情報員
讓我們實際操作,看看管家是如何在網海中幫你撈針的!
介紹指令:使用 hermes run 搭配網頁工具
💡 應用練習例子
練習 1:叫管家去 Google 一下 (web_search 應用) 想知道今天最新的科技頭條?讓管家幫你查:
hermes run "幫我搜尋今天最新的 AI 新聞,並列出三大重點"幽默小提示:管家會先默默打開搜尋引擎,然後像個認真的實習生一樣把結果整理給你。如果它查不到…那可能真的是今天科技圈太安靜了。
練習 2:直接吃掉一個網頁 (web_extract 應用) 看到一篇超長的全英文文章不想看?把網址丟給它:
hermes run "讀取這個網頁 https://en.wikipedia.org/wiki/Artificial_intelligence ,然後用繁體中文、幽默的語氣幫我寫 200 字摘要"看!它就像吃了一塊記憶吐司,瞬間把那篇文章消化完畢,還能用你喜歡的語氣吐出來給你。
練習 3:搜尋與擷取的連續技 (Combo 技) 讓我們來點高級的!先搜尋,再叫它去讀裡面的內容:
hermes run "先搜尋 '2024 奧斯卡 最佳影片',找到結果後,進入那個網頁幫我查出男主角是誰"這就是 Agent 的強大之處:它會自己判斷「搜尋」完之後,再決定要點擊哪個連結去「擷取」更深入的資訊,完全不需要你一步步寫死腳本!
🎉 恭喜解鎖「情報搜集大師」稱號!
現在你再也不用被爆炸的資訊量淹沒了,因為你有一個永遠不會嫌累的網頁閱讀機器。不過,如果有些網頁需要「點擊按鈕」或「登入」才能看呢?這時候簡單的文字擷取就不夠用了。
下一章,我們要解鎖更炫酷的技能——《瀏覽器自動化》。準備好讓管家直接操控你的瀏覽器了嗎?我們第十章見!🏄♀️