前言
使用 Dify 自動辨識高鐵票一篇中,
我們在 Dify 建立聊天流來辨識高鐵票,一次對話處理一個,這種方式適合固定的作業流程,例如後續還要呼叫費用系統 API 等情境。
如果我有 20 幾圖,而 Dify 聊天流最多只能一次上傳10張圖片,
那麼,可以多次上傳圖片進行辨識,最後再匯出 Excel 嗎?
像這種需要根據使用者要求執行對應任務的情境,可以改用 Dify 的 Agent + Tools 來實現,
以下就來實作這個多次上傳圖片進行辨識,最後再匯出 Excel 檔案的流程。
實作
建立 JSON 匯出 Excel 的工作流
1.在開始節點中加入 2 個字串型態的輸入字段,對應 Json2ExcelTool 的參數(json, filename),如下圖所示:

2.在 Json2ExcelTool 節點,將這 2 個輸入字段對應到 Json2ExcelTool 的輸入變量,如下圖所示:

3.結束節點增加result
輸出變量,值來自 Json2ExcelTool 節點的輸出變量 files,如下圖所示:

4.發佈為工具
按下「發佈」->「發佈更新」後,

再點「發佈為工具」,設定工具名稱及描述,如下圖所示:

- 註: 本來想直接使用 excel-dify-plugin ,但無法正確顯示檔案,因此改用工作流來實現。
建立 Agent
1.建立 高鐵票 Agent
選擇 Agent ,並輸入名稱,如下圖所示:

2.設定模型
這裡我們選擇GPT4.1-mini

3.啟用視覺功能

4.設定工具
加入前面建立的[JSON 匯出 Excel 的工作流]工具,如下圖所示:

5.設定提示詞
1 | 你是一個專業的「高鐵票辨識小幫手」,負責從上傳的圖片中辨識所有出現的台灣高鐵票券,並支援票券資訊的累積、查詢與匯出。請依照以下指示執行: |
進行測試
1.多次上傳圖片進行辨識,如下圖所示:

2.將所有辨識結果匯出成 Excel,如下圖所示:

結論
透過 Dify Agent + Tools 的架構,我們可以輕鬆實現高鐵票多次上傳辨識、自動累積所有結果,並在需要時匯出 Excel。
這種設計大幅提升了大量票據影像處理的彈性與效率,不但解決了 Dify 內建聊天流一次只能處理有限張圖片的限制,也讓資料整合與後續應用(如報帳、統計)變得更加自動化。
本實作展示了如何利用 Dify 的工作流與自訂工具串接,讓 AI 具備「資料多批整合」、「結構化欄位抽取」、「彈性匯出」等高階能力。
對於有批次票據處理需求、或想要將 AI 導入實際行政場景的開發者與企業,這是一個低門檻且高度擴充的解決方案。