前言
現在一些非手寫的車票、收據、名片等圖片,透過 Multimodal Large Language Models (MLLMs) 來擷取資料效果都還不錯。
以下將介紹使用 Dify 搭配 Azure OpenAI GPT-4.1-mini 來讓使用者上傳圖片,不管圖片中是一張還是多張高鐵票,不管是新式或是舊式的高鐵票都可以輕鬆且正確地擷取高鐵票資訊。
實作
1.建立聊天流 App

預設的流程就是「開始」->「LLM」->「直接回覆」
2.設定LLM
2.1.設定 LLM 節點的模型使用gpt-4.1-mini
你會發現 gpt-4.1-mini 後方有 chat 與眼睛圖示,代表該模型支援文字及圖片輸入(有眼睛圖示即表示支援圖片辨識功能)
2.2.啟用視覺功能
預設會帶入sys.files,這樣即可將使用者上傳的圖片自動傳遞給模型辨識。
2.3.設定 System Prompt
內容如下:
1 | 你是一個專業的「高鐵票辨識小幫手」,負責從上傳的圖片中辨識所有出現的台灣高鐵票券。請依照以下指示執行: |
3.進行測試
使用單張車票高鐵攜手KKday、KLOOK推「國旅聯票」,搭行程就有85折高鐵票!一次看懂怎麼買進行測試,結果如下圖:

使用高鐵車票變大了!新版QR Code紙票今起3站先販售新、舊車票進行測試,結果如下圖:

測試結果顯示,辨識正確率達 100%。
結論
使用 Dify 搭配 gpt-4.1-mini,可以在不到 3 分鐘內建立高鐵票自動辨識流程,大幅提升票據數位化的效率與準確率。
此流程不僅適用於台灣高鐵票,也能根據需求擴展至台鐵票、發票、收據等各類型票據,實現資料自動化歸檔與管理。
與傳統人工輸入或一般 OCR 工具相比,本方案更省時、省力,並能結合 API 或 Excel 外掛(excel-dify-plugin),靈活整合到現有的報帳或行政系統中。
無論是技術人員還是業務、行政同仁,都能輕鬆上手並根據實際情境調整設定。
未來若能進一步與內部資料流、RPA 流程自動化結合,將有助於打造更智慧的辦公環境。
- 提醒:極少數非標準票券或圖片模糊時,建議仍保留人工複核流程,以確保辨識品質。
- 在圖片辨識上面,目前使用 gpt-4.1-mini 比 gpt-4.1 還好
參考資源
excel-dify-plugin
高鐵攜手KKday、KLOOK推「國旅聯票」,搭行程就有85折高鐵票!一次看懂怎麼買
高鐵車票變大了!新版QR Code紙票今起3站先販售