Document Read Agent
使用LLM擷取文件(PDF/DOCX/TXT/PNG/JPG/Google-Docs)中的資訊,並輸出文本結果(TXT)。

API KEY
輸入 OpenAI 或 Google 的 API 金鑰。支援 %VARIABLE% 格式。
- OpenAI API Key: 請參閱 https://platform.openai.com/api-keys
- Google API Key: 請參閱 https://ai.google.dev/gemini-api/docs/api-key
MODEL
目前支援以下模型:
| 平台 | Model |
|---|---|
| OpenAI | o3, gpt-4.1, gpt-4.1-mini |
| gemini-2.5-pro, gemini-2.5-flash, gemini-2.0-flash |
一般來說, 使用上述模型會依使用量計費。詳細計費資訊請參閱:
- OpenAI: https://openai.com/pricing
- Google Gemini: https://ai.google.dev/gemini-api/docs/pricing
PDF/DOCX/TXT/PNG/JPG/GOOGLEDOC
輸入的文件檔。點擊 PICK 選取檔案,或使用 %FILENAME% 變數。
支援格式: PDF, DOCX, TXT, PNG, JPG, Google Docs
ADD PROMPT
加入自然語言提示詞來引導模型。
- FILENAME: 輸出文檔的檔案名稱,輸出結果將儲存為
.txt檔案 - PROMPT: 用於引導模型的自然語言指令。
Example
目標:擷取下方文件(PDF)檔案內的資訊

利用自然語言提示模型:

最後,輸出為文字物件
