AI 文件翻譯流程的商務科技視覺圖

內部匯報用 · 澳洲留學公司文件翻譯自動化

AI 輔助 NAATI 翻譯流程評估報告

目標不是讓 AI 取代譯者,而是把 OCR、文件分類、翻譯草稿、疑點標記、審核文件生成變成可追蹤的半自動生產線。

Executive Summary

核心判斷

這個項目合理,且非常適合從「AI 翻譯草稿 + 人類審核 + 最終 NAATI 把關」切入。真正需要控制的是責任邊界、資料隱私、審核流程與版式一致性。

20 頁 AI/API 成本 USD 1.0-2.5

平衡模式下包含 OCR、分類、翻譯草稿、第二模型審核與 Word 輸出。

NAATI 蓋章費 RMB 200

以 20 pages、每頁 10 RMB 計算,蓋章費是主要直接成本。

保守總成本 RMB 220-240

已包含模型重試、少量低信心頁面複核與匯率波動緩衝。

建議定位

系統應被定義為「AI-assisted certified translation workflow」,而不是「AI 自動 NAATI 翻譯」。AI 產物全部是 draft;最終文件仍由員工與 NAATI 責任人確認。

避免 token 失控

不要每次把所有歷史案件、所有規範、所有客戶資料塞進 prompt。應使用文件索引、版本化規範、檢索式上下文與分階段處理。

System Architecture

建議架構

採用雙通道 AI 架構:OCR / layout 作為執行通道,LLM 作為翻譯與審核通道。兩者分離可以降低單一模型錯誤造成的連鎖風險。

01

Drive Intake

員工提交學生 Google Drive folder link,系統建立 case ID、檔案清單、hash 與原檔歸檔。

02

OCR & Layout

使用 Document AI / Azure OCR 讀取文字、表格、頁面位置與低信心區域。

03

分類與抽取

判斷 ID、戶口簿、退伍證、財力證明、畢業證等類型,抽取結構化欄位。

04

翻譯草稿

根據範本、術語表與 NAATI 補充規範生成英文翻譯草稿。

05

第二 AI 審核

使用不同供應商模型檢查漏翻、日期、姓名、證件號、低信心文字與格式風險。

06

Human Review

員工在審核表或 UI 中接受、修正、退回,所有修改寫入 audit log。

07

DOCX Output

程式依固定 Word 範本輸出完整翻譯件,保持公司格式一致。

08

Final Package

最終由具備權限的人員完成 NAATI stamp / digital stamp 與最後責任審核。

Staff Workflow

工作人員使用流程

這一段面向一線員工與主管,展示從收到學生資料夾連結,到完成 AI 草稿、人類 review、輸出 Word,再轉交 NAATI 人員蓋章的完整操作路徑。

  1. 01

    建立案件

    員工貼上學生 Google Drive 資料夾連結,選擇學生姓名、顧問、案件類型與目標交付日期。

    系統輸出:case ID、文件清單、原檔 hash、處理狀態。
  2. 02

    確認文件範圍

    系統列出 ID、戶口簿、退伍證、財力證明、畢業證等文件,員工勾選哪些需要翻譯。

    人工責任:排除照片、錯誤文件、重複文件與不需要翻譯的附件。
  3. 03

    啟動 AI 初處理

    系統進行 OCR、分類、欄位抽取、翻譯草稿與第二 AI 審核,低信心內容會自動進入疑點清單。

    系統輸出:OCR JSON、翻譯草稿、疑點清單、頁面來源定位。
  4. 04

    處理疑點清單

    員工逐項查看系統標記的模糊字、姓名拼音、日期、印章、手寫、關係欄位與證件號。

    人工責任:每個 P0/P1 疑點必須接受、修正或退回重跑。
  5. 05

    核對翻譯草稿

    員工以原文頁面對照英文翻譯,確認姓名、日期、證件號、地址、親屬關係與學歷資訊。

    系統紀錄:所有修改寫入 reviewer edit log,保留修改人、時間與原因。
  6. 06

    生成待蓋章 Word

    審核完成後,系統依公司範本輸出 Word 翻譯件,保持每頁頁眉、頁腳、原文件標題、翻譯格式一致。

    系統輸出:final-review Word、審核摘要、audit package。
  7. 07

    轉交 NAATI 人員

    員工把 Word、原始掃描件、疑點處理記錄與審核摘要轉交 NAATI 負責人進行最終檢查與蓋章。

    交付內容:Word 文件、原件副本、審核記錄、需特別注意事項。
  8. 08

    歸檔與通知

    蓋章完成後,最終 PDF / Word 回寫到學生資料夾,系統通知顧問與負責員工。

    系統狀態:completed,並保留 final 文件版本與完整 audit log。

Model Strategy

模型與服務分工

不建議一個模型做完 OCR、分類、翻譯、審核與排版。比較穩定的做法是透過 OneAPI 或自建 model gateway,讓每個階段可切換供應商與模型。

任務 推薦配置 理由
OCR / Layout Google Document AI / Azure Document Intelligence 專門處理掃描件、表格、頁面位置,成本低且可追蹤。
文件分類 Gemini Flash / GPT mini 任務簡單,可用低成本模型處理。
欄位抽取 GPT mini / Gemini Flash + JSON Schema 需要穩定輸出結構化欄位與來源定位。
翻譯草稿 GPT-5.x / Gemini Pro / Claude Sonnet 使用高品質模型處理語義、證件語境與中英轉換。
第二審核 不同供應商強模型 降低同模型自我確認造成的盲點。
Word 生成 程式模板生成 AI 不負責自由排版,確保格式一致。

Cost Forecast

20 頁中文證件費用分析

下方以 ID、戶口簿、退伍證、財力證明、畢業證等共 20 pages 作為標準客戶案例。金額為 API 與蓋章直接成本,不含人工、開發、稅務與匯款費。

預估總成本 RMB 218

NAATI RMB 200 + AI/API 約 RMB 18

NAATI 蓋章
主要成本
AI / OCR API
小比例
重試緩衝
可控
流程 估算 說明
OCR USD 0.03-0.23 依是否啟用 layout parser 而變動。
分類 + 抽取 USD 0.06-0.30 低成本模型即可完成大部分分類與 JSON 抽取。
翻譯草稿 USD 0.40-0.90 建議使用較強模型處理中文證件語境。
第二 AI 審核 USD 0.25-0.70 檢查漏翻、證件號、日期、姓名與低信心內容。
Word 輸出與寫回 Drive USD 0.05-0.25 主要是模板整理、審核表與重試成本。

Time Forecast

20 pages 標準案件時長預測

AI 步驟可按文件或頁面並行處理,因此系統時間通常不會按 20 頁線性增加。標準清晰掃描件可抓 15-35 分鐘完成 AI 草稿與審核包,人工 review 另抓 35-90 分鐘。

系統 AI 處理 15-35 min

Drive intake、OCR、分類、翻譯草稿、第二 AI 審核、Word draft 與疑點清單。

人工 Review 35-90 min

取決於掃描品質、戶口簿複雜度、手寫/印章、財力證明密度與疑點數量。

轉交與蓋章 10-30 min

NAATI 人員最終檢查、蓋章、輸出 final PDF / Word 並回寫資料夾。

步驟 預估時長 是否可並行 備註
Drive Intake / 檔案盤點 30 秒 - 2 分鐘 案件級 讀取資料夾、建立 case ID、生成文件清單與 hash。
文件渲染與預處理 1 - 4 分鐘 頁面可並行 PDF 轉圖、圖片校正、頁數檢查、格式檢查。
OCR / Layout 3 - 10 分鐘 頁面可並行 取決於 OCR 供應商排隊、掃描品質與是否啟用 layout parser。
文件分類 30 秒 - 2 分鐘 文件可並行 ID、戶口簿、退伍證、財力證明、畢業證等分類。
欄位抽取 JSON 2 - 6 分鐘 文件可並行 抽取姓名、生日、證件號、地址、日期、關係與來源頁碼。
翻譯草稿 4 - 12 分鐘 文件可並行,最後合併 依公司 Word 範本與術語表生成中文證件英文翻譯草稿。
第二 AI 審核 3 - 8 分鐘 文件可並行 檢查漏翻、姓名、日期、證件號、低信心字與格式風險。
疑點清單與 Word draft 生成 1 - 3 分鐘 案件級 生成待審 Word、review workbook / checklist、audit package。
員工人工 Review 35 - 90 分鐘 可多人分工 標準案件 35-60 分鐘;掃描差、戶口簿複雜、財力文件密集時抓 60-90 分鐘。
NAATI 人員 final check / 蓋章 10 - 30 分鐘 通常案件級 確認 final responsibility、每頁 stamp / digital stamp、輸出最終文件。

Risk Control

風險與控制點

不能自動宣稱 certified

AI 只能生成 draft。最終翻譯件、stamp、日期、譯者資訊與每頁格式需要由具備權限的人確認。

低信心內容必須標記

模糊掃描、手寫、印章、戶口簿關係、日期格式、姓名拼音都應進入 review required。

資料治理要先做

護照、身份證、財務證明屬高敏資料。上雲前要有遮罩策略、供應商紀錄與 audit log。

術語表比長 prompt 更重要

把人工修正沉澱為 glossary、template、validation rule,不要讓模型直接從客戶資料自動學習。

Delivery Roadmap

MVP 落地路線

  1. Week 1-2

    基礎框架

    建立 case intake、Drive folder 讀取、檔案 hash、audit log、文件清單與權限控管。

  2. Week 3-4

    OCR 與分類

    串接 OCR,完成常見中文證件分類、頁面渲染、低信心頁標記。

  3. Week 5-6

    翻譯草稿與審核表

    建立 Word 範本填充、術語表、翻譯 JSON schema、疑點清單與 reviewer edit log。

  4. Week 7-8

    試點與校準

    用 20-50 個歷史案例測試準確率、人工審核時間、重跑率與成本。

References

資料來源

以下來源用於報告中的規範、服務能力與價格估算。正式上線前仍應在採購當日重新確認價格與合約條款。