在信創背景下,金融機構系統遷移面臨一個現實,底層硬件體系多樣化,例如C86+DCU、ARM+昇騰等。如果上層應用軟件(如核心業務系統中的OCR識別引擎)每次適配一種新硬件,就需要開發和維護一個獨立的軟件版本。
這會直接導致以下問題:
●開發成本激增: 每適配一種硬件組合,都意味著一次獨立的開發、測試和部署流程。
●運維成本失控: 運維團隊需要同時維護多個軟件版本,版本管理混亂,排查問題異常困難,人力成本和系統風險上升。
●投資無法延續: 當底層硬件再次升級換代時,之前的軟件投資很可能作廢,需要推倒重來,造成資源浪費。
一個原生適配、統一架構的平臺是解決上述問題的關鍵。例如易道博識的智能文檔處理平臺(簡稱DeepIDP),它的核心價值在于,從軟件底層就完成了對所有主流國產化硬件的適配。
1. 如何降低維護成本?
僅需一套軟件版本: 運維團隊只需要面對一個統一的軟件架構。無論底層是哪種國產芯片或服務器,上層的AI能力和應用都是一致的,告別版本混亂。例如, 某銀行的核心系統同時在ARM和C86兩種架構的服務器上運行。通過統一平臺,他們部署的是同一套DeepIDP軟件,開發和運維團隊無需再為不同架構維護兩套代碼,人力成本降低了至少50%。
2. 如何保障投資的連續性?
平滑遷移: 統一架構確保了AI能力的投資是可延續、可擴展的。未來即使信創硬件再次迭代,上層的智能應用也無需重構,可以平滑遷移,保護了前期的IT投資。
金融業務涉及的文檔類型極其復雜,從版式固定的身份證、發票,到版式千變萬化的業務申請單、對賬單。單一模型難以勝任所有場景。
一個常見的誤區是認為一個強大的大模型就能解決所有問題。 實際上,最高效的策略是“大小模型協同”。
●專用小模型:處理高頻、標準文檔
任務: 識別身份證、銀行卡、發票、車票等版式固定的文檔。
優勢: 速度極快、精度極高、資源占用小,最適合處理業務流程中出現頻率最高的標準化單據。
●大模型:處理非標、長尾文檔
任務: 識別各類申請單、合同、對賬單、醫療單據等版式不固定、字段靈活的復雜文檔。
優勢:
■靈活抽取: 僅需通過提示詞(Prompt)告知模型需要抽取的字段(如“抽取合同中的甲方和簽約日期”),即可從任意版式中提取信息。
■金融領域優化: 經過金融行業數據二次訓練的大模型,能更精準地理解復雜表格和上下文,抽取精度更高。
■數據可溯源: 這是保障業務可信度的關鍵。平臺能將抽取的每一個字段(如JSON結果中的一個數值)精確關聯回原始影像的具體坐標位置,方便人工核驗和審計。
僅僅提取出數據是不夠的,核心是要讓AI能力融入業務,實現端到端的自動化。
1. 如何讓AI智能體(Agent)按需調用? 易道博識智能文檔處理平臺提供一系列“AI原子能力”(如文檔分割、分類、各類識別模型等),讓智能體可以像調用工具一樣靈活使用。
例如:財務報銷審核Agent
○分割與分類: Agent首先調用“圖像分割”與“文檔分類”能力,將一疊報銷單據自動拆分,并識別出哪些是發票,哪些是報銷申請單。
○分發與抽取: 接著,Agent將發票分發給“小模型”快速提取金額、日期;將報銷申請單分發給“大模型”抽取報銷事由、部門等信息。
○推理與決策: 最后,Agent利用大模型的推理能力,結合企業財務規則(如報銷金額是否超標),自動輸出“審核通過”或“駁回”的結論。
問題1:這套OCR識別系統支持哪些具體的國產硬件和操作系統?
回答: 易道博識智能文檔處理平臺從底層架構原生適配主流國產化硬件,全面兼容C86+DCU、ARM+昇騰等多種信創體系,并支持麒麟、統信等國產操作系統。其核心優勢在于,無論底層硬件如何組合,提供給上層應用的都是統一、穩定的服務接口。
問題2:大模型處理金融行業復雜表格的精度如何?
回答: 精度主要通過兩方面保證:首先,智能文檔處理平臺選用的大模型是經過海量金融行業特有文檔(如復雜對賬單、年報、招股書等)進行二次訓練和微調的,使其能更深刻地理解金融領域的上下文和版式。其次,其強大的溯源能力可以將每個抽取結果精準定位回原文,極大地方便了人工核驗,形成了一個“AI處理+人工校驗”的質量閉環。