在金融文檔智能識別領(lǐng)域,大模型的泛化能力為金融業(yè)務(wù)自動化帶來了無限遐想,用大模型進(jìn)行OCR識別,可以輕松抽取任意文檔版式。
然而,這也帶來了新的問題,大模型如果不經(jīng)過二次開發(fā),滿足不了數(shù)據(jù)溯源需求。當(dāng)模型從識別出一個關(guān)鍵財務(wù)數(shù)據(jù),卻常常無法提供該結(jié)果在原文中“所見即所得”的絕對證據(jù)。
對于任何需要存檔、審計、追責(zé)的嚴(yán)肅文檔處理工作,這種“看似正確”但無法溯源的識別結(jié)果,是合規(guī)體系中一個無法容忍的斷點,基本不能滿足生成需求。
想象以下場景:
●信貸審批: 根據(jù)一份復(fù)雜的財報,建議拒絕一筆貸款。當(dāng)審批人員追問“具體是財報中哪一項數(shù)據(jù)導(dǎo)致此結(jié)論”時,通用大模型只能給出一個基于概率的模糊解釋,而無法指向原文的具體條款。
●保險理賠: AI自動從醫(yī)療記錄中提取了理賠金額。在后續(xù)的賠付爭議中,如果無法提供該金額在幾十頁醫(yī)療報告中原始出處的鐵證,保險公司將陷入巨大的法律和財務(wù)風(fēng)險。
●合規(guī)審計: 監(jiān)管機(jī)構(gòu)前來審查,要求提供某項交易決策所依據(jù)的合同條款。如果AI系統(tǒng)無法提供從決策結(jié)果到合同原文的清晰映射,企業(yè)將可能面臨巨額罰款。
對于金融行業(yè)而言,其可解釋性和可復(fù)核性更為關(guān)鍵。一個無法被審計的AI,無論多“智能”,都是一個不可用的系統(tǒng)。
易道博識智能文檔處理平臺(簡稱DeepIDP),通過大小模型協(xié)同的架構(gòu),提供全面的文檔處理能力,值得一提的是,智能文檔處理平臺支持字段級數(shù)據(jù)溯源。
這個功能在實踐中意味著:
當(dāng)業(yè)務(wù)人員、風(fēng)控官或?qū)徲媶T查看系統(tǒng)從一份長達(dá)50頁的招股說明書中抽取的“承諾發(fā)行總額”字段時,DeepIDP即可立刻在原始文檔的PDF影像上,高亮框選出該數(shù)字所在的具體段落、表格和位置。
這種所見即所得的溯源能力,帶來了三大核心價值:
1.結(jié)果可復(fù)核: 將AI的“黑箱”操作,變?yōu)橐粋€完全透明、可供人工快速驗證的“白箱”流程。
2.過程可追溯: 建立起從結(jié)構(gòu)化數(shù)據(jù)到非結(jié)構(gòu)化原文的完整證據(jù)鏈,讓每一次AI處理都有據(jù)可查。
3.全面可審計: 完美滿足監(jiān)管部門對系統(tǒng)決策可解釋性的要求,讓企業(yè)放心大膽地將AI用于核心業(yè)務(wù)。
問題1:小模型會被大模型徹底取代嗎?
回答: 不會。在可預(yù)見的未來,兩者將長期共存。小模型在特定任務(wù)上的效率、成本和穩(wěn)定性優(yōu)勢是通用大模型難以企及的。未來的趨勢是大小模型的深度協(xié)同,而非替代。
問題2:如何判斷一個文檔處理任務(wù)應(yīng)該用大模型還是小模型?
高頻標(biāo)準(zhǔn)文檔用OCR小模型:每日需要處理數(shù)萬張的增值稅發(fā)票、身份證、銀行流水或標(biāo)準(zhǔn)化的入庫單。
長尾低頻文檔用大模型:需要審核的商業(yè)合同、法律文書、非標(biāo)業(yè)務(wù)申請表、市場研究報告等。這些文檔可能每天只處理幾十份,但每一份的版式和語言風(fēng)格都可能不同。
DeepIDP在底層集成了小模型推理引擎和大型模型推理引擎。該架構(gòu)可以根據(jù)任務(wù)的復(fù)雜度和需求,自動調(diào)度最合適的模型進(jìn)行處理,對外提供標(biāo)準(zhǔn)化的服務(wù)接口。
這種融合架構(gòu)屏蔽了底層模型的差異,實現(xiàn)了“無感調(diào)用”,用戶無需刻意區(qū)分某個識別能力是由大模型還是小模型提供,只需專注于自身業(yè)務(wù)需求即可。