多模態中文資訊與情感分析平台於金融科技之應用
Applications of Multimodal Chinese Information and Sentiment Analysis Platform in Fintech
大家好,這是臺北醫學大學自然語言處理研究團隊,介紹多模態中文資訊與情感分析平台於金融科技之應用。隨著金融科技的創新發展以及人工智慧科技的普及,有越來越多的銀行已經展開雙臂擁抱FinTech。然而,大量的非結構化資料,加劇了金融科技的挑戰,其中,又以文字型態的資料最為棘手。此外,在臺灣的環境中,正體中文能使用的解決方案非常有限。
有鑑於此,本研究團隊專為正體中文打造了『多模態中文資訊與情感分析平台』,企業能透過這樣的平台獲得完善的金融文本分析方案,從超載的金融文本資訊中萃取出關鍵的資訊,進而提高語意理解之準確性,提供客戶更智慧且便捷的金融服務,也能讓分析師更快掌握市場局勢。
以下讓我們逐一介紹。
MONPA是本團隊所研發的正體中文剖析器,除了斷詞功能之外,同時也擁有詞性標註以及專有名詞辨識等多項功能。MONPA是採用最新的BERT語言模型,透過百萬級的訓練語料進行大規模的訓練,且在眾多的公開評測資料上獲得傑出的成績。
在實務面上,MONPA具有相當可靠的品質,而且已有眾多的使用者,且在Github上已擁有231顆的星星數。有了MONPA之後,將加速正體中文自然語言處理的發展與產業應用。
這樣的一個技術能夠分析文本資料的情緒構面,縝密地給予詞彙情感分級與強弱指標得分,讓文字的情感分析更為細緻化,對於未知詞彙也能有出色的辨識效果。這樣的方法已經擴展至智能客服,成功地幫助電商企業快速掌握用戶對產品的回饋,如此一來除了能節省人力成本之外,更能夠貼近消費者使用感受,讓產品更加優化。此外,基於本系統能擁有精緻的正體中文斷詞以及細膩的情感分析的技術之條件下,我們將其融合到對話生成的技術中,達到具有情感回饋的多輪對話互動,不僅能提升電商用戶體驗,更能將技術延伸至金融業,打造人性化的智能客服。
首先介紹的應用是,我們將所研發的『多模態中文資訊與情感分析平台』應用於探索金融新聞、財報、社群媒體、分析師報告中的數字意涵,例如:判斷金融文本中的數字與是否與股票有關係?甚至進一步辨識這個數字屬於什麼樣的類別關係。透過MONPA將金融文本進行中文斷詞之後,並擷取出目標數字的前後的語意脈絡,進一步將其融合到最先進的BERT語言模型中。透過本研究團隊的方法,能能大幅提升預測效能,進而能夠精準的分析金融文本資料中數字所代表的意涵,這樣的成果能有效地協助企業及投資人探索金融文本資料中關鍵且豐富的資訊。
NLP不僅可以使用在金融業上 提升客戶的使用品質,在預防金融犯罪上也有很大的幫助。
近年來因國際洗錢事件頻傳,國內吸金、電信詐騙案件也層出不窮,使得政府與各產業都致力於洗錢防制的(AML)工作。我們的方法先從大量的新聞中篩選出,與金融犯罪相關主題的文本,再從中進一步辨識出金融犯罪嫌疑的黑名單。透過AI的協助定期更新AML焦點人物名單,並搭配自動化比對,這樣一來可以大幅降低銀行執行AML作業的人力與時間成本。
一般而言,醫療診斷證明會因為醫院或醫師書寫的習慣而有所差異,保險業者需要花費大量的人力與時間,分析評估這樣非結構化的報告內容再做出正確的決策及理賠。有鑑於此,近年來,NLP技術也逐漸受到保險業者的重視,期盼能藉此加速保險理賠的效率。
透過我們的技術,只需輸入診斷書,系統就會自動閱讀並精準地擷取手術名稱、日期等醫療診斷關鍵資訊,給予保險理賠的決策建議,讓客戶享受更快、更有效率的理賠流程。
自然語言處理(NLP)可說是FinTech的基石,相信金融結合語義理解的技術應用 將會有更廣闊的發展空間,透過本研究團隊所研發的『多模態中文資訊與情感分析平台』帶領FinTech 邁向新的視野。
![](https://i.ytimg.com/vi/8TwgdZW-nOM/mqdefault.jpg)