金融保險:深度學(xué)習(xí)——挑戰(zhàn)、偏見與路徑(下篇)
“中央財經(jīng)大學(xué)金融科技書系”第一本書《金融保險:深度學(xué)習(xí)》,在2018年底終于正式出版,這是中央財經(jīng)大學(xué)中國精算研究院金融科技中心的又一力作。金融科技中心的成員主要有張寧博士、陳輝博士,主要聚焦于大數(shù)據(jù)、人工智能、區(qū)塊鏈在金融和保險中的應(yīng)用,已經(jīng)開發(fā)上線“保險大數(shù)據(jù)APP”、“金融腦”金融人工智能平臺,“中央財經(jīng)大學(xué)金融科技書系”也將陸續(xù)出版。 近年來,“中央財經(jīng)大學(xué)金融科技書系”編委會成員先后出版了多本金融科技相關(guān)的專業(yè)書籍,為此,我們梳理了一套金融科技書系,希望通過金融科技書系去理清金融科技的發(fā)展脈絡(luò),去提升金融科技的認知能力,去改變我們的思維方式,去升華我們的智慧。 “中央財經(jīng)大學(xué)金融科技書系”編委會成員專注于金融科技研究,我們不僅僅是一個團隊,而是連接金融領(lǐng)域研究力量和人工智能大數(shù)據(jù)等領(lǐng)域研究力量的平臺,希望“中央財經(jīng)大學(xué)金融科技書系”的每一本書都開啟一個“認知革命”的故事,一個“預(yù)見未來”的故事,成為金融科技理論研究與實踐探索領(lǐng)域創(chuàng)新篇章的動聽音符。 下面我給大家介紹張寧博士所著的《金融保險:深度學(xué)習(xí)》的一些內(nèi)容“人工智能+金融:挑戰(zhàn)、偏見與路徑”,因內(nèi)容比較多,我將分上下兩篇來介紹。上篇:【挑戰(zhàn)】【偏見】下篇:【路徑】盡管金融仿佛在不斷地與人工智能融合,但是,真實的情況更加復(fù)雜。 人工智能更像一個刺猬,在金融業(yè)務(wù)的很多外端,越來越多的人工智能得以應(yīng)用,并發(fā)揮出效率優(yōu)勢,例如,越來越多的金融中的投資顧問和保險顧問等,但是,這些都起到輔助的作用。 人工智能仿佛只能給金融行業(yè)打工,但是,不能成為股東,也就是說,金融行業(yè)的核心技術(shù)與人工智能還有相當(dāng)?shù)木嚯x。金融業(yè)本身是數(shù)學(xué)風(fēng)險的行業(yè),或者說是在不確定的條件下,進行資本資產(chǎn)配置和定價,其核心是風(fēng)險管理、資本資產(chǎn)配置和定價,但這些仿佛離人工智能還很遙遠。 可以預(yù)計,金融與人工智能的融合將分三個階段進行: 第一個階段——科技賦能階段,這個階段強調(diào)的是場景應(yīng)用,是其他領(lǐng)域成熟的人工智能技術(shù),平行地應(yīng)用在金融里面,來提升業(yè)務(wù)某些環(huán)節(jié)的效率。 第二個階段——科技增能階段,這個階段強調(diào)的是模型的應(yīng)用,但由于這些模型直接應(yīng)用會帶來合規(guī)風(fēng)險,所以,我們預(yù)計這個階段會產(chǎn)生大量為金融行業(yè)服務(wù)的第三方專業(yè)服務(wù)。這個階段是主動的,金融行業(yè)認識到人工智能的特點以及優(yōu)勢,主動在業(yè)務(wù)環(huán)節(jié)中應(yīng)用人工智能,獲得效率提升,甚至改變業(yè)務(wù)方式。 第三個階段——科技產(chǎn)能階段,這個階段的特點是價值應(yīng)用,這一類的金融核心業(yè)務(wù)將進行人工智能化,人工智能將成為金融核心價值的創(chuàng)造手段之一,甚至成為主要的創(chuàng)造手段,這個階段也要求監(jiān)管智能化。 2010~2030年人工智能的路徑如圖2所示。
圖2 2010-2030年人工智能的路徑 在科技賦能階段,很多都是場景應(yīng)用,例如,程序化的交易量化投資,也看到基于車聯(lián)網(wǎng)的保險的動態(tài)定價,還有顯卡用于金融計算,筆者的團隊在這方面也做了一些工作,將其他行業(yè)成熟的自然語言理解技術(shù),平行地應(yīng)用到金融領(lǐng)域中。例如,為實現(xiàn)相應(yīng)的金融報告、行研報告的理解和特征抽取,經(jīng)過大量的訓(xùn)練,可以自動生成相應(yīng)的行業(yè)報告或者符合規(guī)則的金融報告。 在科技增能階段,一些相關(guān)研究成果也成為本書中的內(nèi)容,例如,基于手背紋理的生理年齡的區(qū)別與健康狀態(tài)的評價、混合步態(tài)以及身材等參數(shù),這種遠程評價可以大幅度提升效率,可以用于健康險或者人身險的定價,也可以用于金融的偏好識別和估計。 對金融的偏好識別,我們使用了大量的數(shù)據(jù),風(fēng)險偏好就不再是簡單的、固定的,而是動態(tài)變化的了,例如,身材、健康狀態(tài)以及衰老的狀態(tài)都會影響風(fēng)險偏好,這些風(fēng)險偏好最終會影響金融的投資和判斷,使用的模型是循環(huán)神經(jīng)網(wǎng)絡(luò)和卷積神經(jīng)網(wǎng)絡(luò)以及注意力模型。 我們還在金融欺詐識別方面做了一些工作,不管是保險中的欺詐還是投資信貸方面的欺詐,有許多信息可以捕捉到欺詐的概率,我們使用Res Net(這就是谷歌的Alpha Zero的技術(shù)網(wǎng)絡(luò))來處理這些信息,從而獲得欺詐的識別。在這個過程中,我們可以評價一些如衰老的風(fēng)險指數(shù)以及身材的指數(shù),這里衰老的風(fēng)險指數(shù)并不是指老年人口占多少,而是通過步態(tài)、心理等多方面的數(shù)據(jù)來分析整體人群的健康狀態(tài)。 在科技產(chǎn)能階段,這是金融和人工智能真正融合的核心,它必須要突破三個最核心的障礙,金融才能完美地擁抱人工智能。按照影響程度排序: 第一個障礙,也是最重要的障礙就是可解釋性,也就是要克服新一代人工智能的黑箱問題。 第二個障礙,就是不確定條件下的人工智能,或者說是人工智能處理風(fēng)險的能力。 第三個障礙,就是金融中的通用學(xué)習(xí)有沒有可能。 從來沒有一個行業(yè)像金融這么迫切需要人工智能的可解釋性,而這恰好也與深度學(xué)習(xí)的黑箱特征有關(guān),這里的根本原因在于,世界各個國家以及組織對金融都是進行監(jiān)管的,金融業(yè)牽一發(fā)而動全身,一旦發(fā)生系統(tǒng)性金融風(fēng)險,將會波及諸多經(jīng)濟和政治,2008年金融危機就是這樣的例子。 這就要求金融業(yè)務(wù)的過程應(yīng)該是透明的。若不能告訴監(jiān)管機關(guān),這些結(jié)果就都是由一個黑箱得出的。盡管金融是在不確定條件下處理問題的,但處理機制不應(yīng)該是黑箱,否則一個由諸多黑箱組推動的行業(yè),將會產(chǎn)生重大的系統(tǒng)性風(fēng)險。 就如對保險產(chǎn)品來說,客戶本身也關(guān)心為什么一個36歲的人買這款產(chǎn)品要比25歲的人價格高,你不能告訴客戶這是一個深度網(wǎng)絡(luò)給出的結(jié)果,而應(yīng)該告訴他,36歲的人死亡率比較高。同樣對風(fēng)險也是這樣,公司的管理層或者董事會想知道風(fēng)險的特征是什么?影響風(fēng)險的這些因素到底是如何影響風(fēng)險的?這都是當(dāng)前深度網(wǎng)絡(luò)面臨的核心問題。 我們給出了一個嘗試性的方案,這個方案稱為網(wǎng)絡(luò)探針。深度網(wǎng)絡(luò)某種程度是黑箱,所以,我們通過信息幾何和符號計算的基礎(chǔ)數(shù)學(xué)理論,設(shè)置一些相應(yīng)的探針,由此來發(fā)現(xiàn)這個黑箱的運作機制,并結(jié)合精算的極端估計,給出這個黑箱異常行為的可能性判斷。這就如同我們想知道一個烤地瓜熟沒熟,最好的方式是用溫度計插入到不同深度來看一下溫度,同時,我們還不希望這個地瓜某些部位糊掉,也就是說,我們還關(guān)心它的極端風(fēng)險。這些都是金融行業(yè)需要的,同時,也可以用于其他行業(yè)。網(wǎng)絡(luò)探針示意圖如圖3所示。
圖3 網(wǎng)絡(luò)探針示意圖 有了這樣的技術(shù),金融行業(yè)應(yīng)用人工智能應(yīng)該有這樣的迭代關(guān)系,也就是說,從成熟的金融模型開始,考慮大量潛在的非結(jié)構(gòu)化數(shù)據(jù),通過使用機器學(xué)習(xí)或者深度學(xué)習(xí)模型,捕捉這些數(shù)據(jù)的信息,然后,通過前面提到的探針技術(shù)、稀疏結(jié)構(gòu)、注意力機制發(fā)現(xiàn)一個初步可解釋的模型,將這個模型用于成熟模型的子模型,如此迭代,實現(xiàn)金融核心技術(shù)與人工智能的結(jié)合。 但是,該技術(shù)仍然是基于工程的方法,在書中我們介紹了金融深度學(xué)習(xí)可解釋問題的數(shù)學(xué)工具“信息幾何”。目前看來,它是最后可能解決該核心問題的有效工具。 人工智能把握風(fēng)險的能力,實際上是我們對人工智能網(wǎng)絡(luò)風(fēng)險能力持有的懷疑態(tài)度。 我們用1年多的時間做了強化學(xué)習(xí)在投資中的應(yīng)用,這里訓(xùn)練出的“投資腦”,完全沒有人類的投資經(jīng)驗,而是通過市場反饋形成了自己的邏輯。 我們做了整體的對比,做了一個長期的投資計劃,這里面有三個選手: 選手1:優(yōu)秀的投資經(jīng)理。 選手2:當(dāng)前很火熱的量化投資程序,注意,這里的量化程序并不是人工智能,而是指基于規(guī)則的量化投資,也就是說,不需要人為干擾,它可以幫助人類實現(xiàn)規(guī)則錨定的投資方案。 選手3:我們基于強化學(xué)習(xí)、繼續(xù)強化學(xué)習(xí)和訓(xùn)練的金融大腦,這個金融大腦從開始就沒有受到人類的規(guī)則限制,而是通過自己近百萬次的學(xué)習(xí)(這里面當(dāng)然要有一些技巧,因為使用谷歌提出的技術(shù)成本太大),然后,在300多個交易日,形成了200多次交易,我們對此進行了分析,希望從中得到人工智能對風(fēng)險把控的能力判斷。 通過最終的投資記錄比較,我們可以發(fā)現(xiàn)如圖4示的結(jié)論。