撰文 | 吳坤諺
編輯 | 吳先之
(資料圖)
8月31日,首批大模型產品將陸續通過《生成式人工智能服務管理暫行辦法》(以下簡稱《暫行辦法》)備案,可正式上線面向公眾提供服務。
包括百度文心一言、抖音云雀大模型、智譜AI的GLM大模型、中科院的紫東太初大模型、百川智能的百川大模型、商湯的日日新大模型、MiniMax的ABAB大模型、上海人工智能實驗室的書生通用大模型、科大訊飛星火大模型,以及華為、騰訊的大模型產品,共計11家。
懸而未決的政策準入已然落地。而通過備案的主體包含了互聯網大廠、AI獨角獸、科研國家隊三方,也基本明確了國家對不同主體路徑的肯定。
據上海申浩律師事務所對《暫行辦法》進行了解讀,《暫行辦法》的規制重點在于服務應用層的信息內容安全,限制境外AIGC提供服務。更重要的是,《暫行辦法》對境外AIGC的限制不包括垂直領域如工業、科研等場景,只要其不向公眾提供服務。
換言之,目前《暫行辦法》備案的關鍵在于“向公眾提供服務”。這對于大模型企業而言,顯然可以優先在面向C端的模型應用中積累用戶、數據,更利于產品打磨。而未通過備案的企業組織也不會因此在研發上遭遇阻礙,反而在能獲取海外AIGC調用能力的情況下,技術演進的進程有可能相對更快。
這或許會引發大模型玩家們形成落地偏向與技術偏向兩條路徑。
更值得注意的是,通過備案、面向公眾提供服務的資質顯然加快了金融、教育、法律等嚴肅場景的模型落地的進程。
以金融大模型為例,金融領域合規先行的特點一度限制了模型能力在實際業務中的應用,導致行業整體處于場景探索的階段。而今首批模型產品獲批開放,金融大模型賽道的轉折點也已到來。
明面務虛,私下務實
今年3月,頭部財經資訊公司彭博社發布了專門為金融領域打造的大模型BloombergGPT,試圖將其積累40年的財經資訊數據價值得到釋放。
彼時的彭博社可能沒有想到,金融在大洋彼岸已經成為垂直領域大模型的搶跑者。
盡管早在彭博社開始著手搭建訓練BloombergGPT前,已有不少研究表明使用特定領域數據訓練的垂直大模型能在特定領域效果拔群,但當行業大模型的風吹到我們這時,有吸引力讓垂直領域公司投身大模型,而非等待整體解決方案的似乎只有金融一家。
早在今年5月,度小滿便發布了自研千億參數金融大模型“軒轅1.0”,目前“軒轅2.0”已開源。奇富科技、馬上金融、螞蟻集團等金融科技企業緊隨其后,先后組建了自研大模型團隊并投身其中。
當然,金融領域外的互聯網大廠與科技公司也希望就金融大模型分一杯羹,去年10月于科創主板上市的大數據企業星環科技同在5月推出面向金融量化的大模型“無涯”,騰訊云、科大訊飛、恒生電子等玩家也就金融領域的風控、客服等細分賽道推出自己的大模型解決方案。
金融一直是前沿科技希望結合與落地的垂直領域,甚至可以說金融史中暗藏著科技史的發展脈絡。早在2016年為國際金融穩定理事會(FSB)定義的金融科技迎來大模型這一輪風口,當下局面其實并不出人意料。
無論是面向消費者市場與小微企業的金融普惠、面向金融機構的智能投研還是面向投資者的大數據洞見,大模型在金融領域的應用都有充足空間嵌入并釋放價值。
大模型作為繼互聯網、移動互聯網后的第三波浪潮,再次將金融機構拉回同一起跑線。
有BloombergGPT這個基礎案例珠玉在前,為金融大模型的落地指明方向。總體看來,目前金融大模型的落地方向有以下幾大類,幾乎囊括了金融領域的方方面面:1、大數據風控的進一步迭代
2、金融相關文本生成,如財報、新聞、評論等
3、輔助決策的智能投顧、智能投研與輔助運營的智能客服
4、金融行業的“copilot”,包含債券發行、IPO、審計、評級等金融業務
當方向明朗之時,落地成果便成為檢驗產品的唯一標準。只是我們可以在公開信息中聽到不小的聲量,但卻沒法尋到落在實處的案例。這并非玩家們“藏拙”,而是金融大模型在落地途中不斷遭遇兩方面的掣肘:技術不成熟與場景不適配。
某公募基金經理告訴光子星球,金融大模型真正能落地應用的功能較少,且落地場景集中在中后臺的客服、新聞播報等較為簡單的to C生成式內容上。
“面向C端投資者的券商會應用多些,我們基金機構的監管更加嚴格,所以對創新會保持關注,這種新技術應用落地一般會滯后很多”,該基金經理稱。
或許機構視角更為審慎,可是在互聯網大廠視角下,金融大模型的八字依然沒一撇。
一位騰訊高級架構師直言,金融大模型的應用還需要探索場景,明確的賽道僅智能客服、輔助編程等寥寥幾項。在“模型在具體場景的打磨還有許多工程性問題未決”的前提下,應用與商業化還無從談起。
上述人士表示,“技術成熟度、場景適配性兩個問題解決后,行業需求和產業共計之間還需要找到一個投資回報的平衡點。應用推廣除了是技術問題外也是商業問題。”
或因如此,盡管金融大模型的風吹了一陣又一陣,我們也未能在各大對應用與理論侃侃而談的發布會、論壇中看到真正應用在金融場景的大模型案例,基本上是技術較為成熟的風控場景與封閉性較強的智能客服。
這并不奇怪,金融領域本身存在大量時效數據,結合當下大模型普遍存在生成內容不可解釋性,面對以嚴謹著稱的金融行業,碰壁是可想而知的事。
正如國家金融與發展實驗室副主任楊濤撰文指出那般,當人工智能大模型在金融領域應用時,更需關注大模型的可審計性、可解釋性等難題以及參與金融活動引發的風險特征變化、數據保護、責任分擔、合規邊界等問題,并強化數據倫理、算法倫理、主體倫理、行為倫理等方面的治理。
合規先行者已經出現,但合規也無法完全解決金融大模型的既有問題。唯有褪去光環,我們才能更好地梳理金融大模型的前世今生和未來,找到大模型在金融領域搶跑的答案。
回歸提效本質
我們簡單回顧此前的金融科技創新,不難發現暢想中的大模型應用早已存在,不過一直處于“雛鳥”的狀態。
例如金融科技業務中占核心地位的智能投研便誕生于2016年前后,而迄今為止稱得上成熟且步入商業化的應用還是處于較初級的階段——金融數據與資訊終端,例如Wind、ifind等SaaS金融資訊軟件,定位是為業內外人士提供垂直信息平臺。
更進一步的應用也早已沒了聲音,就像曾被標普500以5.5億美金收購,如今泯然眾人的智能投研企業Kensho。
“金融數據信噪比太低了,和工業界的數據相比是數量級的差距。再考慮到金融數據的時序性與時效性,無論是機器還是人都難以找到可持續的模式。AI可以根據風險邏輯去拿Beta(與市場相關的可預測收益),但一直很難拿到Alpha(與市場不相關的超額收益)”,一位業內人士直言。
據多位業內人士介紹,金融數據經NLP(自然語言處理)提取后交由機器學習,將成果以預輸入的投資規則在智能化交互界面輸出是幾年前的智能投研范式。大模型的引入不過是加強了機器學習的記憶、決策等能力,而且輸出的結果,按從業者的話說是“跟蒙眼投資差不多”。
實際上,大模型為金融行業帶來的并不止是單獨業務能力的躍升,而是大模型的“large”所提供的泛化能力。
金融機構在過去智能化進程中,早已在風控、投研、投顧、評級等業務線構建模型與中臺,輔助從業者推進業務的同時也在不斷積累文本數據。而大模型的出現提供了一個將打亂的中臺整合為一體的契機,既不需要多次建模也能打破各中臺之間的數據孤島。
最終呈現是以金融大模型為底座從而整合并不斷延展機構的能力,好比阿里曾經在組織變革中提出的“大中臺,小前臺”。
于金融機構而言,這不僅是效率的提升,更是效益的躍升。當然,如今距離這項堪稱“圣杯”的目標還有不小的距離,而大模型相對早先NLP、CV時期的能力演進已經在部分業務中得以體現。
以ESG資管企業秩鼎為例,其創始人劉相峰稱,秩鼎的金融大模型能力應用正逐漸鋪開,目前已在初級的數據收集整理與研究工作上做到了人效躍升。雖然ESG與傳統金融存在一定距離,尤其是在數據信噪比方面,但作為為數不多的落地案例,有一定參考價值。
據了解,秩鼎的內部模型訓練采用的同樣是“預訓練——精調(STF)——對齊(RLHF)”的范式,不同之處在于其實體識別系統可以將初步提取后的ESG相關事件匹配到唯一主體上。這對于模型知識圖譜的構建,尤其是中文領域是一次不小的進步。
結合BloombergGPT僅以500億參數規模做出一定效果,我們或許可以下一個判斷:即金融大模型乃至行業大模型的落地收效如何,看的不一定是大力煉丹,而且訓練精調以及應用工作流后的一些細小動作。
例如軒轅2.0在常規垂直模型訓練混合大量通用數據,避免災難性遺忘導致模型“變笨”,還在此基礎上將預訓練的數據以及指令微調數據進一步混合,其論文中將這種把預訓練和精調融為一體的范式稱為Hybrid-Tuning。
未來的范式演進我們猶未可知,但這細小的每一步都在為模型與金融行業提效,推動行業向實處走去。
金融大模型破曉前
金融大模型已經來到了價值釋放的前夕。
政策準入一定程度上打消了場景方面的顧慮,更多能力可以在實際業務中得到應用,而技術成熟度亦在細小創新中緩慢提升。在破曉前的微妙階段,金融大模型的商業模式與格局的前瞻性思考是有必要的。
結合《暫行辦法》中對公眾開放服務的審慎態度,接下來一段時間的金融大模型大概率不會過早向C端釋放其能力,而是在內部業務的應用試錯中迭代。
這意味著當下各個機構的研究部門更多會“刀刃向內”,試圖于工作流中提升研究工作的效率和效益,圍繞研究業務本身展開。而且出于數據隱私等方面的考量,在模型部署上會更看重私有化部署甚至是端側部署。
即使存在自主可控的強需求,讓每一家金融機構都從零開始儲備算力、招募人才并訓練機構的大模型,也顯然是不現實的。更大的可能是由資源更多的主體或是基于某一底座或是完全自主構建出金融大模型,再以服務的方式就模型做私有化部署。
所以我們也不難發現度小滿、奇富、馬上金融、螞蟻等金融科技頭部紛紛投身自研模型的原因:并非只是自身已有充分的技術與數據儲備,而是前方有大量存在確定性需求的中小金融機構客戶。
B端應用方面,接入模型能力后的工作流勢必也將發生改變,就像Kensho曾揚言“用AI干掉證券分析師”,屆時金融機構的組織制度也將生變。
當機構內技術團隊不斷壯大,技術演進讓內部效率達到一定高度后,屆時金融大模型才可以強調業務的外部性。將價值釋放面向的群體由B端轉為C端,例如幻覺問題可控后,具備可解釋、可溯源的AI投資能力。不過這一階段的到來顯然還需要很長的時間。
無論如何,合規進程在《暫行辦法》的實施與備案中已前行一大步。冰山之下,各家金融大模型已蓄勢待發,我們很可能在接下來的9月感受到國內大模型行業,繼4月密集發布、6月垂直轉向后的一個新節點。大模型的下一戰——金融,市場等待玩家們的答案。