大模型表現(xiàn)出的強(qiáng)大理解、生成和推理能力,讓各行各業(yè)開始探索其落地應(yīng)用。
中關(guān)村金融科技產(chǎn)業(yè)發(fā)展聯(lián)盟專家委員會(huì)主任委員周延禮在公開場合表示,隨著深度學(xué)習(xí)和人工智能算法的發(fā)展,算力的不斷提升以及數(shù)據(jù)的積累,人工智能與各行各業(yè)逐步結(jié)合、融合發(fā)展,成為新興經(jīng)濟(jì)發(fā)展的重要力量。
結(jié)合企業(yè)的具體實(shí)踐,科技界人士普遍認(rèn)為,在當(dāng)前探索可研和試點(diǎn)應(yīng)用階段,企業(yè)一般從大模型訓(xùn)練和微調(diào)入手,而基于大數(shù)據(jù)量、大規(guī)模參數(shù)進(jìn)行的大模型訓(xùn)練,需要消耗大量算力資源。可以說,算力日益成為數(shù)字經(jīng)濟(jì)的新型生產(chǎn)力,作為算力的重要組成部分,存力的價(jià)值也日益凸顯。
金融機(jī)構(gòu)落地大模型的關(guān)鍵點(diǎn)是什么?存力價(jià)值如何提升?根據(jù)《金融行業(yè)先進(jìn)AI存力報(bào)告》(以下簡稱《報(bào)告》),構(gòu)建可用、可信、可控的先進(jìn)存力,是金融行業(yè)落地大模型的“必答題”。
算力集群存在“木桶效應(yīng)”
算力、數(shù)據(jù)和算法是大模型落地應(yīng)用的三大支撐要素,其中,算力需求最先迎來爆發(fā)。
目前,銀行、保險(xiǎn)、證券等金融機(jī)構(gòu)尤其是頭部金融機(jī)構(gòu)已經(jīng)開始落地大模型場景應(yīng)用,并自建大模型能力。據(jù)了解,大模型的落地應(yīng)用必須依托由高性能計(jì)算芯片、存儲(chǔ)和網(wǎng)絡(luò)共同構(gòu)成的大規(guī)模算力集群,對此,金融機(jī)構(gòu)也在進(jìn)行重點(diǎn)布局。
據(jù)中國工商銀行軟件開發(fā)中心高級專家劉承巖介紹,工商銀行在算力方面已經(jīng)建成了可以支持千億模型訓(xùn)練和推理的算力集群,引入了千億模型的算法。
需要注意的是,算力集群也存在“木桶效應(yīng)”,其中,存力的重要性往往被忽視?!秷?bào)告》提到,大模型訓(xùn)練等場景對于存力提出了一系列新挑戰(zhàn),而存力也往往容易成為短板,制約算力效能發(fā)揮,成為大模型落地過程中潛藏的風(fēng)險(xiǎn)。
簡單來說,如果存儲(chǔ)和網(wǎng)絡(luò)性能無法支撐大規(guī)模的數(shù)據(jù)存儲(chǔ)、讀寫和傳輸,高性能計(jì)算芯片無用武之地,價(jià)值也將大打折扣。
對于存力的發(fā)展,相關(guān)政策已有著墨。2023年10月,工業(yè)和信息化部等六部門聯(lián)合印發(fā)《算力基礎(chǔ)設(shè)施高質(zhì)量發(fā)展行動(dòng)計(jì)劃》提出“加速存力技術(shù)研發(fā)應(yīng)用”,圍繞全閃存、藍(lán)光存儲(chǔ)、硬件高密、數(shù)據(jù)縮減、編碼算法、芯片卸載、多協(xié)議數(shù)據(jù)互通等技術(shù),推動(dòng)先進(jìn)存儲(chǔ)創(chuàng)新發(fā)展。
滿足存力提升需要
補(bǔ)齊短板,重視存力的提升,與大模型落地應(yīng)用場景密切相關(guān)。
根據(jù)相關(guān)調(diào)研結(jié)論,金融行業(yè)典型的大模型應(yīng)用場景包括數(shù)據(jù)分析、智能問答、智能客服、數(shù)字營業(yè)廳、智能投顧、智能投研、營銷內(nèi)容生成、產(chǎn)品推薦、智能風(fēng)控等,部分場景已進(jìn)入試點(diǎn)應(yīng)用階段。
面對復(fù)雜的應(yīng)用場景,大模型作為變革性技術(shù),需要實(shí)現(xiàn)能力內(nèi)化,金融機(jī)構(gòu)在應(yīng)用場景中優(yōu)先調(diào)用了自有大模型,并對其進(jìn)行訓(xùn)練和部署,模型參數(shù)量往往在千億級。因此,對于大模型落地應(yīng)用走在前列的金融行業(yè)而言,AI算力建設(shè)頗具挑戰(zhàn)。
“中國人保在大模型研究和應(yīng)用場景落地過程中,感受到最大的限制并非是技術(shù)問題,而是算力資源嚴(yán)重不足。” 中國人民保險(xiǎn)集團(tuán)科技運(yùn)營部總經(jīng)理劉蒼牧坦言,“在國產(chǎn)化算力尚未強(qiáng)大的當(dāng)下,這對我們持續(xù)開展大模型研究和推廣應(yīng)用是一個(gè)巨大的挑戰(zhàn)。”
《報(bào)告》認(rèn)為,在重視大模型能力建設(shè)的背景下,金融機(jī)構(gòu)必須構(gòu)建起堅(jiān)實(shí)的智能算力基礎(chǔ)設(shè)施,以支撐大模型的高效訓(xùn)練和部署。作為AI算力基礎(chǔ)設(shè)施的關(guān)鍵組成部分之一,構(gòu)建先進(jìn)存力的著力點(diǎn)在哪里?
《報(bào)告》稱,金融機(jī)構(gòu)對于AI先進(jìn)存力的需求可以總結(jié)為三方面:可用、可信、可控。具體來看,在可用方面,金融機(jī)構(gòu)要滿足大模型場景對于存力的高吞吐、高IOPS、高帶寬、低延時(shí)的極致性能要求,提升算力資源利用率;在可信方面,在滿足以上極致性能要求的前提下,金融機(jī)構(gòu)在先進(jìn)存力建設(shè)中還需要考慮信創(chuàng)適配問題,同時(shí),破解國產(chǎn)硬件性能瓶頸;在可控方面,金融機(jī)構(gòu)需要盡可能降低成本,在采購存儲(chǔ)系統(tǒng)時(shí),保證自身大模型能力建設(shè)的自主性和靈活性。
加強(qiáng)跨界合作
業(yè)內(nèi)人士認(rèn)為,大模型時(shí)代的到來將推動(dòng)新一輪算力基礎(chǔ)設(shè)施建設(shè),先進(jìn)存力是其中至關(guān)重要的組成部分。
《報(bào)告》提出,相比算力、網(wǎng)絡(luò)可以通過直接采購成熟產(chǎn)品服務(wù)快速形成能力,軟硬件高度融合且更具開放性的存力建設(shè)具有更大的挑戰(zhàn)性。金融機(jī)構(gòu)應(yīng)當(dāng)提升對存力建設(shè)的重視度,同時(shí)在算力基礎(chǔ)設(shè)施建設(shè)中進(jìn)行前瞻性的統(tǒng)籌規(guī)劃,做好存力與算力、網(wǎng)絡(luò)的匹配,避免出現(xiàn)存力短板,阻礙大模型落地進(jìn)程。
“大模型算法技術(shù)門檻高,底層算力資源需求大,必須借助相關(guān)產(chǎn)業(yè)公司的技術(shù)和算力共同開展大模型的底座研究和訓(xùn)練。”劉蒼牧表示,智能前沿技術(shù)如通用大模型,在底層算力算法技術(shù)儲(chǔ)備方面的門檻極高,金融機(jī)構(gòu)必將積極開展跨界合作,充分發(fā)揮第三方機(jī)構(gòu)的技術(shù)先發(fā)優(yōu)勢,與自身的業(yè)務(wù)場景和專業(yè)知識(shí)相結(jié)合,共同打造智能金融生態(tài)圈,實(shí)現(xiàn)優(yōu)勢互補(bǔ)和互利共贏。
據(jù)了解,目前業(yè)內(nèi)已有商業(yè)銀行、證券公司與科技企業(yè)在大模型算力基礎(chǔ)設(shè)施建設(shè)方面有所合作。
【關(guān)閉】