本文首發(fā)于鈦媒體APP
作者|張申宇
圖片來源:由無界 AI生成
離大模型橫空出世已經(jīng)過去一年有余,在AI大模型的浪潮下,各大科技企業(yè)爭先恐后的推出了自家的大模型產(chǎn)品。與此同時,各行業(yè)企業(yè)也對大模型保持著高度關(guān)注,一些其他行業(yè)的企業(yè)也都紛紛跨界布局大模型相關(guān)產(chǎn)品。
如果說,各大廠商紛紛推出大模型產(chǎn)品形成“百模大戰(zhàn)”的局勢,是大模型這場“戰(zhàn)役”的上半場的話,那么這場“戰(zhàn)役”的下半場將更聚焦在大模型的垂直化應(yīng)用以及生態(tài)化發(fā)展。
從通用大模型到行業(yè)大模型
《北京市人工智能行業(yè)大模型創(chuàng)新應(yīng)用白皮書(2023年)》中顯示,截至2023年10月,我國10億參數(shù)規(guī)模以上的大模型廠商及高校院所共計254家,分布于20余個省市/地區(qū)。商業(yè)咨詢機構(gòu)愛分析的報告稱,2023年中國大模型市場規(guī)模約為50億元,預(yù)計到2024年這一數(shù)字將達到120億元。
顯然,2024年,大模型將繼續(xù)其火熱的現(xiàn)象,進一步滲透到各行各業(yè)的數(shù)字化進程中。
大模型真正的價值在于行業(yè)側(cè)的應(yīng)用落地,就目前業(yè)內(nèi)對大模型的認知來看,絕大多數(shù)人對大模型相關(guān)產(chǎn)品的發(fā)展觀點類似于互聯(lián)網(wǎng)——消費級只是開始,產(chǎn)業(yè)級價值更大。但就如同互聯(lián)網(wǎng)一樣,消費互聯(lián)網(wǎng)發(fā)展迅速,甚至已經(jīng)接近“天花板”;產(chǎn)業(yè)互聯(lián)網(wǎng)也僅是近年來在政策引導(dǎo),數(shù)字技術(shù)驅(qū)動下,逐步發(fā)展提速。
大模型的發(fā)展與互聯(lián)網(wǎng)的發(fā)展類似?;乜磩倓傔^去的2023年,以ChatGPT為代表的語言大模型發(fā)展迅速,除了ChatGPT、必應(yīng)以外,國內(nèi)眾多廠商也紛紛布局,包括華為、阿里、百度、京東、科大訊飛、商湯等在內(nèi)的眾多科技公司也都積極布局,紛紛推出了各自的大模型產(chǎn)品。
不過回看這些大模型產(chǎn)品,大多是聚焦C端,也就是終端用戶的產(chǎn)品,為用戶提供了辦公、生活上的輔助。
不過,企業(yè)對于大模型產(chǎn)品還是保持開放的態(tài)度,據(jù)IBM商業(yè)價值研究院最近發(fā)布的調(diào)研報告顯示:有四分之三的受訪CEO認為,部署先進的生成式人工智能將為企業(yè)帶來競爭優(yōu)勢。
大模型真正的價值是:產(chǎn)業(yè)側(cè)應(yīng)用的落地,也就是行業(yè)級大模型產(chǎn)品成熟度的提高。據(jù)市場研究機構(gòu)預(yù)測,到2025年,全球生成式AI市場規(guī)模將達到100億美元以上。其中,企業(yè)級生成式AI市場將占據(jù)相當(dāng)大的份額,成為最大的應(yīng)用領(lǐng)域之一。
行業(yè)大模型是指針對特定行業(yè)或領(lǐng)域的大模型,這種模型針對特定領(lǐng)域的任務(wù)進行了優(yōu)化和定制。相比通用大模型,行業(yè)大模型專業(yè)性更強、性能更優(yōu)。不過行業(yè)大模型在發(fā)展的過程中,與通用大模型也存在著不少差別。
目前已知的主要差別是——行業(yè)大模型不僅需要通用的語料庫,還需要針對不同行業(yè),不同場景的專業(yè)語料庫。神州數(shù)碼副總裁CTO李剛曾對鈦媒體表示,行業(yè)大模型具有極強的專業(yè)性,需要大量行業(yè)專業(yè)知識庫,“目前,這個行業(yè)知識庫的語料需控制在20%,不多不少?!崩顒倧娬{(diào),“超過20%,訓(xùn)練出來的大模型可能就‘不會說人話’,造成溝通障礙;少于20%,又不具備行業(yè)的專業(yè)性?!?/p>
醫(yī)療、法律、金融等行業(yè)率先落地
目前行業(yè)級大模型還處于發(fā)展的初級階段,雖然有很多家企業(yè)推出了行業(yè)大模型,但是應(yīng)用并不成熟。就現(xiàn)階段大模型在各個行業(yè)的應(yīng)用現(xiàn)狀,以及發(fā)展趨勢來看,醫(yī)療、金融、法律等行業(yè)正率先落地較成熟的行業(yè)級大模型應(yīng)用。
智源研究院大模型行業(yè)應(yīng)用負責(zé)人周華曾對鈦媒體表示,現(xiàn)階段,容錯性比較高的通用領(lǐng)域大模型成熟度較高,在類似智能客服、文檔處理等方面能夠發(fā)揮更多輔助作用,還有通用領(lǐng)域的文生圖應(yīng)用,以及通過檢索增強技術(shù)緩解部分幻覺問題的專業(yè)領(lǐng)域應(yīng)用,都是目前企業(yè)比較好落地的一些應(yīng)用場景。
無獨有偶,IEEE標(biāo)準(zhǔn)協(xié)會新標(biāo)準(zhǔn)立項委員會副主席兼IEEE數(shù)字金融與經(jīng)濟標(biāo)準(zhǔn)委員會主席林道莊也有著相似的看法,林道莊表示,目前,大模型的應(yīng)用主要集中在“三產(chǎn)”(服務(wù)業(yè))居多,重點是輔助人更快、更好地服務(wù)其他人,而行業(yè)級的大模型也有望在服務(wù)業(yè)相關(guān)領(lǐng)域率先落地成熟度較高的應(yīng)用。
就目前的發(fā)展現(xiàn)狀來看,行業(yè)大模型發(fā)展較快的行業(yè)主要有金融、醫(yī)療、法律等。
金融行業(yè)方面,2023年3月,彭博首度針對金融業(yè)推出大型語言模型BloombergGPT,引發(fā)市場對金融垂直領(lǐng)域大模型的關(guān)注;6月,哥倫比亞大學(xué)聯(lián)合上海紐約大學(xué)推出FinGPT 。
在國內(nèi),同年7月,華為全新發(fā)布盤古大模型,金融行業(yè)大模型正是其中數(shù)個行業(yè)通用大模型之一;同年9月,螞蟻集團正式發(fā)布自研“螞蟻基礎(chǔ)大模型”,以及在此基礎(chǔ)上進行定制的“螞蟻金融大模型”。
雖然眾多具備大模型能力的公司都在積極布局金融行業(yè)大模型產(chǎn)品,不過基于金融行業(yè)的特殊性——對安全合規(guī)要求極高,大模型在金融行業(yè)具備完全成熟落地的能力仍需時日。
張勁曾對鈦媒體表示,金融行業(yè)不同于其他行業(yè),其監(jiān)管要求極高,從技術(shù)上看,像貸款審核等業(yè)務(wù)其實已具備初步落地的技術(shù)能力,但因為安全合規(guī)的要求,大模型只能在其中起到解放生產(chǎn)力的輔助作用。
現(xiàn)階段,大模型在金融行業(yè)的應(yīng)用主要還是集中在風(fēng)險評估和管理,以及知識圖譜平臺搭建方面。在風(fēng)險評估方面,大模型可以通過分析大量的歷史數(shù)據(jù)和實時信息,預(yù)測市場風(fēng)險、評估信用風(fēng)險等,為金融機構(gòu)提供更加準(zhǔn)確和及時的風(fēng)險管理決策支持。
另一方面,將大模型與知識圖譜平臺結(jié)合,用大模型代替NLP技術(shù),金融機構(gòu)可以在提升效率的同時,提升風(fēng)控水平。
除了在金融行業(yè)有望在今年有較成熟的應(yīng)用場景出現(xiàn)以外,林道莊對鈦媒體表示,像醫(yī)療、法律咨詢、教培、娛樂等風(fēng)險要求較低、偏服務(wù)的行業(yè),在今年有望有較多成熟的應(yīng)用場景落地?!霸?024年,大模型將會在一些有人輔助校驗、風(fēng)險及精準(zhǔn)程度要求較低的行業(yè)落地,通過大模型輔助人類去進行工作,可以使更多人享受到更好的服務(wù)。但還遠不到代替人的能力?!绷值狼f強調(diào)。
以醫(yī)療行業(yè)為例,通過行業(yè)大模型對大量醫(yī)療數(shù)據(jù)的學(xué)習(xí)和分析,可以自動識別病變特征,輔助醫(yī)生進行疾病診斷,提高診斷準(zhǔn)確率與診斷效率。對此,林道莊表示,現(xiàn)階段,我國醫(yī)療資源比較緊缺,許多人排了很久的隊才能看上病,而醫(yī)生也很忙,通過大模型的輔助,能幫助醫(yī)生快速的識別諸如X光片、CT等病歷,從而大幅提升醫(yī)生工作效率,也能降低患者等待的時間?!皩τ卺t(yī)療、法律及翻譯服務(wù)等這類信息或能力嚴(yán)重不對稱的行業(yè),大模型的介入將大大提高服務(wù)提供的效率,推動服務(wù)流程的標(biāo)準(zhǔn)化。”林道莊強調(diào)。
除“增效”以外,大模型在醫(yī)療行業(yè)的落地還可以幫助患者和醫(yī)院實現(xiàn)“降本”,通過自動化和智能化的醫(yī)療輔助系統(tǒng),可以降低醫(yī)療成本,提高醫(yī)療服務(wù)的效率和質(zhì)量。
另一方面,行業(yè)大模型在醫(yī)療行業(yè)還可以幫助醫(yī)生優(yōu)化治療方案。通過大模型對對患者病情、病史、藥物過敏等情況進行綜合分析,為醫(yī)生提供更加全面和個性化的治療方案,提高治療效果。
在林道莊看來,行業(yè)大模型能率先落地的垂直行業(yè)具有一個普遍的共性——知識密集型行業(yè),“行業(yè)大模型能率先落地的行業(yè)一定是可以通過知識密集提供價值的行業(yè),”林道莊指出,“某種程度上講,通過知識收集、知識管理,實現(xiàn)輔助人生成內(nèi)容、提出決策建議,而不是代替人的目標(biāo)?!?/p>
在醫(yī)療、金融等行業(yè)之外,大模型在諸如工業(yè)、制造業(yè)等行業(yè)的落地還仍需時日。對此,周華對鈦媒體表示,現(xiàn)階段,大模型主要的能力還是體現(xiàn)在文字、文檔處理,一般性的聊天和較淺顯的專業(yè)問答方面,以及通用視覺領(lǐng)域的問答和生成方面,對于邏輯推理要求和準(zhǔn)確性要求高的專業(yè)語言領(lǐng)域,涉及學(xué)科和工程相關(guān)圖片、視頻識別的專業(yè)視覺領(lǐng)域,以及“文生視頻”等能力仍需技術(shù)迭代,“這種具備多模態(tài)能力的大模型產(chǎn)品目前仍難以在行業(yè)側(cè)的落地應(yīng)用的能力,”周華如是說,“2024年,多模態(tài)模型將成為大模型領(lǐng)域各大廠商角逐的焦點。而隨著多模態(tài)模型成熟度不斷變高,會有更多的行業(yè)應(yīng)用場景出現(xiàn)?!?/p>
安全依舊“不容忽視”
行業(yè)大模型在落地應(yīng)用的過程中,企業(yè)也會遇見很多問題,除了大模型的“幻覺”問題以外,最大的一個問題就是安全的問題。
數(shù)據(jù)安全自從互聯(lián)網(wǎng)出現(xiàn)以來,一直是所有參與者共同關(guān)注的焦點問題,在AIGC時代,亦是如此。大模型在為我們帶來更多便利,提高效率的同時,也帶來了日益嚴(yán)峻的安全挑戰(zhàn)。
當(dāng)下,數(shù)據(jù)已成為企業(yè),乃至國家重要資產(chǎn),數(shù)據(jù)安全、隱私保護等問題也成為各行業(yè)企業(yè)關(guān)注的焦點,據(jù)IBM Security 發(fā)布的《2023年數(shù)據(jù)泄露成本報告》中顯示,僅數(shù)據(jù)泄露一項,2023年全球數(shù)據(jù)泄露的平均成本達到 445 萬美元,創(chuàng)該報告有史以來以來最高記錄,較過去 3 年均值增長了 15%。
而隨著大模型相關(guān)產(chǎn)品的落地,數(shù)據(jù)安全面臨的威脅也勢必將越來越大。IEEE調(diào)研顯示,2024年將會出現(xiàn)其他更具威脅的網(wǎng)絡(luò)安全問題,包括勒索軟件攻擊(2024年為37%,高于2023年的30%)、網(wǎng)絡(luò)釣魚攻擊(2024年為35%,高于2023年的25%)以及內(nèi)部威脅(2024年為26%,高于2023年的19%)。
以目前技術(shù)發(fā)展來看,AIGC主要從三個方面給網(wǎng)絡(luò)安全帶來更大的挑戰(zhàn),分別是:惡意軟件/網(wǎng)絡(luò)攻擊、分布式拒絕服務(wù)攻擊,以及網(wǎng)絡(luò)監(jiān)控和隱私侵犯等;另一方面,企業(yè)在AIGC還面臨著數(shù)據(jù)泄露、數(shù)據(jù)篡改/偽造等數(shù)據(jù)安全方面的挑戰(zhàn)。
在林道莊看來,雖然AI時代,企業(yè)面臨著更大的網(wǎng)絡(luò)安全和數(shù)據(jù)安全的挑戰(zhàn),但是在這個過程中,企業(yè)也可以充分應(yīng)用AI的能力進行預(yù)警、防御,“通過AI自動學(xué)習(xí)識別,預(yù)測一些潛在的風(fēng)險,并將這些風(fēng)險自動隔離起來,”林道莊如是說,“通過AI的賦能,讓企業(yè)級防火墻具備更強的應(yīng)變能力?!?/p>
立足安全領(lǐng)域,其實已經(jīng)有不少頭部的廠商嘗試將AIGC能力整合進安全產(chǎn)品及解決方案中,例如,云起無垠2023年底發(fā)布了名為「SecGPT」的網(wǎng)絡(luò)安全大模型開源項目;360于2023年9月開放360智腦大模型,據(jù)了解,該模型是全國首個原生安全大模型;騰訊安全在混元大模型基礎(chǔ)上投喂安全知識語料庫二次訓(xùn)練出安全大模型,并基于安全大模型打造了騰訊云AI安全助手........
確實,AIGC就好像一把“雙刃劍”,一方面,帶來了更多便捷,提升了效率;另一方面,基于AIGC技術(shù)的網(wǎng)絡(luò)攻擊,以及給數(shù)據(jù)安全的威脅也會越來越多。
而對于幾乎所有企業(yè)來說,選擇應(yīng)用數(shù)字技術(shù)的時候,所有一切的前提就是——安全。企業(yè)在享受AIGC帶來的技術(shù)紅利的過程中,對于安全的考慮也將成為AIGC發(fā)展的一個重要賽道。