7月4日,2024世界人工智能大會暨人工智能全球治理高級別會議在上海開幕,深圳計算科學研究院首席科學家樊文飛院士應邀出席,在中信集團承辦的投融資主題論壇發(fā)表了“AI=機器學習+邏輯推理”的主旨演講,和與會嘉賓分享了AI領域前沿趨勢和在垂直領域應用的重大機遇。
大模型——挑戰(zhàn)與機遇并存
樊文飛院士指出,通用大模型推動了行業(yè)的變革,引起社會的廣泛關注,但也存在局限性。做為輔助工具,大模型表現優(yōu)異;但在智能制造的應用前景還有待觀察。當下的大語言模型是基于統(tǒng)計類的機器學習模型,無法滿足結果的可解釋,且無法同時滿足模型的“準確性”“公平性”和“魯棒性”要求,邏輯推理能力不強,訓練成本高(算力、數據、能耗),而且經常產生“幻覺” (hallucination)??煞駪么竽P驮谏a關鍵環(huán)節(jié)做出實時“決策”,解決行業(yè)痛點,提高生產效率?如何確保大模型在智能制造決策中的準確性和可靠性?如何減少它們所產生的幻覺?能否增強機器學習的邏輯推理能力?所以要討論大模型的遠景,首先要確定大模型的定位,不能企望大模型做到其所不能。
如何在工業(yè)界發(fā)揮人工智能的效能,解決行業(yè)痛點,是業(yè)界需要關注和解決的一項重大機遇和挑戰(zhàn)。在解決行業(yè)痛點問題時,大模型是否最優(yōu)解?能否找到成本低、高精度、易解釋的方法,為行業(yè)痛點提供實時解決方案?
以“AI+”的自動化、高精度、可解釋、低成本賦能工業(yè)界
在人工智能技術的發(fā)展大潮中,中國應發(fā)揮在制造業(yè)規(guī)模大、垂直領域數據積累多等優(yōu)勢。樊文飛院士提出:以“機器學習+邏輯推理”的“AI+”發(fā)展思路,在提高模型結果準確度的同時賦予結果可解釋性;與此同時,通過邏輯規(guī)則融入行業(yè)(小)模型預測,大幅降低模型的落地成本。深算院通過獨創(chuàng)的機器學習模型與業(yè)務邏輯規(guī)則的高效結合,研發(fā)填補國際空白的釣魚城數據分析系統(tǒng),并衍生出生產工藝、配方優(yōu)化、網絡安全、新藥研發(fā)、金融風控、精準推薦等行業(yè)的AI應用創(chuàng)新,均已上線應用。如在動力電池制造行業(yè),助力頭部企業(yè)在保證誤差率0.06%-0.01%的同時,縮短80%化成分容生產周期,降低50%能耗,單條產線節(jié)省上千萬設備成本,每GWh產能年節(jié)省上百萬元電費,并可擴展優(yōu)化更多工藝環(huán)節(jié)。釣魚城系統(tǒng)已證明可以實現實時決策、精準解釋、自動適配,并在算力不足、訓練樣本較少的情況下,得到遠超大模型的精度,解決許多行業(yè)痛點。
語料準備與算力同等重要
樊文飛院士表示,目前社會廣泛聚焦的是大模型以及與其相關的算力,忽視了大模型訓練必需的語料準備這一關鍵環(huán)節(jié)。大模型的精度和可用性取決于所訓練的語料數據,如果致力于打造一個具備產線實時應用的大模型決策系統(tǒng),那么語料清洗的重要性和算力同等重要。基于“大數據質量保證模型與方法”原創(chuàng)理論,深算院研發(fā)的采石磯數據質量系統(tǒng),為上海數據交易所的數據評估和數據交易流程提供底層能力支撐,落地國內首創(chuàng)的大數據精準量化質量評估,實現了自動化的數據質量評估和數據質量增強,真正打通數據要素進入流通的關鍵節(jié)點。下一步將繼續(xù)為大模型的訓練提供優(yōu)質的語料數據和行業(yè)調優(yōu)數據,以提升行業(yè)大模型的準確性。
走出國產基礎軟件的“寒冬”
重要性不亞于大模型的是標準化基礎軟件的研發(fā)。目前芯片受制于人。如果開源軟件被禁用,中國的大模型發(fā)展將何去何從?所以堅持自主源頭創(chuàng)新和自研根技術,才能推動中國軟件行業(yè)真正走出受制于人的困境。例如,深算院以有界計算、跨模計算等創(chuàng)新理論,研發(fā)出全自研滿足AI場景需求的崖山數據庫系統(tǒng),實現與國際主流數據庫在高端場景提供1:1的平替能力,在中國人民銀行數字貨幣場景,通過反復數十萬次的故障和高可用測試,故障恢復和數據一致性得到強保證,在兼容、功能、故障、運維、備份、安全、性能等維度,滿足數字貨幣場景對數據庫的業(yè)務訴求。
相關稿件