來源:科技日報
2023-05-08 09:35:17
5月6日,訊飛星火認(rèn)知大模型成果發(fā)布會在安徽合肥舉行??拼笥嶏w董事長劉慶峰、研究院院長劉聰發(fā)布訊飛星火認(rèn)知大模型,現(xiàn)場實測大模型7大核心能力,并發(fā)布教育、辦公、汽車、數(shù)字員工4大行業(yè)應(yīng)用成果。
發(fā)布會現(xiàn)場,語音輸入,實時互動,無論是文本生成、語言理解,還是知識問答、邏輯推理,或是數(shù)學(xué)能力等,現(xiàn)場真機實測的互動提問,大模型的回答,引發(fā)掌聲不斷。
【資料圖】
在數(shù)學(xué)能力中,除了常規(guī)計算、幾何、情景應(yīng)用等,現(xiàn)場還拋出了復(fù)雜的計算題:“花壇里有三種花,一共88朵,其中月季花的數(shù)量是菊花的4倍,牡丹花的數(shù)量是菊花的5倍少2朵,那么請問花壇里一共有多少朵牡丹花?”星火大模型很快準(zhǔn)確給出了答案,并給出了解題步驟。劉慶峰表示,數(shù)理能力一定程度代表了一個大模型的聰明程度。
劉慶峰公布了大模型年內(nèi)三次升級時間點,后續(xù)還將聯(lián)合開發(fā)者推動大模型應(yīng)用落地,共建人工智能“星火”生態(tài)。
劉慶峰表示,從ChatGPT關(guān)注的48個主要任務(wù)方向和訊飛開放平臺上400多萬開發(fā)者團隊的需求分析,通用人工智能應(yīng)當(dāng)具備7大維度能力,包括文本生成、語言理解,知識問答、邏輯推理、數(shù)學(xué)能力、代碼能力、多模態(tài)能力等。
劉慶峰透露,在2022年12月,科大訊飛正式啟動“1+N”認(rèn)知大模型專項攻關(guān),其中“1”就是指通用認(rèn)知智能大模型,“N”就是大模型在教育、辦公、汽車、人機交互等各個領(lǐng)域的落地。
劉慶峰表示,科大訊飛設(shè)計了通用認(rèn)知大模型評測體系,并與中科院人工智能產(chǎn)學(xué)研創(chuàng)新聯(lián)盟和長三角人工智能產(chǎn)業(yè)鏈聯(lián)盟共同探討形成了覆蓋7大類481個細分任務(wù)類型。在科學(xué)的評測體系中,推動大模型的發(fā)展。
“今天要看一個大模型系統(tǒng)到底好不好,首先要看它是不是能解決剛需、是不是真的有用,而不是一個簡單的單點測試。”劉慶峰強調(diào)。
此外,發(fā)布會還展示了大模型面向泛領(lǐng)域開放式知識問答,它具備很好的通識知識,能夠?qū)ι畛WR、科學(xué)知識、工作技巧,以及醫(yī)學(xué)知識等應(yīng)對自如。此外,星火大模型也具備邏輯推理能力與代碼能力,未來還將進一步升級多模態(tài)輸入和表達能力,不斷實現(xiàn)自身迭代進化。
劉慶峰表示,雖然目前大模型技術(shù)還有待攻克的缺陷,比如新知識難以及時更新、事實類問答容易“張冠李戴”,史實、傳統(tǒng)典籍等容易“編造情節(jié)”等,但這些問題在今年會有明顯的改進。
(科大訊飛供圖)
關(guān)鍵詞: