4月24日,科大訊飛在官微上發布訊飛星火認知大模型,不過目前官方對其介紹并不多,該認知大模型將于5月6日正式亮相。DoNews通過申請拿到了這款認知模型的內測名額,并進行了大量的測試。
通過科大訊飛的介紹,可以看到,通過海量文本、代碼和知識的學習,訊飛星火認知大模型擁有跨領域的知識和語言理解能力,能夠基于自然對話方式理解與執行任務,只需一個指令,訊飛星火認知大模型便可以懂你所言、答你所問、創你所需、解你所難、學你所教?梢哉f是非常貼心的“智能助手“。
具體體驗如何,我們來親自體驗一下吧。
以下是部分測試的截圖:
首先,提出簡單的問題:可以做一下自我介紹嗎?

在首次操作中,內容的快速生成還是出乎意料的。
一、創作能力
作為文字工作者最關心的莫過于創作能力和數據的實時性。先來一題“出一篇《長月燼明》的影評“,看看它的寫作能力。

可以看到,訊飛星火認知大模型的回復僅是在套用模板化的格式,對于其主角描述存在誤差的。我們點擊“重新生成”按鈕,希望訊飛星火認知大模型再次回答,看看結果能否讓人滿意。

從結果來看,仍然不盡如人意。先拋開劇情的套話描述,其演員團隊依舊是錯誤的。
再來一個問題:以“訊飛星火”做一首藏頭詩.


通過以上兩次生成的內容來看,訊飛星火認知大模型有一定的能力,但其能力并不完美,完成度只能達到50%左右。
對外的內容出現偏差,可以理解,那對內呢?來問一下,科大訊飛2022年的營收情況。

這個回復是出乎意料的。在時間上,科大訊飛在4月20日晚已發布財報,不是未來時間。同時,作為語言模型,訊飛星火認知大模型也未生成模板化的內容。
二、邏輯能力
把兩杯50度的水融在一起后,水的溫度是多少?

1+1在什么情況下等于3?

如果貓會爬樹,那么狗也會。

針對邏輯性問題,筆者也嘗試了重新生成,來看看有沒有不同的答案,但多次生成的回復是一樣的。
三、編程能力
先來一個簡單的編程問題“從1加到100等于多少,請用JAVA語言編程,并得出結論。”

“編寫一個JAVA程序,用if-else語言判斷2023年是否為閏年。”


對于其編程能力,筆者也問了兩位JAVA程序員,他們都表示其編程能力還是有的。但對于大型項目還說,具體編程效果如何,可能還得看能夠給出具體的描述。
四、圖文生成能力
前有百度文心一言,后有通義千問等等大模型。圖文生成能力也是備受關注的一點。

可以看到,訊飛星火認知大模型定位于語言模型目前無法生成圖片。
五、交互能力
成語接龍是最直接的交互形式,來玩一局。

對于出現“及時雨”回復時,多次讓其重新生成,答案內容并未改變。
整體來看,科大訊飛這次推出的訊飛星火認知大模型表現還比較初級,無論是語義理解,持續對話、編程能力,還是數理推理能力等,與真正的“對話式AI”還有距離。
最后再來一個問題,“目前有幾個和你類似的認知智能模型?”

通過回復可以看到,當前類似的認知智能模型已經有很多了,訊飛星火認知大模型的將呈現怎樣獨有的優勢呢?還需要再等十余天才能揭曉。
文章內容僅供閱讀,不構成投資建議,請謹慎對待。投資者據此操作,風險自擔。
海報生成中...
海藝AI的模型系統在國際市場上廣受好評,目前站內累計模型數超過80萬個,涵蓋寫實、二次元、插畫、設計、攝影、風格化圖像等多類型應用場景,基本覆蓋所有主流創作風格。
IDC今日發布的《全球智能家居清潔機器人設備市場季度跟蹤報告,2025年第二季度》顯示,上半年全球智能家居清潔機器人市場出貨1,2萬臺,同比增長33%,顯示出品類強勁的市場需求。