本文來自于微信公眾號 鋅刻度(ID:znkedu),作者:陳鄧新
大模型落地,又進了一步。
2023年7月13日,在2023京東全球科技探索者大會暨京東云峰會上,京東云推出了京東言犀大模型,直擊知識密集型、任務型產業場景。
現場,京東集團CEO許冉表示:“從產業端切入大模型,如同從北坡攀登技術珠峰,道路雖然更加艱難,卻有更波瀾壯闊的風景。”
這意味著,京東堅持做難而正確的事情。
喧囂之后,大模型的歸途從通用走向產業,終成行業的共識?賦能千行百業,大模型落地到底難在哪兒?京東憑什么成為產業大模型的開拓者、領導者與集大成者?
產業厚度,決定大模型的高度
大模型,成為“兵家必爭之地”。
據《證券日報》報道,截至2023年7月4日,國內10億級參數規模以上的AI大模型已超80個,還有進一步增加的趨勢。
然而,熱潮之下,一個詭異的現象出現了:據Similarweb的數據顯示,2023年1月至6月,ChatGPT全球訪問量環比增速分別為131.6%、62.5%、55.8%、12.6%、2.8%、-9.7%,降溫的勢態肉眼可見。
ChatGPT之外,微軟的Bing、谷歌的Bard等的訪問量也同步出現了降溫。
一名私募人士告訴鋅刻度:“大模型 To C被當成了娛樂工具,需求大同小異,導致大模型的同質化問題嚴重,亟須正本清源,而縱觀互聯網的發展史,任何技術遲早要面對商業化,這波人工智能亦是如此,需要加速在產業端落地,大規模解決真實需求。”
關于此,從全球搜索引擎市場的份額幾乎沒有大的變化,就可見一斑。
事實上,京東對大模型有更深入的思考。
大模型的競爭高地勢必從通用走向產業,唯有徹底扎根產業,解決產業的實際問題,才能避免白菜化、娛樂化與泛濫化,解鎖更大的商業價值。
對此京東提出,大模型的價值=算法×算力×數據×產業厚度的平方。
許冉解釋道:“前三個指標固然重要,但技術在產業場景落地應用,創造實際價值才是關鍵。當產業效率和產業的邊界拓展得到質的提升以后,大模型才有了更重要的實際價值和意義,這將不亞于又一次工業革命。”
簡而言之,京東對于大模型的思考,除了追求技術本身,更在意技術在產業場景中落地。許冉表示,以大模型為代表的AI技術領域,能夠讓產業伙伴,更加放心、更沒有門檻地使用技術創新的成果,幫助技術走出實驗室和公司的圍墻,真正推動行業生產效率的提升,在產業場景發揮更大價值。京東選擇基礎研究和產業應用兩條腿走路,“技術只有和現實世界的真實場景和產品產生緊密融合,才有可能真正產生AI落地的價值”。
如此一來,京東探索了一條新的大模型之路,即從基礎研究到產業應用,再到終端用戶,構建了一條完整的 AI 技術與商業融合的閉環。
賦能千行百業,為何這么難?
需要注意的是,產業大模型要走的路,可比通用大模型艱難得多。
首先,產業需求“千人千面”。
通用大模型強調的是“全”,在產業端落地時,可以解決較為簡單的問題,但難以解決較為復雜的問題,從而提升生產力僅僅停留在紙面,對產業繼續的降本增效幫助不大。
而產業大模型強調的是“專”,要了解行業的Know-How,對產業的專業知識儲備須豐富,對產業的理解須深入,對產業的迭代須適應。
這么一來,才可以真正解決問題,避免“大事用不了、小事用不上”的尷尬局面。
此外,產業的需求可謂“千人千面”,不同行業對大模型的需求不同,哪怕同一個行業的不同企業,需求也是千差萬別。
譬如,有的企業對產業大模型的需求是“高響應,低容錯”,強調的是好用,對經營效率更為看重。
再譬如,有的企業對產業大模型的需求是解決具體問題,強調的是適用,不管之前解決了多少個問題,不能解決當下的這一個就不行。
這考驗著,產業大模型的底蘊。
其次,數據質量要求苛刻。
通用大模型對算力與算法更為看重,而產業大模型則更為看數據,之所以如此與產業數據難以獲取有關。
畢竟,產業數據往往為非公開數據,且匯聚于企業或供應鏈中,而在實際場景中還存在樣本量不足導致數據采集不穩定、呈現碎片化的情況。
如若產業數據的積淀不足,則不可避免地影響產業大模型的專業深度、服務精度、迭代速度,發揮不出全部的實力。
京東探索研究院院長、京東科技智能服務與產品部總裁何曉冬表示:“產業數據還分為靜態數據和動態數據。靜態數據相對穩定,不會發生即時變化,獲取路徑也較為清晰。動態數據則是不同產業場景中,每時每刻產生的數據,這部分數據是‘活的’場景數據。不容易獲取,但卻是產業大模型的必備要素之一。”
再次,要算“經濟賬”。
產業大模型的數據越多、模型越大,成本也會水漲船高,隨之而來的是一個現實的問題:產業大模型可以創造價值增量,企業自然愿意買單,但企業也要考慮性價比,即投入與產出相比要劃算。
一言以蔽之,讓企業用得起,產業大模型才能構建健康的商業“正反饋”。
京東言犀,最懂產業的大模型
以上可見,涉足產業大模型并非易事,但對京東而言卻是水到渠成。
早在2017年,京東集團董事局主席劉強東就有所預見,提出技術、技術、技術。第一個技術,是解決京東內部大規模人力的效率問題;第二個技術,是組件化、模塊化的技術服務對外輸出;第三個技術,是對前沿技術進行探索和有秩序地創新。
那一年,京東成立了人工智能研究院。
從此,京東走上了擁抱AI、探索AI、落地AI的道路,并長期扎根產業,以技術促產業,以產業謀增長。
這一切,為京東言犀大模型的奮進,打下了堅實的地基。
京東言犀大模型
針對“千人千面”的需求,京東推出了言犀AI開發計算平臺,沉淀了零售、物流、健康、金融等多個行業的Know-How,提供100多種訓練和推理優化工具,企業借此可以進行定制化訓練,打造專屬的大模型。
通俗易懂地說,京東從提供產品變成提供服務,從而不再“單打獨斗”,而是“眾人拾柴火焰高”,與企業共同尋求韌性增長。
至于數據質量,則更不在話下。
京東在垂直行業的知識沉淀豐富,京東連接6億用戶,服務超過800萬家活躍企業客戶,包括90%以上的在華世界500強企業以及全國近70%的專精特新中小企業。
這為京東積累下每年數百億條優質交互數據,訓練言犀大模型的數據庫,就由70%通用數據和30%供應鏈原生數據組成。這些脫敏后的高質量、精準的產業數據,為京東言犀大模型的不斷進化,提供了源源不斷的驅動力。
另外,京東言犀大模型也在努力降低成本。
京東從2019年開始研發向量數據庫,歷經電商大促場景磨練,向量數據庫Vearch已經能支撐百億級高性能檢索,延時降低到毫秒級,將向量數據庫用于大模型預訓練,將推理成本下降了80%;京東全國首個超算中心——天琴α集群正日夜不停地運轉,推理速度較過去提升6.2倍,推理成本下降了90%。
推理成本低了,企業的使用成本也會隨之下降,京東言犀大模型的價值進一步做實。
“京東的大模型技術演進,遵循了京東的技術追求:成本、效率、體驗、可信、普惠、突破。成本、效率和體驗是從京東的經營理念傳承而來,可信、普惠和突破則是技術服務于產業和社會的承諾。”許冉稱。
目前,京東已經拿出幾個將大模型能力與產業應用結合的案例。
在金融領域的AI營銷運營平臺,就能夠讓使用者通過簡單的對話,就能一站式生成營銷活動。過去需要5類職能人員、2000次人機交互的工作,如今1人在50次交互內就能完成,營銷方案的生產效率有了百倍提高。
在電商領域的京東云AIGC內容營銷平臺,能夠從一張商品圖出發,理解商品特征,快速生成電商運營需要的各種圖片,滿足快速開店和營銷需求。較之人工作圖時代,每套圖的制作成本能降低90%,制作周期也從7天縮短到半天。
總而言之,大模型的未來競爭,注定比拼的是深耕產業、把脈行業場景,而京東憑借長時間的產業積淀與產業運營,打通了大模型落地的“最后一公里”,勢必成為人工智能2.0時代的旗手。
毋庸置疑,京東蹚出一條新路。
文章內容僅供閱讀,不構成投資建議,請謹慎對待。投資者據此操作,風險自擔。
海報生成中...
海藝AI的模型系統在國際市場上廣受好評,目前站內累計模型數超過80萬個,涵蓋寫實、二次元、插畫、設計、攝影、風格化圖像等多類型應用場景,基本覆蓋所有主流創作風格。
IDC今日發布的《全球智能家居清潔機器人設備市場季度跟蹤報告,2025年第二季度》顯示,上半年全球智能家居清潔機器人市場出貨1,2萬臺,同比增長33%,顯示出品類強勁的市場需求。