AI大行其道的時代,網絡安全正面臨前所未有的威脅。
化身黑客的AI學會了自動化攻擊,還有相當高的成功率,伊利諾伊大學香檳分校研究團隊的最新研究顯示:GPT-4能夠在閱讀CVE漏洞描述后,學會利用漏洞攻擊,成功率高達87%。
既然攻擊方都與時俱進,用上AI新技術來搞破壞。
防御方自然也不會坐以待斃,也在積極把AI大模型納入自己的反制招數里,最近就有這樣一件大事:
今年剛剛完成10億融資的新生代網絡安全領軍企業長亭科技,聯手同為清華系的AI Infra廠商趨境科技,共同發布新一代安全大模型解決方案,此次合作將長亭問津(ChaitinAI)安全大模型參數規模提升至超過千億,安全能力全方位大幅提升。
至此網絡安全行業邁入千億大模型時代。
AI攻防戰,千億大模型帶來什么改變
從百億到千億,大模型參數規模升級,究竟能給網絡安全帶來什么改變?
網絡安全領域有兩個核心的指標:攻擊識別準確率、檢測時延。
在一個企業的網絡系統里,每天都有各種各樣的訪問/調用請求,需要識別每一個請求是正常的業務還是惡意的攻擊。加入大模型后,能夠協助系統進行更快速、更準確的攻擊判斷。
舉個栗子經常會收到的欺詐郵件就是一種惡意攻擊,一旦點擊其中的鏈接或者下載文件之后,電腦就會被攻擊。
加入了大模型之后,在大家收到郵件的同時,大模型就會對郵件進行內容識別,根據多條線索來進行多個步驟的惡意攻擊研判,在判定為惡意郵件后,秒級自動向用戶告警,并提醒用戶盡量避免點擊鏈接和下載附件。
在長亭科技30萬+自有的多類型攻擊樣本測評中,某國內頭部大模型攻擊識別率為48.3%,而通過長亭聯合趨境科技發布的千億參數的安全大模型解決方案,可以把成績提升到92.1%。
在另一個基于真實攻擊流量構建的私有數據集的測試中,問津(ChaitinAI)也成功把成績從65.5%提升到95.8%。
再拿對安全要求更高的金融企業舉例,交易行為和數據對安全性要求極高,擁有復雜的網絡環境,同時由于在系統里的各種交易行為活動量大,通常會有海量的日志數據,而對應的攻擊手段也非常多樣。
某金融企業在一次網絡環境中出現異常行為時,問津(ChaitinAI)安全大模型同樣秒級響應。
首先從海量日志數據中迅速提取對應的數據行為并進行標準化處理,根據行為模式研判屬于APT攻擊(Advanced Persistent Threat,高級長期威脅),同時提取攻擊行為相關的關鍵資產,掃描其中的安全漏洞,明確威脅行為來源。隨后再對攻擊行為流量、文件等進行分析,成功揪出背后偽裝成合法軟件的惡意工具包。
問津(ChaitinAI)在這次攻擊行為中給出了精確的事件研判報告和處理對策,整個流程僅需3分鐘,MTTD(平均檢測時間)和MTTR(平均響應時間),從原來的三十分鐘到數小時,減少到10分鐘以內,幫助該企業安全團隊迅速定位和決策,成功阻斷了APT攻擊的進⼀步滲透和破壞。
像這樣的提升,接下來還有……這么多:
事件研判處理建議采納率提升
安全報告的內容生成質量評分提升
對于代碼的問題發現和檢測的準確率提升
漏洞修復建議的采納率提升
對于違法、有害、暴力、色情等不良內容的識別能力更強。即對不良內容的識別準確率、召回率提升
同一目標的滲透測試任務,大模型驅動的智能滲透測試的漏洞發現數量以及可真實利用數量提升
基于不同場景選擇合適工具/策略的準確率提升
綜合的輸出健壯性和穩定性,不同場景下輸出質量的波動率降低
Scaling Law的威力,在垂直領域大模型上再一次得到驗證:
參數規模的數量級提升,會體現在模型的通用性、泛化能力上。再落實到應用場景上,就不只是單點的指標突破,而是全方位提升了。
接下來的問題就是,過去安全行業怎么不用千億大模型,是因為不喜歡嗎?(狗頭)
破解效果、效率和成本的不可能三角
其實主要涉及安全檢測效果、用戶響應效率和私有部署成本,三者之間的矛盾。
安全行業對于檢測效果的追求永無止境,任何一個小小的安全漏洞很可能帶來巨大的損失。安全大模型依然遵循Scaling Law,千億參數的模型相比于百億參數,安全效果進一步升級。
同時,網絡安全防護是24小時一刻也不能松懈的任務,需要不斷調用大模型進行推理。一旦檢測到攻擊事件,接下來的響應速度也非常關鍵。
此外,對于安全行業來說,數據的隱私性也極其重要,使用大模型需要在本地部署,并用特定數據進行訓練。而訓練和維護一個千億參數的模型,背后是巨大的計算資源和投入,成本動輒需要數百萬。
![]()
既要安全效果好、又要落地成本低、還要檢測效率高,安全大模型落地中的看似“不可能三角”,被長亭和趨境聯手破解了。
AI Infra新秀入局,拉低部署門檻
這是一個掌握垂直行業場景的公司與大模型技術公司合作的典型案例。
長亭科技是國內頂尖的網絡信息安全公司之一,專注為企業級用戶提供智能、簡單、省心的安全防護產品和解決方案。
趨境科技則是一家AI Infra新秀,專注于構建和開發先進的大模型推理加速平臺,為企業和開發者提供高效、低成本的大語言模型推理服務。
趨境科技在不久前,聯合清華KVCache.AI團隊發布開源項目“KTransformers(https://github.com/kvcache-ai/ktransformers)”,利用 MoE 模型和長文本注意力算子的稀疏特性,采用異構劃分策略,大幅度提升了超大模型和超長文本的推理性能,降低了他們本地部署的門檻。
作為項目的首個展示案例,使用 KTransformers ,只需不到12GB 的顯存和百余 GB 的內存即可在本地運行Mixtral8x22B 和 DeepSeek-Coder-V2等千億級大模型,達到數倍于 Llama.cpp 的性能。
這一技術使得千億大模型的本地使用成本降低了10倍以上。
另一方面,對于安全場景下同樣非常重要的長文本推理能力 KTransformers 同樣可以實現大幅度優化。
即便是長達1M 的超長上下文,KTransformers 也可以在僅配備24GB 顯存的設備上即可完成,生成速度達到16.91token/s,比 Llama.cpp 快10倍以上的同時維持了接近滿分的“大海撈針”。
項目在GitHub上開源后,馬上被Hugging Face注意到,收獲了開源項目負責人 Lysandre Debut 的點贊,同時還在國內外社區里引起很多討論。
推出開源版本的同時,趨境科技也推出了高性能 KTransformers 商業版引擎和基于此的推理服務平臺,通過高級內核優化和放置/并行策略,在開源版的基礎上推理能力更強,速度更快,同時也增加了針對企業級的高并發策略,更適合團隊/企業級用戶。
大模型落地千行百業必經之路
在AI Infra日益完善、大模型安全備受關注的行業背景下,同為清華系的長亭科技也很快注意到趨境科技。
由于問津(ChaitinAI)安全大模型同樣具備參數和注意力兩方面的稀疏性,這與趨境科技的技術優勢十分貼切,雙方一拍即合:
采用KTransformers的技術策略對問津(ChaitinAI)安全大模型進行升級。
問津(ChaitinAI)安全千億大模型解決方案應運而生。
雙方聯手,不僅是技術實力的驗證,更是深入場景落地能力、方案交付能力的驗證。
大模型在各行業的快速落地,離不開行業場景公司和AI Infra公司的聯合。
大模型的安全性和可靠性一直是持續關注和優化的重點所在。這次的合作只是一次創新試驗,是大模型技術發展的一個縮影。
更長遠來看,未來,隨著AI技術的不斷發展和行業需求的日益旺盛,會有更多這樣的合作出現。
可以預見,這些合作將不僅局限于技術層面的創新,更將涉及到安全、倫理、治理等多個維度的探索和實踐,共同推動大模型一步步落到千行百業。
文章內容僅供閱讀,不構成投資建議,請謹慎對待。投資者據此操作,風險自擔。
海報生成中...
海藝AI的模型系統在國際市場上廣受好評,目前站內累計模型數超過80萬個,涵蓋寫實、二次元、插畫、設計、攝影、風格化圖像等多類型應用場景,基本覆蓋所有主流創作風格。
IDC今日發布的《全球智能家居清潔機器人設備市場季度跟蹤報告,2025年第二季度》顯示,上半年全球智能家居清潔機器人市場出貨1,2萬臺,同比增長33%,顯示出品類強勁的市場需求。