国产日韩精品一区二区_欧美一级片在线播放_久久精品中文字幕电影_久久视频精品在线_亚洲国产成人久久综合一区_久久精品国产精品_国产视频精品免费播放_在线视频中文亚洲_亚洲午夜未满十八勿入免费观看全集_精品亚洲一区二区_国产原创欧美精品_国产色综合天天综合网_九九久久国产精品_欧美极品少妇xxxxⅹ裸体艺术_亚洲国产精品人人爽夜夜爽_尤物九九久久国产精品的分类

解鎖2026世界杯觀賽“新姿勢”,聯想AI平板攜天禧AI 3.5打造掌上沉浸主場聯想motoX70Air云上舞白冰鉆限定版AI手機即將上市 自帶14顆手工精鑲冰鉆 超奢華只有紅魔還在做24+1TB 姜超:成本暴增 友商一臺都沒有英特爾®至強® D處理器:賦能智能網卡,破解算力-網絡協同瓶頸豐田全新超跑GR GT發布:配641馬力大V8商家仿冒心系天下W26 老機當新機賣!中國電信回應告別“人海戰術”!陳天橋:未來公司值多少錢,不看人數看“認知”“卷”不動了?讓AI銷售團隊替你卷!百度商家智能體升級片來了卡薩帝冰箱亮相廣州設計周亞馬遜云科技推出Amazon Graviton5----迄今性能最強、能效最高的自研CPU第八屆“綻放杯”圓滿落幕,華為助力千行百業5G應用“全面綻放”機構:2025年第三季度中國PC市場同比增長2%火山引擎發布豆包語音識別模型2.0提升多語種識別精度現代汽車推出 AI 驅動的 MobED 機器人,2026年上市Vidu發布 Q2“生圖全家桶”:4K 生圖 + 圖像編輯 + 圖轉視頻,全都免費用中國新勢力首家!理想汽車累計交付突破150萬輛瑞典Oceanbird Wing 560翼帆開放訂購,2026量產在即,加速布局中國市場賦能綠色航運億邦智庫第七次《產業互聯網發展報告》重磅發布一加Ace 6T首銷10分鐘賣爆!打破今年同檔機型全天銷售紀錄魯大師11月電動兩輪車榜:潮玩思路重塑市場,九號領跑智能化
  • 首頁 > 云計算頻道 > 大模型

    18家中文大模型橫評:識別違規內容手段單一 英文合規檢測水平待提高

    2024年06月13日 15:50:05 來源:Donews

      近日,知道創宇發布《中文大模型安全基準雙輪測評第1期報告》,本次報告主題為“核心價值觀之鑒”,對國內18家主流中文大模型的中英文內容合規能力進行評測。

      評測結果顯示,大部分大模型的內容合規檢測機制過于直接和簡單。難以應對復雜評測場景下的內容安全風險與潛在威脅,因此亟需進一步優化。

      特別值得注意的是,評測結果指出,大部分大模型英文內容合規檢測能力嚴重不足。這也提示,在全球化和多語言環境的背景下,中文大模型在提升中文內容合規能力的同時,也必須加強英文及其他語言的合規性檢測能力,以確保在各種語言環境下都能提供安全、合規的服務。

      英文合規檢測能力嚴重不足

      為確保大模型的穩健發展,國家網信辦等七部門聯合發布《生成式人工智能服務管理暫行辦法》,自2023年8月15日起實施。該辦法明確提出堅持社會主義核心價值觀的要求,并禁止生成任何違反法律、行政法規的內容。

      與此同時,《互聯網信息服務算法推薦管理規定》也強調了算法推薦服務提供者應堅持主流價值導向。

      為了進一步促進生成式AI服務的安全發展,2024年3月全國網絡安全標準化技術委員會發布《生成式人工智能服務安全基本要求》,要求生成式AI服務必須具備關鍵詞庫、內容測試題庫和拒答測試題庫,以確保服務的安全性和可靠性。

      為更真實反映大模型能力,知道創宇本次評測采用多維度、多視角的綜合方案,涵蓋簡答題和選擇題。通過從數據集庫(50萬+道題)隨機抽取5000+道原始評測數據集,經過嚴格的人工校驗后保留了4000道(含1500道簡單題和2500道選擇題),并結合“裁判模型”和專業評審等方式,確保評分公正客觀。

      本次評測分為兩輪,模型選取范圍涵蓋了了國內有代表性的13個WEB開放大模型和6個大模型API。第一輪評測為截至2024年3月22日的大模型表現,第二輪則為2024年4月16日的最新評測結果。

      在第一輪評測中,特別設置了中文和英文兩種評測語言,旨在測試模型在“社會主義核心價值觀”上的中英文對齊表現,包括對種族歧視、少兒不宜內容、色情元素、違法違規內容、地域歧視及政權觀點的全面考察。英文題集由中文題集一對一翻譯而來,以防范語種變換帶來的內容風險。

      在綜合評分中,抖音豆包、GLM-3、騰訊混元、海螺問問和Kimi英文和中文領域均表現出色,位列前五。然而,對于原本在中文領域表現優秀的大模型,如文心一言3.5和小悟空,由于英文能力相對不足,導致其在綜合評分中未能獲得理想成績。

      第一輪評測顯示,中文大模型在英文內容合規檢測上存在明顯弱點。首先,英文合規檢測能力不足,導致模型生成的英文內容難以準確判斷是否符合我國法規及道德標準。這主要源于檢測模型在訓練時缺乏足夠的英文違規語料,說明許多廠商對模型生成結果的檢測算法還不夠完善。

      其次,英文關鍵詞積累不足也削弱了模型的合規檢測能力,影響了對英文文本關鍵信息的準確識別和理解。這些問題可能導致英文內容審核疏漏,給用戶帶來風險。

      識別違規內容過分依賴關鍵詞

      第二輪評測緊密圍繞《生成式人工智能服務安全基本要求》,對“社會主義核心價值觀”和“歧視性”兩大核心要點進行了深入評測。通過深入剖析并細化為17類二級標簽,同時靈活融合了多元化的三級標簽數據,精心構建了一套全新的數據集。

      由于該評測數據集在細節處理上的極高要求,部分大型模型在測試中暴露出了內容風險問題,這些問題主要源于垃圾訓練數據的不良影響,尤其是在“歧視性”方面的表現尤為突出,揭示了模型在泛化能力上存在的局限性。

      本輪評測結合針對訪問方式,采用多輪對話、設定場景、陷阱釣魚、單/多項選擇等多種題型,以更全面地評估大模型的內容安全合規能力。在單項選擇題型中,通過強制模型做出選擇,結果顯示出部分模型訓練后的偏見性和歧視性方向的指引明顯。這可能是訓練數據、模型設計、參數設置的偏見性和歧視性導致的。

      針對歧視性問題,本次評測通過深化歧視下的二級標簽(如民族歧視、地域歧視等),并采用多道題對應一個歧視點的方式。結果顯示,大部分模型在涉及不同地域、不同國別和不同民族的場景中可能表現出歧視傾向,這可能與訓練數據、算法設計、使用環境以及社會文化背景緊密相關。

      值得注意的是,本次評測在數據集選取時特別規避了在題干中違規詞的出現,旨在繞過檢測模型/關鍵詞的常規檢測。

      然而,正是這種迂回的方式,大模型暴露出藏匿更深的內容風險。結果顯示,模型在生成內容時可能受到訓練數據的影響,產生一些看似合規但實際上具有風險的內容,暴露出過分依賴關鍵詞或特點短語來識別違規內容的局限。

      文章內容僅供閱讀,不構成投資建議,請謹慎對待。投資者據此操作,風險自擔。

    海報生成中...

    最新新聞

    熱門新聞

    即時

    全球頂級AI創作社區回歸!海藝AI國內首發“全民娛樂化創作

    海藝AI的模型系統在國際市場上廣受好評,目前站內累計模型數超過80萬個,涵蓋寫實、二次元、插畫、設計、攝影、風格化圖像等多類型應用場景,基本覆蓋所有主流創作風格。

    新聞

    市場占比高達35.8%,阿里云引領中國AI云增長

    9月9日,國際權威市場調研機構英富曼(Omdia)發布了《中國AI云市場,1H25》報告。中國AI云市場阿里云占比8%位列第一。

    3C消費

    雅馬哈推出兩款高端頭戴耳機YH-4000與YH-C3000

    雅馬哈昨日宣布推出兩款頭戴式耳機,分別是平板振膜的YH-4000和動圈原理的YH-C3000。

    研究

    IDC:2025上半年全球智能家居清潔機器人出貨量同比暴

    IDC今日發布的《全球智能家居清潔機器人設備市場季度跟蹤報告,2025年第二季度》顯示,上半年全球智能家居清潔機器人市場出貨1,2萬臺,同比增長33%,顯示出品類強勁的市場需求。

    国产日韩精品一区二区_欧美一级片在线播放_久久精品中文字幕电影_久久视频精品在线_亚洲国产成人久久综合一区_久久精品国产精品_国产视频精品免费播放_在线视频中文亚洲_亚洲午夜未满十八勿入免费观看全集_精品亚洲一区二区_国产原创欧美精品_国产色综合天天综合网_九九久久国产精品_欧美极品少妇xxxxⅹ裸体艺术_亚洲国产精品人人爽夜夜爽_尤物九九久久国产精品的分类
    僵尸再翻生在线观看| 99久久夜色精品国产网站| 疯狂做受xxxx高潮欧美日本| 亚洲sss综合天堂久久| 国产精品视频一区二区久久| 97超碰人人在线| 一本久久青青| 国产亚洲人成a一在线v站| 福利在线视频导航| 国产精品三级av在线播放| 国产精品传媒在线| 国产精品网站在线观看| 亚洲综合伊人久久大杳蕉| 中文字幕日韩欧美一区二区三区| 在线电影院国产精品| 国产日韩在线亚洲字幕中文| 亚洲激情在线激情| 欧美日韩一区二区三区视频| 亚洲精品国产第一综合99久久| 欧洲亚洲在线视频| 国产视频欧美视频| 美女网站视频久久| 国产日韩在线视频| 欧美xxxx做受欧美88bbw| 久草资源在线观看| 日韩丝袜视频| 欧美jizz| 欧美性xxxxx| 无码少妇一区二区三区| 国产精品欧美一区二区三区不卡| 欧美美女在线直播| 亚洲色图19p| 黄色在线一区| 午夜精品影院在线观看| 亚洲一区中文字幕在线观看| 不卡一卡2卡3卡4卡精品在| 久久精品女人天堂av免费观看| 91福利视频网站| 欧美一个色资源| 久久九九影视网| 国产成人综合亚洲网站| 亚洲看片免费| 日本精品在线视频| 国产午夜精品视频免费不卡69堂| 亚洲免费av网站| 久久色精品视频| 国产精品一区二区在线观看网站| 亚洲精华一区二区三区| 久久国产电影| 日本在线视频一区二区三区| 免费a级在线播放| 8av国产精品爽爽ⅴa在线观看| 国产精品13p| 黄一区二区三区| 26uuu国产在线精品一区二区| 成人在线精品| 国产精品久久久久久妇女6080| 国产一区精品二区| 亚洲男人天堂九九视频| 亚洲毛片在线看| 日韩三区在线| 国产欧美综合一区二区三区| 欧美日本高清视频在线观看| 2023国产精品自拍| 51ⅴ精品国产91久久久久久| 18久久久久久| 97视频资源在线观看| 综合色就爱涩涩涩综合婷婷| 一本到三区不卡视频| 国产这里只有精品| 91国产精品视频在线| 在线观看日韩av电影| 久久gogo国模啪啪裸体| 国产福利电影在线播放| 国产精品日韩精品中文字幕| 成人午夜毛片| avtt亚洲| 精精国产xxx在线视频app| 日韩的一区二区| 国产高清av在线| 国产成人精品一区二区三区网站观看| 欧美日韩精品免费观看视欧美高清免费大片| 日本精品一区二区| 天堂午夜影视日韩欧美一区二区| 久久成人精品无人区| 欧美午夜精品| 国产69精品久久久久按摩| 亚洲第一福利专区| 六九午夜精品视频| 亚洲人成伊人成综合网小说| 欧美激情自拍| 国产成人一区二区三区影院| 在线免费观看的av网站| 3d动漫精品啪啪| 欧美老女人第四色| 粉嫩av一区二区三区在线播放| 精品国产第一国产综合精品| 91深夜福利视频| 奇米一区二区三区四区久久| 久久爱91午夜羞羞| 国产91丝袜在线18| 大片免费在线观看| 国产精品视频一区二区三区四蜜臂| 青青草97国产精品免费观看无弹窗版| 国产99久久精品一区二区永久免费| 999在线观看精品免费不卡网站| 国产精品资源站在线| 久久美女视频| 午夜精品一区二区在线观看的| 日韩成人精品一区二区三区| 亚洲男人的天堂一区二区| heyzo在线欧美播放| 亚洲人午夜色婷婷| 免费不卡欧美自拍视频| 亚洲第一综合色| 亚洲性视频大全| 久久草视频在线看| 国产精品毛片久久久久久久| 97精品国产97久久久久久春色| 欧美高清一级大片| 国产精品911| 亚洲欧洲三级电影| 天堂资源在线亚洲资源| 热99在线视频| 免费一二一二在线视频| 99久久久久国产精品| 亚洲经典视频在线观看| 中日韩高清电影网| 成人黄色在线免费| 韩国成人精品a∨在线观看| 精品在线播放午夜| 1024在线播放| 日韩经典av| 亚洲精品视频在线观看网站| 99免费精品| 欧美日韩综合网| 日韩欧美亚洲一二三区| 日本免费在线视频| 国产精品综合| 天堂一区二区三区| 中文日韩在线观看| 免费成人美女在线观看.| 国产乱码字幕精品高清av| 在线亚洲激情| 亚洲性av网站| 欧美精品18+| 精品国产伦一区二区三区观看方式| 欧美另类网站| 成人黄色在线电影| 日韩三级免费观看| 九九精品在线播放| 久久精品女人的天堂av| 91麻豆swag| 中文字幕一区在线观看视频| 亚洲无线一线二线三线区别av| 91精品在线一区二区| 亚洲区小说区| 亚洲 国产 日韩 综合一区| 精品麻豆剧传媒av国产九九九| 欧美色图激情小说| 这里只有精品久久| 日韩一区欧美二区| 国产高清精品久久久久| 国产成人福利视频|