人工智能的邊界和挑戰是什么?現在走到了哪里,又該向何處去?5月24日-25日在成都舉辦的CCF年度盛會——2019 CCF青年精英大會(YEF 2019)上,人工智能領域專家們展開了討論,中國科學院張鈸院士給出的答案是“人工智能剛剛起步,現在離起點不遠,人工智能之路還很長,并且永遠在路上。”
雖然人工智能技術的行業應用越來越廣泛,仿佛真的站在風口準備擁抱下一場革命,但正如專家們所言,對于人工智能的發展,應該保持謹慎的樂觀態度。當前人工智能還面臨諸多挑戰,例如數據孤島問題、隱私保護問題、安全問題、如何從感知智能發展到認知智能再到更遠的讓機器擁有自我認知等等,突破這些瓶頸,或許才是人工智能走得更遠的關鍵。
其中數據孤島和隱私保護問題是當前人工智能大規模產業化應用過程中遇到的突出問題。對此,人工智能國際專家、微眾銀行首席人工智能官楊強教授在大會上發表了題為《用戶隱私,數據孤島和聯邦遷移學習》的特邀報告,他的答案是:開展新一代的人工智能算法研究,突破數據孤島和小數據的限制,同時保護數據安全和用戶隱私。這個答案的背后是一項新的領先全球的技術,叫做“聯邦遷移學習。”

大數據時代并未真正到來,小數據和數據孤島林立
楊強教授指出,人工智能發展離不開大數據,人工智能技術如果是火箭引擎,大數據就是燃料,但是數據量的激增并不意味著真正的“大數據”時代到來。多數行業中是數據質量不高的“小數據”,是一個個數據孤島,數據割裂嚴重。
例如在法律領域,如果想得到一個非常好的樣本,需要經歷很長的鏈條,經過很長時間,有法官、律師等多方參與,才能把一個樣本標注好,這導致有標注的高質量數據并不多,并且分散在各地的各級法院。而在醫療領域這種數據孤島更加嚴重,例如醫療影像往往分散在各個醫院。導致這種結果的原因很多,包括監管原因、機構各自的利益、流程制度限制等。
從遷移學習到聯邦學習,打通數據孤島
能否從技術角度尋求解決方案?作為國際人工智能界“遷移學習”(transfer learning)領域的發起人和帶頭人,楊強教授從遷移學習中找尋問題的答案,首先想到通過知識遷移解決“小數據”問題。如果面臨的是“小數據”,就找到一個類似的“大數據”,舉一反三,幫助只有小數據的任務運用來自其他相關任務的大數據,從而獲得更好的表現,使得建立的模型能夠更可靠,魯棒性好,不受外界干擾,平穩運行,這在人工智能落地的應用上是非常重要的一個特性,同時也能夠防止隱私泄露。這種從源領域遷移到目標領域的方式,在金融、工業、信息流推薦等領域都有應用,例如貸款風控策略在不同用戶類別間的遷移、推薦系統中推薦策略遷移、輿情分析系統中的關鍵詞遷移等。
雖然遷移學習可以有效解決“小數據”的問題,但是實際上現在面臨的不僅僅是“小數據”的問題,而是“數據割裂”、“數據孤島”。這不僅僅是技術的問題,不能通過簡單的數據整合(Data integration)解決,而是要克服政策、監管、技術等多維度難題。此時“聯邦學習”(Federated Learning)提供了新的思路,讓多方參與,共同建模。
從聯邦學習到聯邦遷移學習,保護數據隱私
打通數據,共同建模,這本是一個美好的期望方向,但數據隱私保護的日益嚴格帶來了嚴峻挑戰,歐盟數據隱私保護法GDPR(The General Data Protection Regulation )作為“史上最嚴厲”的數據隱私保護法案成為一個信號,全世界都在加強數據隱私保護方面的立法建設,那么是否可以讓聯邦學習參與方只交換模型而不交換數據?讓數據不出本地,從而保護數據隱私?據楊教授介紹,數學家們提供了新思路——將同態加密技術(Homomorphic Encryption,HE)融入聯邦學習,其核心思想并不復雜,假設A加B是一個公式里的兩項,對整個公式加密,那么HE就可以把它表達成對A的加密加上對B的加密。這樣可以讓參與方不上傳數據,只上傳加密的算法模型參數而進行共同建模,在這個過程中,即使通過多次交換,也不能重構出另一方的數據,真正實現數據不泄露。
在實際應用中,有基于同一特征維度,不同用戶群體的“橫向聯邦”,例如谷歌的手機終端聯邦學習,微眾銀行聯合多家銀行建立的反洗錢模型,以及針對同一用戶群體,不同特征維度的“縱向聯邦”,例如根據用戶在銀行的信用表現進行個性化保險定價。除此以外,微眾銀行AI團隊首次提出了“聯邦遷移學習”,將“聯邦學習”和“遷移學習”相結合,即使是在用戶群體和特征維度重合都小的情況下,也可以進行合作,這意味著無論是政府機構和金融機構之間,還是互聯網機構和金融機構之間,或者是其他各領域之間,都可以實現跨界合作。

聯邦學習不僅是技術方向,更是社會問題
楊強教授提到,雖然有了技術工具,微眾銀行也對外開源了通用的聯邦學習框架平臺Federated AI Technology Enabler(FATE),但如何設立激勵機制吸引機構進入聯邦,形成良性生態,則包含博弈論、機制設計、法律等多領域,聯邦學習不僅是能解決數據孤島和數據隱私保護的技術方向,更是一個復雜的社會協同治理問題。除了吸納更多企業加入聯邦生態,微眾銀行AI團隊也在積極推動聯邦學習國際標準IEEE標準的制定,這一標準有望在兩年內出臺,為立法和監管提供更多技術依據。

聯邦學習將走向何方?人工智能將走向何方?楊強教授的觀點是,數據可以不出本地,各個數據擁有方可以在安全、保密的前提下交換人工智能模型的參數,以達到聯合建模的目的。這種不同學科的交叉融合是趨勢,聯邦學習和遷移學習,或者是其他機器學習方法,都可以相互融合,發揮各自的特點,從一個領域下的人工智能算法理論邁向多個領域,這才是更有價值的研究。
文章內容僅供閱讀,不構成投資建議,請謹慎對待。投資者據此操作,風險自擔。
海報生成中...
海藝AI的模型系統在國際市場上廣受好評,目前站內累計模型數超過80萬個,涵蓋寫實、二次元、插畫、設計、攝影、風格化圖像等多類型應用場景,基本覆蓋所有主流創作風格。
IDC今日發布的《全球智能家居清潔機器人設備市場季度跟蹤報告,2025年第二季度》顯示,上半年全球智能家居清潔機器人市場出貨1,2萬臺,同比增長33%,顯示出品類強勁的市場需求。