Gartner 2016數據倉庫和分析數據管理解決方案魔力象限 圖片來源:Gartner
在中國市場,其產品備受各行各業尤其是金融行業的信賴。有機構調查數據顯示,當時Oracle占到了我國數據庫市場份額的一半左右,另外約3成的市場份額被國外數據庫占據,國產數據庫的市場份額不足2成。
下面這張圖片拍攝于1987年,圖中站在講臺旁邊穿著白襯衫打著領帶的年輕人,正在教授SQL語言。他是甲骨文的第7號員工Andy Mendelsohn,曾任Oracle數據庫技術執行副總裁,負責甲骨文全球數據庫的研發,直到今年年初才退休。
他來到中國的契機,是當時我國西部最大的鋼鐵生產基地攀枝花鋼鐵公司,有一個1200萬的計算機管理信息系統項目,系統下面還有13個子應用系統,這一級別的IT工程必須要用大型的商用數據庫。
彼時Oracle還沒有進入中國市場,于是在項目組購買了Oracle 5.1數據庫之后,對方寄過來三箱英文教材,參加項目的40余人一邊翻譯一邊開發,還分成幾組互相培訓,甚至內部編寫了一個實用教程。1989年項目完成時,培訓教程也被整理出版,這就是Oracle的第一部中文教材《Oracle數據庫實用教程》,項目也獲得了1989年冶金部的科技進步一等獎。之后,Oracle正式進入中國市場。
中國早期的信息化建設隨處可見Oracle的身影,隨著九十年代后期國家稅務總局啟動了世界銀行稅收征管改革(CTAIS)技術援助項目,Oracle數據庫在我國金融數據庫市場逐漸占據了主流位置。微軟的SQL Server、IBM的DB2、Sybase、Informix等國外的數據庫,也陸陸續續進入國內市場。
相比之下,國產數據庫本身起步晚,1999年,中國第一家真正意義上的國產數據庫企業人大金倉(現已改名中電科金倉)才成立,此時距離Oracle發布第一個版本的數據庫已經過去了20年。
在很長的一段時期里,國產數據庫與Oracle等國外數據庫相比,差距是明顯的。不過當下,國產數據庫有了長足的發展,在部分領域也可以宣稱達到世界一流水平了。究其原因,筆者認為,國產數據庫廠商的努力固然重要,也要考慮時代的進程。
不久前,2025 OceanBase年度發布會在北京召開,在一眾國產數據庫中,它不能說是唯一的主角,但通過觀察OceanBase,我們的確能看到,國產數據庫是如何抓住歷史機遇,逐漸發展和壯大的。
一、互聯網和國產化
早期的國產數據庫追不上Oracle的原因很簡單——后者的先發優勢太大了。2017年,當時幾家老牌國產數據庫廠商中,以南大通用GBase的市場占有率最高,但其年營業收入僅為3.05億元人民幣——作為對比,甲骨文2017財年僅研發投入就達到了60億美元,而且在之前的10年里花費850億美元并購了130余家公司。
起步晚、投入少,還存在競爭壁壘,在相似的技術路線上,國產數據庫能夠維持發展,并滿足部分政府、軍工等關鍵信息領域的需求,就已經極為難得。
但互聯網的快速發展,卻給了后發者“彎道超車”的機會。2008年,《自然》雜志提出了“Big Data”(大數據)的概念,互聯網上非結構化數據迎來井噴式的爆發,揭開了大數據時代的序幕。
在中國,BAT抓住了時代的機會,完成了對新浪、搜狐、網易“舊三巨頭”的反超,但急速增長的背后,他們面對海量數據同樣焦頭爛額,增長的利潤都被“IOE”(IBM的小型機、Oracle的數據庫和EMC的存儲)吃掉,繼續增長如同飲鴆止渴。
比如騰訊,當時按核計費一年要支付給Oracle上億美金,而且越發無法滿足大規模、高并發、大容量的需求,每次發生宕機事故,只能等甲骨文的技術人員來維護解決。這種情況下,去“IOE”對全球的大型互聯網公司來說都是勢在必行。
重要的是,互聯網公司有場景需求,也有錢,讓他們有動力也有能力去推動這件事情。
從谷歌的那篇論文——《基于集群的簡單數據處理:MapReduce》,到Hadoop、Spark等開源技術的出現,互聯網公司基于分布式架構的存儲、資源調度和計算,只需要疊加機器數量,就能夠以更低廉的成本達到和突破以往集中式架構下的性能。
這件事發展到后面,就是云計算的興起了,不過多展開。
在數據庫領域,從90年代末期開始,開源數據庫就逐漸興起,谷歌等互聯網巨頭大規模應用MySQL等開源數據庫,即使后來MySQL被Oracle收購,也沒改變這一趨勢,在商業數據庫領域,谷歌最早嘗試了研發分布式數據庫——Google Spanner,這對瓦解“IOE”模式也起到了重要的作用,也不做過多展開了。
本文的主角OceanBase,也誕生于互聯網公司日益旺盛的大數據需求,和當時數據庫產品供給不足的矛盾中。多年前,筆者曾采訪過OceanBase的CTO楊傳輝,當時他還是OceanBase的研究員,據他透露,除了支付寶前CTO程立的強力推動外,壓力測試時Oracle出現了抖動,也是推動他們轉向自研數據庫的重要原因。
采訪中,他對國產數據庫長期發展緩慢的看法,讓筆者印象深刻:“沒有業務就會導致自研的系統沒有人來試驗,系統就不成熟,因為不成熟就沒有業務,進入這樣一個惡性循環的話,這個系統很難做好。要跨過這個惡性循環,自研數據庫至少要5-10年的時間,我覺得5年是最低的,而且需要有類似雙十一這樣現象級的業務場景,普通業務場景誕生不了世界級的數據庫。”
簡單列一下時間軸,就能清晰地看到其中的聯系:
2010年:創始人陽振坤加入,OceanBase 誕生;
2011年:OceanBase 進入電商業務,服務阿里巴巴集團數十個電商平臺業務;
2014年:支撐支付寶核心交易系統,承擔“雙11”10%的交易流量;
2015年:承擔“雙11”100%的交易流量;網商銀行成立,OceanBase 服務網商銀行,成為全球首個應用于金融核心業務系統的分布式關系數據庫;
2016年:支撐支付寶核心賬務、核心支付系統,支撐 12 萬筆/秒支付峰值、17.5 萬筆/秒交易峰值;
2017年:替換螞蟻集團核心系統最后一個Oracle數據庫。
這里著重提一下,2017至2019年,OceanBase V2.0版本對MySQL的兼容性逐步邁進,最終實現了對Oracle的全面兼容,這意味著企業在遷移核心業務系統時,不需要對應用層進行大規模改造,極大降低了分布式數據庫的落地門檻——或者干脆點說,OceanBase有了“反攻”Oracle的能力,在金融、政務等傳統依賴Oracle的行業打開了市場。
下圖是2018年Gartner的OLTP數據庫魔力象限,Oracle依舊高居領導者的位置,但也出現了阿里云的身影,不得不說是歷史性的進步了。其實從時間上來看,阿里云的云原生數據庫POLARDB在2015年才開始自研,2017年10月正式發布,2018年商用,是明顯晚于OceanBase的,后者知名度相對較低,可能是吃了2020年才獨立的虧。
當然也有可能,是因為那時是云數據庫迅猛發展的階段,Amazon Web Services的位置都快和Oracle肩并肩了。這也是大勢所趨,兩年后Gartner將OPDBMS(Operational Database Management Systems)和DMSA(Data Management Solutions for Analytics)合并為CDBMS(Cloud Database Management Systems),理由是“There is Only One Cloud Database DBMS Market”,云原生架構和分布式技術最終深度融合為云數據庫。

2018年的Gartner分析型數據管理解決方案魔力象限
至于國產化,這個就不細講了,懂的都懂。國家出于基礎軟件自主可控的目的,對國產數據庫有政策上的傾斜,除了在軍工、政府等關鍵領域應用國產數據庫外,在金融等領域也要求國產化。2014年中國銀監會39號文件《關于應用安全可控信息技術加強銀行業網絡安全和信息化建設的指導意見》中,就提出“在操作系統、數據庫等領域要加大探索和嘗試力度;從2015年起,各銀行業金融機構對安全可控信息技術的應用以不低于15%的比例逐年增加,直至2019年達到不低于75%的總體占比”。
這里放一頁筆者多年前參加活動時看到的PPT,Oracle創始人拉里·埃里森(Larry Ellison)在2018年10月接受FOX采訪時曾強調,不能讓中國的科技公司打敗美國的科技公司,在那時,他就將中國視為美國面臨的最大競爭對手了。
所以有些事情是必須要做的。2019年年中,Oracle中國研發中心關閉,大規模裁員1600人,這被視為Oracle在中國的“敗走”。同年10月,在“數據庫世界杯”TPC-C基準測試中,OceanBase以超過6000萬的分數,打破了由Oracle保持了9年的OLTP世界紀錄,成為首個登頂的國產數據庫。

在這里,用OceanBase CEO楊冰接受筆者采訪時的回復來做下總結,他認為,OceanBase的發展,抓住了三個重要的時代機遇,其中前兩個分別是:
“第一波是互聯網的浪潮,本身我們也出身于阿里和螞蟻的大環境,如果沒有這一波浪潮帶來的海量的數據和互聯網的發展,其實很難倒逼團隊做如此大的投入,從第一行代碼開始去寫數據庫。這是以前所有的傳統數據庫廠商都沒有遇到過的(機遇),所以也使得我們以創新的方式把分布式和數據庫等結合在一起,完成了一次我認為是技術上彎道超車的積累。
第二波浪潮,假如前面這十年是讓我們快速形成技術的話,后面OceanBase商業化的這五六年,是讓我們快速從技術變成產品的過程,我們也經歷了中國分布式升級和國產化升級的浪潮。這個過程的意義在于,第一,它的時間非常短、非常迅速;第二,都是非常核心的關鍵系統做整個升級的替換。就像‘雙11’一樣,技術挑戰也是非常大的,而且是全行業去做,極大地縮短了我們把技術變成成熟產品的周期。”
二、AI時代的機遇
第三個時代機遇,分兩個方面來講,技術上就是進入了AI時代。
為什么這么說呢?楊冰表示:“AI的話,它對于數據庫產生了新的需求,這些其實是讓我們一下子跟世界級的數據庫領域的玩家站在同一起跑線,因為這個場景全球都是新的,都是一樣的。而且可能因為中國應用比較發達,數據基建發展得比較快,數據量比較大,反而我們在這個場景當中,中國數據庫的玩家有更多的機會。”
具體來講,和大數據時代類似,AI時代的數據庫需要處理的數據量會變得越來越大,而且數據類型也與以往不同。大模型的計算能力強,但沒有記憶,需要數據庫產品來存儲和管理上下文,也即上下文工程。以前,是數據先進行結構化,然后進入數據庫處理,在AI場景中,數據可能未經處理就直接進入數據庫中。
近幾年,業界新的數據庫產品,其實都是面向AI的,比如向量數據庫、supabase等產品,數據庫領域的技術范式已經由應用服務慢慢延伸到智能服務。業界主流的數據庫,包括Oracle和MongoDB,也在引擎內部逐步增加了搜索的能力,支持AI原生的場景。誰能有把數據變成可被模型實時調用、可信執行的能力,誰就握住了AI時代的機遇。
“只要談到AI數據庫,很多人的腦海里面想到的第一個詞叫向量搜索,我認為向量搜索只是AI數據庫的初級階段,最終所有的向量搜索都會逐步演進為混合搜索,能不能支持混合搜索是AI數據庫核心能力的分水嶺。”楊傳輝認為,未來數據庫除了處理結構化數據,還需要處理半結構化甚至是無結構化的數據,或者針對無結構化的數據來建立各種各樣的語義索引,比如說向量索引、圖索引和全文索引等,并需要有一套基于結構化、半結構化,以及無結構化各種索引之上的混合搜索。
他給出了一個具體的定義——面向Agent多模混合搜索。今年4月27日,OceanBase發布了Datax AI戰略,宣布要打造 AI 時代的一體化數據底座。2025年,V4.4版本發布了共享存儲,采用存算分離架構,計算節點和數據存儲實現了完全的分離,計算節點能夠根據業務負載的變化,在主流云平臺上靈活地進行擴縮容,解決了AI時代打通多云底座的問題。
![]()
本次發布會上,OceanBase發布了4.4一體化融合版本,將TP、AP與AI能力集成于單一內核,同期還開源了其首款AI原生混合搜索數據庫seekdb,支持向量、全文、標量、GIS數據統一檢索,兼容30+主流AI框架。
![]()
seekdb產品架構
“這一次seekdb的發布,其實也是一個比較大的動作,它是完全獨立于現在OceanBase的一個分支,這也是我們下的決心。我們覺得AI的發展速度會超出我們的想象,所以我們希望以這樣的方式跑得更快一點,但是這個東西也對OceanBase工程化能力的各個方面提出進一步的挑戰。”楊冰說。
而商業上的時代機遇,就是全球化。隨著大量的中國企業出海,包括軟件企業、硬件企業和云廠商,對國產數據庫的全球化是有利好的。OceanBase誕生的第一天,就希望成為“世界級數據庫”,全球化也是其發展的必經之路。
不過,這條路即使對現在的OceanBase來說也是充滿挑戰。
市場競爭方面,還是拿Oracle來舉例。兩個月前,Oracle的股價大漲,一度將拉里·埃里森送上了世界首富的寶座,雖然最近其股價又大跌,不過機構看空的重要原因是認為其人工智能計劃過于“激進”。在AI時代,Oracle提出了“融合數據庫”的概念,Oracle的多模融合主要涉及數據類型與整體架構,比如圖數據、數據流、數據倉庫與數據湖架構,以及多種應用層級。在構建應用時,如果應用系統涉及多個數據庫,架構會變得復雜,容易出錯。融合數據庫通過整合不同數據類型和工作負載,支持企業級應用所需的高可靠性、安全性和可擴展性。
今年7月,筆者采訪了甲骨文公司副總裁及中國區董事總經理吳承楊,他在采訪中表示:“國產數據庫傾向于在應用層或數據中臺解決所有問題,而對錯需實踐驗證。但在智能體時代,代碼多由機器生成,如果希望從數據庫層面解決安全等問題,數據庫結構過于復雜對 AI 的使用是一個挑戰,F在很多企業做 AI 項目時,會把現有數據平臺的應用抽取到外部另起爐灶,這其實是誤區。”
在多模態和一體化上,OceanBase和Oracle的思路是相似的。吳承楊也表示,大多數國產數據庫近一兩年都在談融合數據庫的事情,但他認為,國產數據庫要做好,還需要一定的時間。
“融合數據庫不是幾種數據類型,是大量的數據類型,你可以看到我們在這上面有包括空間數據、結構化數據、MongoDB,JSON 的東西,文本的東西,XML 的東西,包括向量數據。坦率來講,我今天還沒有看到,一個國產數據庫能夠把一個向量數據庫融合在這里面,還有圖數據要融合進來,我覺得這是需要大量的投入。”吳承楊說。
在中國市場,Oracle也非常重視中國企業出海,即China to Global(C2G),在產品端,吳承楊認為Oracle在數據合規和數據主權化等方面也有優勢。
結語
自2020年商業化以來,OceanBase的全球客戶數已突破4000家,連續五年年均增速超100%,深入到了金融、政務、通信、零售、制造、互聯網等十余領域,服務覆蓋16個國家和地區、60多個地域、240多個可用區。
在其長期深耕的金融領域,OceanBase服務了全部政策性銀行、5家國有大行,覆蓋了超100家資產規模千億級以上銀行,支撐190余個核心系統、1000多個關鍵業務;非銀領域,75%頭部保險集團、80%頭部券商、60%頭部基金公司已部署OceanBase,其中超半數用于核心系統。IDC報告顯示,OceanBase連續兩年穩居中國分布式金融本地部署市場第一。
在去年年底Gartner最新發布的全球云數據庫管理系統魔力象限中,OceanBase雖然還未上榜,但已經連續兩年獲選“榮譽提及”?紤]到2022年OceanBase才正式推出云數據庫產品,近三年,OB Cloud客戶數年均增長115%,營收占比已達30%,這個表現很不錯了。
![]()
在采訪中,楊冰認為,OceanBase過去為國產數據庫的發展,主要做了三個方面的貢獻:
一是數據庫和分布式相結合,解決擴展性、可靠性和一致性的問題,OceanBase在工程化方面,做到了技術上的創新和突破;
二是在整個存儲結構上,以前是以Tree為主,OceanBase用LSM Tree數據結構,把它和數據庫相結合,演化出真正的HTAP,真正的存算分離和存算一體架構,包括單機分布式一體化,在存儲層面引領著創新;
三是在解決可用性的層面上,OceanBase做到在數據不丟失的情況下,RTO小于8秒,這是以前傳統架構沒有做到過的。
現在,我們談論國產數據庫是否已經崛起,還不是十分肯定。全球化和AI時代的到來,就是新一輪的“大考”。未來,OceanBase能否通過創新的方式,拓展數據庫的技術邊界,可能就是其能否成為“世界級數據庫”的關鍵。
文章內容僅供閱讀,不構成投資建議,請謹慎對待。投資者據此操作,風險自擔。
海報生成中...
海藝AI的模型系統在國際市場上廣受好評,目前站內累計模型數超過80萬個,涵蓋寫實、二次元、插畫、設計、攝影、風格化圖像等多類型應用場景,基本覆蓋所有主流創作風格。
IDC今日發布的《全球智能家居清潔機器人設備市場季度跟蹤報告,2025年第二季度》顯示,上半年全球智能家居清潔機器人市場出貨1,2萬臺,同比增長33%,顯示出品類強勁的市場需求。