国产日韩精品一区二区_欧美一级片在线播放_久久精品中文字幕电影_久久视频精品在线_亚洲国产成人久久综合一区_久久精品国产精品_国产视频精品免费播放_在线视频中文亚洲_亚洲午夜未满十八勿入免费观看全集_精品亚洲一区二区_国产原创欧美精品_国产色综合天天综合网_九九久久国产精品_欧美极品少妇xxxxⅹ裸体艺术_亚洲国产精品人人爽夜夜爽_尤物九九久久国产精品的分类

以創新赴約,為未來賦能!鯤鵬昇騰創新大賽2025全國總決賽即將開賽聯想ThinkCentre X AIO Aura Edition 一體機曝光:27.6 英寸 16:18 屏幕阿福和靈光,能承載螞蟻的TO C野心嗎?啟信慧眼AI驅動智能商業決策,推動商業大數據B端市場革新TCL冠軍中國行,奧運冠軍趙蕊蕊見證小藍翼新一代AI健康空調發布冠軍見證,TCL空調雙新品亮相:定義年輕人“冠軍級”舒適生活中國第一具身大模型獲21億元融資,銀河通用機器人估值突破200億機構:生成式AI與自主AI代理推動電信客戶體驗框架轉型國產替代加速!900次場景落地,天數智芯釋放 AI 算力高成長潛力卡薩帝廚電感恩月推出烤餃子、蒸餃子活動-25℃冰雪大世界人群涌向海爾“溫暖方舟”2025未來產業系列對接活動(陜西行) 成功舉辦仰望U9專屬紀念色“極境森林”上市 售價188萬元!本田放大招!2026全球4款新車曝光 純電0系列量產在即6K 3D、首款1040Hz顯示器降臨!三星Odyssey 2026系列炸場華擎發布600/800系列主板BIOS更新:支持AMD、Intel下代CPU2026年的“開掛神器”:趁著寒促大放價,這臺AI平板必須安排上!得一微電子受邀出席HiPi Chiplet論壇,解讀AI存力芯片創新路徑美的集團加碼新能源,家電巨頭競賽進入下半場智繪低空 領航未來 2025低空經濟產業發展大會在射洪舉辦
  • 首頁 > 企業IT頻道 > 大數據

    小麥10步帶你認識大數據和云計算

    2019年03月04日 10:22:16 來源:中文科技資訊

      麥粉們大家好啊~~小麥連續幾期分享的Smartbi行業案例,得到了大家的熱情反饋,在此小麥向大家說聲:謝謝了!你們的支持,是小麥前進的最大動力,小麥一定再接再厲,為大家帶來更多的案例、更多的干貨…

      那么,本期小麥為大家帶來什么干貨呢?別急,且聽小麥用深入淺出、通俗易懂的語言,分10步帶領大家認識“大數據”和“云計算”這兩個當下最流行的概念,保證大家有所收獲,以后碰到相關的概念不會兩眼一抹黑…是不是心動了呢?那就讓我們開始吧!

      第一步:大數據

      “大數據”這個概念是近幾年開始火起來的,現在可謂是無處不在了。在了解什么是大數據之前,我們先了解一下什么是傳統數據?

      傳統數據就是IT業務系統里面的數據,如客戶資料、財務數據等。這些數據是結構化的,量也不是特別大,一般只是TB級。對比傳統數據,還有一種叫“新數據”,是來源于社區網絡、互聯網等渠道,包括文本、圖片、音頻、視頻等非結構化的數據。目前全世界75%以上都是非結構化數據,而且還一直呈現爆炸性的增長。我們看看下面的圖就更好理解了:

      大數據就是:結構化的傳統數據+非結構化的新數據。

      因而,大數據還具有以下特點,簡稱“4V”:

      8

      Volume(大量):數據體量巨大,從TB級別,躍升到PB級別;

      Variety(多樣):數據類型繁多,有網絡日志、視頻、圖片、地理位置信息等;

      Velocity(高速):處理速度快,可從各種類型的數據中快速獲得高價值的信息,這一點也是和傳統的數據挖掘技術有著本質的不同;

      Value(價值):只要合理利用數據并對其進行正確、準確的分析,將會帶來很高的價值回報。

      第二步:大數據組成

      大數據系統由基礎設施、平臺和應用組成。對比我們平時使用的電腦,基礎設施就是電腦這臺硬件,平臺就是裝在里面的操作系統,應用就是操作系統上面的各種應用程序。

      大數據的應用五花八門,但總體上可分為“業務應用”和“數據分析”兩大類。

      前者包括ERP、CRM等業務系統,后者指的是各種分析應用,包括經營分析、價值分析、人流分析等等。分析系統從業務系統獲取源數據,經過分析后可以反哺業務系統,對其進行賦能(注智),讓其具有智慧。說到這里,大家是不是覺得有點熟悉了?跟我們的BI是不是有某些聯系呢?沒錯了,“大數據平臺”和“數據分析系統”加在一起就是BI的升級版啊!既然是升級版,它與傳統BI有什么區別呢?請看下面就知道啦。

      * 成本更低廉

      去IOE,硬件采用廉價的X86,軟件更多使用開源,節省成本

      * 容災性好

      平臺部署在X86集群上,機器出問題可隨時切換

      * 擴展性好

      X86集群可根據需要隨時進行擴展,提高靈活性

      * 處理效率高

      當數據達到TB級別,處理效率顯著提高

      * 處理類型多

      可以處理結構化、半結構化、非結構化數據

      進一步挖掘價值

      * 最新的

      處理的數據量大,類型多,因而可進一步挖掘數據的價值。

      是不是有很多升級的地方呢?為了支持這些升級,大數據系統需要具備哪些功能呢?這就涉及到架構問題了,跟著小麥繼續往下看吧。

      第三步:大數據架構

      我們已經知道大數據系統由基礎設施、平臺和應用組成,我們現在進一步細分,請看下圖:

      基礎設施由通過局域網或互聯網連接的X86集群組成,為大數據平臺提供最基本的硬件支持。

      大數據平臺由基礎架構、數據處理和數據服務三部分組成:

      基礎架構負責對基礎設施進行系統管理,為數據處理提供分布式底層服務;數據處理負責數據的采集、存儲、計算;數據服務負責將處理后的數據提供給上層應用使用。大數據應用是面向用戶的各種應用系統,包括業務應用和數據分析。大數據系統的總體架構就是這樣子,是不是跟我們平時見到的BI架構很像呢? 通過這個表格對比我們就更清楚了:

      下面我們將圍繞這個架構展開說明。理解了這個架構,小麥的目的也就達到啦。

      第四步:虛擬化

      基礎設施提供計算、存儲、網絡三種能力,是大數據平臺的根基。但是如何解決以下問題:

      * 大量的機器如何管理

      當集群的狀態改變,也即增加或者減少一些機器的時候,難道要去修改平臺的配置嗎?

      * 如何充分利用系統資源

      當集群的能力只使用了一部分,而這個時候需要一部新的機器用來部署其它系統,難道是從集群上拆下一部機器來提供嗎?

      * 如何解決彈性問題

      當高峰期的時候,系統可能需要20部機器,平時只需要10部。那么我們是提供多少部合適呢?如果提供20部,平時空閑下來的10部如何處理?

      這些問題有一種解決方法:虛擬化。就是把集群作為一個整體進行管理,可以根據需要從某些機器中調配相關資源,快速組成一部“新的機器”。例如可以用機器A的CPU1/2性能、1/3的內存,和機器B的1/5硬盤組成。

      當集群的狀態改變時,我們只需要修改虛擬化軟件的配置,減少對平臺的影響。當集群有多余的資源時,可以虛擬出一些新的機器給其它系統使用,充分利用了系統資源。

      虛擬化的主流商業軟件是Vmware,開源的軟件有Xen、KVM等。

      第五步:云化

      虛擬化雖然帶來資源配置的靈活性,但也有明顯的缺陷。配置一部“新的機器”需要人工操作,配置非常麻煩,最多只能管理幾百臺電腦的規模,作為企業內部的應用是可以的。但對于提供公眾服務的互聯網公司來說,需要上萬部電腦的規模,通過虛擬化的方式是行不通的。所以又有了新技術的出現:云化,也即把基礎設施作為一項服務提供。請看下圖:

      最早是亞馬遜基于自身電商業務的發展,傳統的IT架構已經滿足不了需求,所以基于開源的虛擬化軟件開發了AWS(Amazon Web Service),可以支持超大規模的集群應用。在解決自己的業務需求后,亞馬遜發現可以把這項技術作為一項單獨的業務推向市場,這就是現在穩居全球市場頭把交椅的的亞馬遜云服務。同樣的背景,阿里巴巴也基于Xen推出了市場化的阿里云,現成已經成為國內云市場的老大。由此我們也知道為什么云服務做得最早、最好的都是互聯網公司了吧?因為他們有自身的業務在驅動。規模上萬部的機器,以資源池(數據中心)的形式分布在不同的地域上(很多建設在廣西、貴州、內蒙等欠發達省份,電費、人工比較便宜,又可以促進當地就業),通過調度中心進行統一管理,這就是公有云平臺。

      在亞馬遜開展商業化云服務的同時,美國另一家叫Rackspace的公司也推出OpenStack在跟亞馬遜競爭。無奈競爭不過人家,最后決定和NASA(美國國家航空航天局)合作,把OpenStack開源,一起成立了開源云平臺。后來各家傳統的IT巨頭紛紛加入這個開源的社區,經過二次開發和包裝后推出了自己的私有云平臺,和自家的硬件或解決方案打包一起銷售。

      不管是公有云,還是私有云,都是實現了基礎設施的時間靈活性和空間靈活性,把基礎設施作為一項服務提供,也即:Infranstracture as a Service(IaaS)

      第六步:Hadoop

      大數據平臺的基礎架構采用Hadoop,包括HDFS和MapReduce兩部分:

      * HDFS在集群上實現分布式文件系統,負責對文件的操作。(類似windows下的文件管理系統NTFS)

      * MapReduce在集群上實現分布式計算和任務處理,負責將作業分解成多個任務,分派到多部機器一起執行,同時監控執行情況,保證每個任務都能順利執行,所有任務結束后再將結果匯總。(類似多個人一起數圖書館的書,每個人算一個書架(Map),最后把所有結果加在一起(Reduce))

      那么,如何把Hadoop安裝到集群下面那么多機器上呢?每部機器的配置、操作系統都可能不一樣。

      解決辦法就是采用“容器“技術:先將Hadoop打包到一個封閉的容器中,再統一發布到各部機器上。容器能夠根據機器實際環境做出相應的調整,保證Hadoop的順利安裝。(類似用統一規格的集裝箱來運送貨物)

      容器的主流技術是開源的Docker。不僅僅是Hadoop可以通過容器進行安裝,所有的應用都可以使用。

      現在已經在集群下每部機器安裝了Hadoop,那么Hadoop是如何運行的呢?請看下圖:

      Hadoop把集群下其中一個節點拿來當Master,其它節點當Slave。對于HDFS來說,Master就是NameNode,負責管理文件系統的命名空間和控制客戶端訪問;Slave就是DataNode,負責管理存儲的數據。對于MapReduce來說,Master就是JobTracker,負責調度構成一個作業的所有任務,這些任務分布在不同的TaskTracker上;Slave就是TaskTracker,負責執行由JobTracker指派的任務。

      Hadoop已經衍生出很多不同的升級版本,目前應用最成熟、最廣泛的是Spark。

      第七步:數據處理

      數據處理是對數據的采集、存儲和計算。因為大數據有各種各樣的應用,不同的應用,數據的種類、結構,數據的實時性要求都可能不同。所以要根據實際情況進行數據庫選型,這是大數據平臺設計的關鍵,將影響到整個平臺的整體性能。不同的數據庫類型可以進行混搭,同時采用不同的ETL技術。

      目前常見的各種數據庫類型如下:

      * 傳統數據庫

      主流數據庫有Oracle、DB2、MySQL,主要應用于小規模應用系統,或者為了利用已有的資源,同時降低系統升級的風險,采用的ETL技術是Datastage、Kettle等。

      * 內存數據庫

      主流數據庫有SQLite、HANA,主要應用于對實時性要求高,需要實時處理的數據,如實時指標展示,精準營銷等,采用的ETL技術是流處理技術kafka。

      * MPP數據庫

      MPP是指大規模并行處理,MPP數據庫支持X86集群,常見的有Greanplum、Vertica等,主要應用于大規模結構化數據分析,如信令分析、DPI分析,一般采用Kettle作為ETL工具。

      * NoSQL數據庫

      NoSQL是指半結構化或非結構化數據庫,主流的數據庫有MongoDB、HBase和HDFS等,HBase用來存儲半結構化或結構很稀疏的數據,HDFS用來存儲非結構化數據。HBase和HDFS都不支持SQL,需要使用Hive作為SQL接口執行一些簡單的查詢操作。NoSQL數據庫基于Hadoop平臺,主要應用于大規模半/非結構化離線分析,例如互聯網數據分析、文檔分析等,一般采用網絡爬蟲技術進行ETL。

      第八步:數據服務

      經過處理后的數據,一般不提供給上層應用直接用SQL訪問,這一點與數據倉庫不同。數據倉庫把采集過來的數據經過處理后存儲在匯總層,上層應用直接用SQL訪問。但大數據平臺把處理后的數據進行封裝和分類,為上層應用提供可靈活調用的數據服務接口,可以保證數據訪問的規范性和安全性。接口的承載方式有:文件、消息、API、SDK、界面集成,其流程如下:

      * 數據格式化

      對原始數據進行格式化,過濾字段并進行排序。

      * 數據封裝

      對格式化后的數據及其元數據進行封裝,以實現對外一致、標準化的數據訪問接口。

      * 數據分類

      根據封裝后的數據,按主題進行接口分類。

      * 數據服務

      上層應用可通過數據服務接口調用數據,實現數據的服務功能。

      數據服務接口屏蔽掉大數據平臺的所有細節,把平臺作為一項服務提供給應用使用,這種方式稱之為Platform as a service(PaaS)。

      在公有云提供商中,一般都會有對應的PaaS服務提供,如阿里云的EDAS(企業級分布式應用服務)。

      私有云是企業自建,對數據訪問的控制沒那么嚴格。為了開發效率,應用通?梢酝ㄟ^SQL直接訪問數據。

      第九步:大數據應用

      前面小麥已經為大家介紹了基礎設施和大數據平臺,也介紹了私有云和公有云的區別。對于大數據應用來說,私有云上的應用,就是我們平時說的企業信息化系統,只不過這些系統是采用大數據的架構。而公有云上的應用,指的是我們平時使用的互聯網服務,如微信、微博、支付寶等。但是,隨著云服務市場的發展,越來越多的傳統IT廠商也通過公有云為公眾提供服務,比如我們熟悉的 MicrosoftOffice 365。這種把軟件作為服務提供的方式稱之為:Software as a Service(SaaS)。

      在國際市場,比較常見的企業級SaaS服務有客戶管理服務Saleforce、團隊協同服務Google Apps等等。國內市場的金蝶、微軟、Oracle也都提供多種SaaS產品和服務。我們可以看一下IDC對2017-2022年中國公有云整體市場的預測(單位:百萬美元):

      從上表可以看出,整個云服務市場的年復合增長率達到了41%,其中PaaS服務增長最快,達到了55.7%。中國企業級SaaS市場份額全球第二,未來五年依舊呈現快速增長態勢,年復合增長率達到35.7%。到了2022年,整個SaaS市場規模達到400億人民幣。

      第十步:云計算

      大家有沒有發現,前面說了那么久,還沒提到云計算呢?其實前面都是鋪墊,現在就要給大家介紹云計算了。云計算就是一種IT架構,是一種IT資源的交付和使用模式。前面介紹的IaaS、PaaS、SaaS就是云計算架構下對不同資源的交付模式,分別將基礎設施、平臺、軟件以服務的形式提供給用戶使用。

      到目前為止,小麥已經把相關的概念都介紹給大家了。我們把前面的大數據架構圖進一步細化,大家是否看得懂了呢?

      如果大家看懂了,那小麥本次的介紹也算功德圓滿了。如果還沒看懂,請跳到第一步再看一遍,哈哈。。。。

      文章內容僅供閱讀,不構成投資建議,請謹慎對待。投資者據此操作,風險自擔。

    海報生成中...

    [No.X029]

    最新新聞

    熱門新聞

    即時

    全球頂級AI創作社區回歸!海藝AI國內首發“全民娛樂化創作

    海藝AI的模型系統在國際市場上廣受好評,目前站內累計模型數超過80萬個,涵蓋寫實、二次元、插畫、設計、攝影、風格化圖像等多類型應用場景,基本覆蓋所有主流創作風格。

    新聞

    市場占比高達35.8%,阿里云引領中國AI云增長

    9月9日,國際權威市場調研機構英富曼(Omdia)發布了《中國AI云市場,1H25》報告。中國AI云市場阿里云占比8%位列第一。

    企業IT

    華為坤靈發布IdeaHub千行百業體驗官計劃,助力中小企

    9月24日,華為坤靈召開“智能體驗,一屏到位”華為IdeaHub千行百業體驗官計劃發布會。

    3C消費

    雅馬哈推出兩款高端頭戴耳機YH-4000與YH-C3000

    雅馬哈昨日宣布推出兩款頭戴式耳機,分別是平板振膜的YH-4000和動圈原理的YH-C3000。

    研究

    IDC:2025上半年全球智能家居清潔機器人出貨量同比暴

    IDC今日發布的《全球智能家居清潔機器人設備市場季度跟蹤報告,2025年第二季度》顯示,上半年全球智能家居清潔機器人市場出貨1,2萬臺,同比增長33%,顯示出品類強勁的市場需求。

    国产日韩精品一区二区_欧美一级片在线播放_久久精品中文字幕电影_久久视频精品在线_亚洲国产成人久久综合一区_久久精品国产精品_国产视频精品免费播放_在线视频中文亚洲_亚洲午夜未满十八勿入免费观看全集_精品亚洲一区二区_国产原创欧美精品_国产色综合天天综合网_九九久久国产精品_欧美极品少妇xxxxⅹ裸体艺术_亚洲国产精品人人爽夜夜爽_尤物九九久久国产精品的分类
    天天做夜夜做人人爱精品| 国产男女猛烈无遮挡91| 91在线视频官网| 欧美日韩精品免费观看视完整| 成人午夜看片网址| 成人在线视频网站| 欧美亚洲一区二区三区| 亚洲黄色成人| 亚洲大胆美女视频| 日韩少妇视频| 亚洲天堂日韩电影| 在线播放91灌醉迷j高跟美女| 激情五月综合色婷婷一区二区| 久久6精品影院| 亚洲ww精品| 热99久久精品| 久久婷婷国产综合国色天香| 成人久久精品视频| 亚洲小说欧美另类社区| 亚洲最新视频在线播放| 国产精品一级| 国产精品美女一区二区三区| 国产精品高潮粉嫩av| 一本色道久久综合| caopen在线视频| 不卡在线一区| 538任你躁精品视频网免费| 国产精品18久久久久久首页狼| 中文字幕人成不卡一区| 亚洲区小说区| 国产麻豆精品| 精品免费av在线| 久久久影院免费| fc2在线中文字幕| 日韩一区二区在线免费观看| 麻豆九一精品爱看视频在线观看免费| 久久在线观看免费| 国产成人免费视频一区| 日韩欧美有码在线| 精品国产亚洲一区二区三区大结局| 国产精品视频一区二区三区四| 美女久久一区| 亚洲午夜电影网| 欧美午夜不卡| 日韩性xxxx爱| 欧美日韩国产高清电影| 粉嫩在线一区二区三区视频| 色香阁99久久精品久久久| 国产一区免费| 99久精品国产| 老司机精品视频一区二区三区| 污网站在线免费看| 色综合久久久久久中文网| 国产精品探花在线| 久久在线观看视频| 一区二区三区四区在线观看国产日韩| 99在线精品一区二区三区| 色噜噜偷拍精品综合在线| 亚洲国产综合视频在线观看| 日韩一区二区在线看| 高清视频在线观看一区| 日韩在线精品强乱中文字幕| 欧美人交a欧美精品| 久久精品美女视频网站| 亚洲欧美精品一区| 青青视频一区二区| 成人在线视频中文字幕| 国产日本一区二区三区| 国产精品福利影院| 久久精品视频一区二区| 亚洲三级在线免费| 日韩美女激情视频| 日韩欧美久久一区| 综合伊人久久| 国产伦精品一区二区三毛| 精品视频在线你懂得| 裸模一区二区三区免费| 免费成人黄色| 欧美天天综合色影久久精品| 一区二区三区久久| 午夜精品久久久久久久蜜桃app| 欧美日韩在线精品一区二区三区| 精品一区二区三区在线观看| 不卡视频一区| 91探花福利精品国产自产在线| 欧美日韩女优| 97超碰人人模人人爽人人看| 亚洲国产欧美不卡在线观看| 91成人影院| 欧美另类69精品久久久久9999| 亚洲精品成人在线| 亚洲欧洲日韩一区二区三区| 另类成人小视频在线| 91精品国产色综合久久不卡蜜臀| 久久久av水蜜桃| 99re热精品视频| 在线精品国产欧美| 亚洲精品日产精品乱码不卡| 欧美激情aⅴ一区二区三区| 日韩理论片在线| 国产精品久久久久久影视| 久久久久久夜精品精品免费| 亚洲成人直播| 日本精品视频一区二区三区| 欧美xxxx做受欧美护士| 日韩脚交footjobhd| 久久国产精品99国产| 99精品国产热久久91蜜凸| 中文字幕一区二区不卡| 久久久在线视频| 玖玖视频精品| 国产98在线|日韩| 哺乳挤奶一区二区三区免费看| 尤物九九久久国产精品的分类| 欧美日产国产成人免费图片| 欧美日韩中文字幕一区二区| 欧美日韩激情| 免费高潮视频95在线观看网站| 亚洲尤物影院| 伊人www22综合色| 色天下一区二区三区| 国产一区二区三区四区三区四| 日本麻豆一区二区三区视频| av在线播放成人| 中文字幕国产亚洲2019| 六月婷婷综合| 精品国产综合久久| 理论片在线不卡免费观看| 国精产品一区一区三区mba下载| 免费观看成人高| 亚洲成人最新网站| 色呦呦一区二区三区| 成人自拍视频在线观看| 国内视频在线精品| 午夜欧美视频在线观看| 红桃视频在线观看一区二区| 999久久久免费精品国产| 午夜电影久久久| 成人午夜电影免费在线观看| 日本一本a高清免费不卡| 北条麻妃国产九九精品视频| 新狼窝色av性久久久久久| 免费观看在线综合| 国产精品一区高清| 日韩午夜一区| 狼人精品一区二区三区在线| 毛片基地黄久久久久久天堂| 二区三区四区高清视频在线观看| 国产农村妇女毛片精品久久麻豆| 色综合激情五月| 99精品国产91久久久久久| 色综合天天综合网天天看片| 日韩av中文字幕一区| 色偷偷av一区二区三区| 欧美激情性爽国产精品17p| 国内精品一区二区| 国产欧美日韩免费观看| 91免费在线观看网站| 亚洲人成在线电影| 亚洲一区国产视频| 日韩城人网站| 国产一区二区三区天码| 日本精品一区二区三区在线播放视频| 免费h精品视频在线播放|