国产日韩精品一区二区_欧美一级片在线播放_久久精品中文字幕电影_久久视频精品在线_亚洲国产成人久久综合一区_久久精品国产精品_国产视频精品免费播放_在线视频中文亚洲_亚洲午夜未满十八勿入免费观看全集_精品亚洲一区二区_国产原创欧美精品_国产色综合天天综合网_九九久久国产精品_欧美极品少妇xxxxⅹ裸体艺术_亚洲国产精品人人爽夜夜爽_尤物九九久久国产精品的分类

  • 首頁 > 數據存儲頻道 > 數據.存儲頻道 > 存儲資訊

    騰訊方睿:詳解Kubernetes資源拓撲感知調度

    2022年08月26日 10:41:50 來源:CSDN云原生

      在云原生場景下,為了使CPU利用率更高,以及各容器之間不會由于激烈競爭而引起性能下降,容器的資源分配需要更精細化。

      2022年8月11日,中國信通院、騰訊云、FinOps產業標準工作組聯合發起的《原動力x云原生正發聲 降本增效大講堂》系列直播活動第6講上,騰訊星辰算力平臺高級工程師方睿分享了Kubernetes資源拓撲感知調度。

      資源競爭與資源感知問題

      從CPU的體系結構上來看,現代CPU多采用NUMA架構和方式。

      NUMA架構是非對稱的,每個NUMA node上會有自己的物理CPU內核,以及每個NUMA node之間也共享L3 Cache。同時,內存也分布在每個NUMA node上的。某些開啟了超線程的CPU,一個物理CPU內核在操作系統上會呈現兩個邏輯的核。

      實際上,CPU內核是分布在NUMA node上,NUMA node內本身就有一些親和性的元素。

      右圖中,CPU開始的訪問速度是不一樣的。

      如果程序都跑在同一個NUMA node上,可以更好地去共享一些L3 Cache,L3 Cache的訪問速度會很快。如果L3 Cache沒有命中,可以到內存中讀取數據,訪存速度會大大降低。

      因此,從CPU體系結構中可以看到,如果采用一些錯誤的CPU分配方式,可能會導致進程訪存速度急劇下降,嚴重影響應用程序的性能。

      在這樣的體系結構下,存在云計算中常見的吵鬧的鄰居問題。當多個容器在節點上共同運行時,由于資源分配的不合理,會對CPU本身的性能造成影響。

      從理想的使用方式來看,如果每個進程都使用各自的CPU內核,并且不會跨NUMA node訪問,相互之間不會有太多爭搶。

      從糟糕的使用方式來看,如果兩個進程的CPU內核在分配時,可能會沒有遵循NUMA的親和性,會帶來很大的性能問題,體現在三個方面:

      CPU爭搶帶來頻繁的上下文切換時間;

      頻繁的進程切換導致CPU高速緩存失敗;

      跨NUMA訪存會帶來更嚴重的性能瓶頸。

      Kubernetes中有CPU Manager的功能,CPU Manager可以做一些CPU核心的分配工作。上圖是Kubernetes的一些數據呈現。

      在Guaranteed和Burstable兩種Pod混部測試下,將CPU Manager執行時間做基準,如果是原生Kubernetes的方式在不同測試下,性能有較大波動,最差可能會達到1.8倍左右。

      在Stand-Alone Workloads的情況下,做CPU的綁定和完全不做CPU綁定,執行時間差別很大。因為劇烈的CPU爭搶以及頻繁的上下文切換,會導致約1倍的性能差距。

      在吵鬧的鄰居問題下,Kubernetes是如何解決的呢?

      CPU Manager是其中的一個解決方法,它被放在Kubelet中,CPUSet將會被CPU Manager分在Default和Exclusive兩個池子中。

      Default主要在兩種情況下使用。一種是系統守護進程:kube-reserved、system-reserved,另一種是特殊類型的Pod:Burstable、BestEffort、請求非整數CPU的Guaranteed。

      Exclusive是完全排他的CPU池,主要在兩種情況下使用。一種是Pod:請求整數CPU的Guaranteed,另一種是Topology Manager:滿足拓撲管理器定義的要求。

      但原生Kubernetes也存在局限性。

      調度器不感知節點資源拓撲。

      Kubernetes中調度器只負責為Pod選擇節點,并不感知節點NUMA拓撲結構,Pod的CPU分配交給Kubelet完成。當節點單NUMA node上沒有足夠的CPU時,Pod啟動失敗,控制器重建Pod后會陷入死循環。

      CPUSet分配策略過于單一。

      Kubernetes中CPU Manager默認為請求整數CPU的Guaranteed Pod分配獨占的CPUSet,但實際上Pod想定制自己的CPU分配策略,可能只是想分配到一個NUMA node內,或是固定CPU甚至是不做綁核。

      在混部場景下,也存在離線算力感知問題。

      當在線與離線任務混部在同一臺主機上,在線閑時,離線任務可以充分使用資源,提升主機利用率;在線忙時,離線任務會被在線搶占,等待資源釋放。

      當離線可用算力受在線干擾動態變化時,調度器僅感知節點靜態資源(Kubelet采集)。

      如果忙時調度過多的離線任務,會導致劇烈的資源爭搶,并且每個離線Pod的性能都會下降。

      因此,調度器在調度時,需要動態感知離線實時算力。驅逐器也應當在線嚴重干擾離線時,驅逐離線Pod,保證節點的算力穩定。

      Kuberbnetes精細化調度

      在原生Kubernetes不能很好地解決資源競爭與資源感知問題時,亟需對資源進行更加精細化的調度。

      如上圖,是精細化調度系統的結構。

      Cassini-Worker能從節點采集資源拓撲信息并創建NRT對象。

      Cassini-Master能從外部系統采集節點擴展信息(可選)。

      Scheduler-Plugins能擴展調度器,為Pod進行資源拓撲分配。

      擴展調度器是通過Scheduler-Plugins來實現的,可以在幾個插入點做一些插件,保證實現標庫資源頭部感知調度的功能。

      在Fitter的插件內,可以過濾節點拓撲資源和選擇Zone并分配資源。

      在Score的插件內,可以根據Zone個數降序打分。

      在Reserver的插件內,可以為待綁定節點預留拓撲資源避免數據不一致。

      在PreBind的插件內,可以將拓撲調度結果附加到Pod Annotations中。

      在調度算法上,可以從性能和負載均衡兩個方面做出考慮,以便更好地選擇節點和拓撲。

      在性能方面,優先選擇Pod能綁定在單NUMA node內的節點。如果找不到該節點,可以優先選擇在同一個NUMA Socket內的NUMA node

      在負載均衡方面,優先選擇空閑資源更多的NUMA node。

      容器CPUSet管理

      Kubernetes的精細化調度做出一些拓撲感知,而實際落到節點上,為了更好地實現資源分配,我們設計了一個資源分配系統。

      首先,節點Kubelet會監聽到Pod并準備啟動Pod。

      隨后,節點Kubelet調用容器運行時接口啟動容器。

      與此同時,節點Cassini-Worker通過List Kubelet的10250端口獲得節點上的所有Pod,再從Pod Annotations中獲取調度器的拓撲調度結果。

      節點Cassini-Worker調用容器運行時接口來更改容器的綁核結果。

      關于容器多級資源QoS分配策略,在CPUSet的策略上,可以劃分為四種:

      Exclusive:它可以獨占CPU內核心,其他Pod不可使用,一般是高利用率的容器會采取該策略;

      None:不做CPU綁核的策略,可以使用節點的Default CPU共享池;

      NUMA:讓CPUSet固定到NUMA node上的共享池內;

      Immovable:將CPU內核心固定,讓其他Pod也可共享。

      在CPU內核心選擇策略上:

      首先,按照調度結果獲取NUMA node上需分配的核心數;

      隨后,從共享池中選擇可分配的CPU內核心;

      同時,還希望一個Pod盡量不使用在同一個物理核上的邏輯核。

      在離線混部場景下的實踐

      由于離線混部場景中,離線會受到在線的影響,算力是波動的。因此,在離線混部場景下,還會做一些差異化重調度:

      當在線負載上升時,離線的算力會被壓制。因此,離線的Pod需要及時驅逐,以便剛好滿足節點離線算力的要求;

      通過改造Descheduler組件,建立通用的可配置的平臺通用驅逐框架,支持Metrics驅逐,以及支持動態調整/配置驅逐策略;

      建立算力平臺通用Metrics;

      支持業務自定義Metrics驅逐。

      在不同混部場景下,容器CPUSet策略也是不同的。

      離線CVM混部的場景中,一臺物理機的各個NUMA node上都生產了許多在線的CVM,當在線利用率很低時,需要更好地利用資源。

      此時需要采取Exclusive策略:

      離線CVM通過內核VMF調度器獲取低優的CPU時間片;

      離線Pod通過獨占CPU內核心的方式,保證互不干擾;

      內核VMF調度器保證離線Pod在忙時,可實現核心漂移,充分利用CPU資源。

      在容器混部的場景中,在線Pod和離線Pod同時部署在同一臺物理機上。

      此時需要采取NUMA策略:

      離線Pod通過限制Cgroups,獲取低優的CPU時間片;

      離線Pod綁定整個NUMA node,防止某幾個CPU內核心被壓制;

      離線Pod共享整個NUMA node,充分利用CPU資源。

      總結

      本文圍繞Kubernetes的資源拓撲感知調度的主題展開。從CPU體系結構和吵鬧的鄰居問題切人,隨后闡述了原生Kubernetes的不足和混部場景下的算力感知的局限,最后從采集節點拓撲資源、擴展Kubernetes調度器、多級資源QoS分配策略幾個方面給出了相應的解決方案。在策略的優化后,資源得到更合理地利用。

      未來,Kubernetes精細化調度將會覆蓋更多的場景,例如碎片GPU、網絡拓撲架構、電力調度。

      【原動力×云原生正發聲降本增效大講堂】第一期聚焦在優秀實踐方法論、資源與彈性、架構設計;第二期聚焦全場景在離線混部、K8s GPU資源效率提升、K8s資源拓撲感知調度主題,點擊『此處』進入活動專題,帶你體驗云原生降本增效實踐案例、了解如何解決企業用云痛點、掌握降本增效關鍵技能……

      ————————————————

      版權聲明:本文為CSDN博主「CSDN云原生」的原創文章,遵循CC 4.0 BY-SA版權協議,轉載請附上原文出處鏈接及本聲明。

      原文鏈接:https://blog.csdn.net/m0_46700908/article/details/126518766

      文章內容僅供閱讀,不構成投資建議,請謹慎對待。投資者據此操作,風險自擔。

    海報生成中...

    最新新聞

    熱門新聞

    即時

    全球頂級AI創作社區回歸!海藝AI國內首發“全民娛樂化創作

    海藝AI的模型系統在國際市場上廣受好評,目前站內累計模型數超過80萬個,涵蓋寫實、二次元、插畫、設計、攝影、風格化圖像等多類型應用場景,基本覆蓋所有主流創作風格。

    新聞

    市場占比高達35.8%,阿里云引領中國AI云增長

    9月9日,國際權威市場調研機構英富曼(Omdia)發布了《中國AI云市場,1H25》報告。中國AI云市場阿里云占比8%位列第一。

    企業IT

    華為坤靈發布IdeaHub千行百業體驗官計劃,助力中小企

    9月24日,華為坤靈召開“智能體驗,一屏到位”華為IdeaHub千行百業體驗官計劃發布會。

    3C消費

    雅馬哈推出兩款高端頭戴耳機YH-4000與YH-C3000

    雅馬哈昨日宣布推出兩款頭戴式耳機,分別是平板振膜的YH-4000和動圈原理的YH-C3000。

    研究

    IDC:2025上半年全球智能家居清潔機器人出貨量同比暴

    IDC今日發布的《全球智能家居清潔機器人設備市場季度跟蹤報告,2025年第二季度》顯示,上半年全球智能家居清潔機器人市場出貨1,2萬臺,同比增長33%,顯示出品類強勁的市場需求。

    国产日韩精品一区二区_欧美一级片在线播放_久久精品中文字幕电影_久久视频精品在线_亚洲国产成人久久综合一区_久久精品国产精品_国产视频精品免费播放_在线视频中文亚洲_亚洲午夜未满十八勿入免费观看全集_精品亚洲一区二区_国产原创欧美精品_国产色综合天天综合网_九九久久国产精品_欧美极品少妇xxxxⅹ裸体艺术_亚洲国产精品人人爽夜夜爽_尤物九九久久国产精品的分类
    欧美综合在线视频观看| 91在线一区二区三区| 久久天堂精品| 国产精品少妇自拍| 日韩激情av在线播放| 成人精品亚洲| 亚洲少妇30p| 91亚洲国产成人久久精品| 美国十次av导航亚洲入口| 精品久久人人做人人爱| 青青影院在线观看| 99久久99九九99九九九| 亚洲精选久久| 久久久com| 国产精品成人国产| 色婷婷精品久久二区二区蜜臂av| 亚洲麻豆视频| 国产三级欧美三级| 欧美性受ⅹ╳╳╳黑人a性爽| 538prom精品视频线放| 欧美老肥婆性猛交视频| 丁香婷婷综合网| 日韩精品欧美| 中文字幕日本乱码精品影院| 一本久道久久综合中文字幕| 亚洲精品国产一区二区三区四区在线| 欧美日韩中文| 欧美日韩一区二区电影| 亚洲精品乱码久久久久久蜜桃麻豆| 成人精品一区二区三区四区| 久久的色偷偷| 欧洲亚洲一区二区三区| 狠狠色丁香婷婷综合久久片| 残酷重口调教一区二区| 免费精品国产| 999视频在线观看| 国产成人99久久亚洲综合精品| 欧美极品视频一区二区三区| 久久综合电影| 成人欧美一区二区三区的电影| 久久久久久12| 1769国内精品视频在线播放| 日本vs亚洲vs韩国一区三区二区| av大全在线| 亚洲最大的成人av| 久久九九99| 国产精品福利视频| 久久精品嫩草影院| 中文字幕亚洲一区二区三区五十路| 国产精品草莓在线免费观看| 亚洲高清免费| 亚州欧美在线| 韩国三级在线一区| 国产一区视频在线| 欧美一区二区人人喊爽| 亚洲电影天堂av| 精品播放一区二区| 国产福利一区二区三区在线视频| 欧美撒尿777hd撒尿| 国产一区二区三区亚洲| www国产成人免费观看视频 深夜成人网| 国产精品盗摄久久久| 成人免费精品视频| 日韩免费精品视频| 国产午夜精品在线| 国产亚洲一区在线播放| 欧美日韩另类图片| 视频国产一区| 中文字幕中文乱码欧美一区二区| 欧美激情一区二区三区高清视频| 久久久久久69| 制服丝袜中文字幕在线| 欧美三区不卡| 欧美日韩加勒比精品一区| 国产成人久久精品麻豆二区| 日韩精品视频在线免费观看| 欧美爱爱网站| 91精品国产高清自在线看超| 欧美婷婷在线| 亚洲专区中文字幕| 周于希免费高清在线观看| 18视频在线观看网站| 亚洲激情在线视频| 欧美色大人视频| 欧美激情精品久久久久久久变态| 国产精品诱惑| 欧美猛交免费看| 99久久99久久久精品齐齐| 欧美日韩国产精品一区| 久久久噜噜噜| 日本一区视频在线观看| 欧美夫妻性生活xx| 欧美成人网在线| 黄色一级片在线观看| 国产精品无码永久免费888| 午夜精品99久久免费| 中文在线а√天堂| 日韩视频精品在线观看| 国产一区二区精品久| 中文字幕一区二区三区在线观看| 68精品国产免费久久久久久婷婷| 日本精品影院| 伊人av综合网| 欧美色视频日本高清在线观看| 欧美hdxxxxx| 五月天激情综合网| 国产精品91视频| 国产精品欧美经典| 91久久嫩草影院一区二区| 欧美二区在线| 精品国产不卡| 亚洲国产精品综合小说图片区| 91影院在线免费观看视频| 日韩国产美国| av一区二区三区免费| 欧美日韩少妇| 久久成人免费| 中文字幕av免费专区久久| 亚洲一级少妇| 亚洲欧美日本日韩| 午夜激情一区二区三区| 国产日韩精品在线播放| 黄色网一区二区| 欧美自拍偷拍| 国产精品中文字幕亚洲欧美| 综合久久一区| 黄色亚洲精品| 日韩精品在线网站| 欧美一区二区三区男人的天堂| 99视频热这里只有精品免费| jvid一区二区三区| 一区二区三区高清| 国产精品国产三级国产| 性欧美videohd高精| 久久精品视频一区二区| 99久久精品免费看国产免费软件| 97视频资源在线观看| 搜成人激情视频| 欧美激情一区二区三区成人| 亚洲精品老司机| 亚洲毛片一区二区| 日本成人在线播放| 国产一区二区福利| 婷婷久久综合九色综合99蜜桃| 91久久免费观看| 超碰国产在线| av电影在线播放高清免费观看| 中文字幕一区二区三区av| 99久久久精品免费观看国产| 国产国产精品| 亚洲老妇xxxxxx| 午夜日韩视频| 99re热这里只有精品免费视频| 亚洲丁香日韩| 大地资源网3页在线观看| 欧美中文一区二区三区| 一区二区三区欧美视频| 视频一区视频二区中文| 好吊成人免视频| 国产精品免费电影| 欧美日韩黄色| 高清国语自产拍免费一区二区三区| 欧日韩不卡在线视频| 国产一区导航|