• / 22
  • 下載費用:30 金幣  

包括分散的部件的動態地組成的計算節點.pdf

摘要
申請專利號:

CN201510359347.X

申請日:

2015.06.25

公開號:

CN105426245A

公開日:

2016.03.23

當前法律狀態:

實審

有效性:

審中

法律詳情: 實質審查的生效IPC(主分類):G06F 9/50申請日:20150625|||公開
IPC分類號: G06F9/50 主分類號: G06F9/50
申請人: 伊姆西公司
發明人: J·J·羅塞; K·杜拉佐; S·J·托德
地址: 美國馬薩諸塞州
優先權: 14/320,069 2014.06.30 US
專利代理機構: 北京市金杜律師事務所11256 代理人: 王茂華; 辛鳴
PDF完整版下載: PDF下載
法律狀態
申請(專利)號:

CN201510359347.X

授權公告號:

|||

法律狀態公告日:

2016.04.20|||2016.03.23

法律狀態類型:

實質審查的生效|||公開

摘要

本發明的各實施例涉及包括分散的部件的動態地組成的計算節點。討論了一種用于從分散的硬件部件創建動態地組成的計算節點的方法、制造品和裝置。從資源池向計算節點動態地分配這些部件。

權利要求書

1.一種用于管理分散式基礎結構中的資源的方法,所述方法包
括:
將分散的硬件資源匯聚成資源池,所述資源池包括計算資源池、
存儲器資源池和存儲資源池,其中所述分散的硬件資源與計算結構通
信;
在與所述分散式基礎結構關聯的管理系統處接收工作負荷請求;
從所述工作負荷請求確定資源要求;以及
從所述資源池向動態地組成的計算節點(“DCCN”)分配專用資
源,其中所述分配基于所述資源要求。
2.根據權利要求1所述的方法,其中所述分散式基礎結構包括
多個硬件架,所述多個硬件架包括硬件部件,其中所述硬件部件通過
所述計算結構相互通信。
3.根據權利要求1所述的方法,其中所述計算資源池包括計算
資源,所述存儲器資源池包括存儲器資源,并且所述存儲資源池包括
存儲資源。
4.根據權利要求1所述的方法,還包括從所述資源池向所述
DCCN動態地分配附加專用資源。
5.根據權利要求1所述的方法,還包括監視所述資源池。
6.根據權利要求5所述的方法,其中所述監視包括帶內監視和
帶外監視中的至少一種。
7.根據權利要求1所述的方法,還包括將所述分散式基礎結構
劃分成多個視圖,其中個別視圖描述由該視圖封裝的部件。
8.根據權利要求7所述的方法,還包括在第二視圖內嵌套第一
視圖,其中所述第一視圖描述由所述第一視圖和所述第二視圖二者封
裝的部件。
9.一種用于管理分散式基礎結構中的資源的計算機程序產品,
所述計算機程序產品包括用計算機可執行程序編碼的非瞬態計算機
可讀介質,所述代碼實現:
將分散的硬件資源匯聚成資源池,所述資源池包括計算資源池、
存儲器資源池和存儲資源池,其中所述分散的硬件資源與計算結構通
信;
在與所述分散式基礎結構關聯的管理系統處接收工作負荷請求;
從所述工作負荷請求確定資源要求;以及
從所述資源池向動態地組成的計算節點(“DCCN”)分配專用資
源,其中所述分配基于所述資源要求。
10.根據權利要求9所述的計算機程序產品,其中所述分散式基
礎結構包括多個硬件架,所述多個硬件架包括硬件部件,其中所述架
中的所述硬件部件通過所述計算結構相互通信。
11.根據權利要求9所述的計算機程序產品,還包括從所述資源
池向所述DCCN動態地分配附加專用資源。
12.根據權利要求9所述的計算機程序產品,還包括監視所述資
源池。
13.根據權利要求12所述的計算機程序產品,其中所述監視包
括帶內監視和帶外監視中的至少一種。
14.根據權利要求9所述的計算機程序產品,還包括將所述分散
式基礎結構劃分成多個視圖,其中個別視圖描述由該視圖封裝的部
件。
15.根據權利要求14所述的計算機程序產品,還包括在第二視
圖內嵌套第一視圖,其中所述第一視圖描述由所述第一視圖和所述第
二視圖二者封裝的部件。
16.一種用于管理分散式基礎結構中的資源的系統,所述計算機
系統包括被配置為執行指令的計算機處理器,所述指令包括:
將分散的硬件資源匯聚成資源池,所述資源池包括計算資源池、
存儲器資源池和存儲資源池,其中所述分散的硬件資源與計算結構通
信;
在與所述分散式基礎結構關聯的管理系統處接收工作負荷請求;
從所述工作負荷請求確定資源要求;
從所述資源池向動態地組成的計算節點(“DCCN”)分配專用資
源,其中所述分配基于所述資源要求。
17.根據權利要求16所述的系統,其中所述分散式基礎結構包
括多個硬件架,所述多個硬件架包括硬件部件,其中所述架中的所述
硬件部件通過所述計算結構相互通信。
18.根據權利要求16所述的系統,還包括從所述資源池向所述
DCCN動態地分配附加專用資源。
19.根據權利要求16所述的系統,還包括監視所述資源池。
20.根據權利要求16所述的系統,還包括將所述分散式基礎結
構劃分成多個視圖,其中個別視圖描述由該視圖封裝的部件。

說明書

包括分散的部件的動態地組成的計算節點

相關申請的交叉引用

本申請與通過完全引用而結合于此、同日提交的以下申請有關:
美國專利申請第14/320,001號、名稱為“CONTENTFABRICFORA
DISTRIBUTEDFILESYSTEM”(EMC案號EMC-14-0278),第
14/319,889號、名稱為“SOFTWAREOVERLAYSFOR
DISAGGREGATEDCOMPONENTS”(EMC案號EMC-14-0280),第
14/318,805號、名稱為“APPLICATIONANDINFORMATION
MOVEMENTINACLOUDENVIRONMENT”(EMC案號
EMC-14-0264),第14/318,831號、名稱為“CLOUDBOOK”(EMC案
號EMC-14-0265),以及第14/319,773號、名稱為“MIGRATING
PRIVATEINFRASTRUCTURESERVICESTOACLOUD”(EMC案號
EMC-14-0281)。

技術領域

本發明總體上涉及計算機平臺,并且更特別地涉及用于從分散
的(disaggregated)硬件部件創建動態地組成的計算節點的系統和方
法。

背景技術

信息技術基礎結構(infrastructure)已經演進。早期基礎結構包
括與大型機通信的瘦客戶端。大型機包括由基礎結構中的所有客戶
端共享的硬件資源。這些基礎結構可以被稱為“第一平臺”。

大型機最終地失去對通用個人計算機和/或服務器的普及。這些
計算機包括被一起捆綁到單片金屬盒中的硬件部件并且普遍地用作
為用于更復雜的系統的構建塊。這些基礎結構可以被稱為“第二平
臺”。

目前有從大型機、個人計算機和服務器轉向新的第三平臺基礎
結構的趨勢。第三平臺基礎結構可以被至少五個趨勢概括:移動性、
社會性、大數據、云和信任。

因此需要一種用于向第三平臺基礎結構分配硬件資源的改進的
方法、制造品和裝置。

發明內容

根據本發明的一個實施例,公開了一種用于管理分散式基礎結
構中的資源的方法,該方法包括:將分散的硬件資源匯聚成資源池,
該資源池包括計算資源池、存儲器資源池和存儲資源池,其中該分
散的硬件資源與計算結構通信;在與該分散式基礎結構關聯的管理
系統處接收工作負荷請求;從該工作負荷請求確定資源要求;以及
從該資源池向動態地組成的計算節點(“DCCN”)分配專用資源,其
中該分配基于該資源要求。

在該方法中,其中該分散式基礎結構包括多個硬件架,該多個
硬件架包括硬件部件,其中該硬件部件通過該計算結構相互通信。

在該方法中,其中該計算資源池包括計算資源,該存儲器資源
池包括存儲器資源,并且該存儲資源池包括存儲資源。

在該方法中,還包括從該資源池向該DCCN動態地分配附加專
用資源。

在該方法中,還包括監視該資源池。

在該方法中,其中該監視包括帶內監視和帶外監視中的至少一
種。

在該方法中,還包括將該分散式基礎結構劃分成多個視圖,其
中個別視圖描述由該視圖封裝的部件。

在該方法中,還包括在第二視圖內嵌套第一視圖,其中該第一
視圖描述由該第一視圖和該第二視圖二者封裝的部件。

根據本發明的另一實施例,公開了一種用于管理分散式基礎結
構中的資源的計算機程序產品,該計算機程序產品包括用計算機可
執行程序編碼的非瞬態計算機可讀介質,該代碼實現:將分散的硬
件資源匯聚成資源池,該資源池包括計算資源池、存儲器資源池和
存儲資源池,其中該分散的硬件資源與計算結構通信;在與該分散
式基礎結構關聯的管理系統處接收工作負荷請求;從該工作負荷請
求確定資源要求;以及從該資源池向動態地組成的計算節點
(“DCCN”)分配專用資源,其中該分配基于該資源要求。

在該計算機程序產品中,其中該分散式基礎結構包括多個硬件
架,該多個硬件架包括硬件部件,其中該架中的該硬件部件通過該
計算結構相互通信。

在該計算機程序產品中,還包括從該資源池向該DCCN動態地
分配附加專用資源。

在該計算機程序產品中,還包括監視該資源池。

在該計算機程序產品中,其中該監視包括帶內監視和帶外監視
中的至少一種。

在該計算機程序產品中,還包括將該分散式基礎結構劃分成多
個視圖,其中個別視圖描述由該視圖封裝的部件。

在該計算機程序產品中,還包括在第二視圖內嵌套第一視圖,
其中該第一視圖描述由該第一視圖和該第二視圖二者封裝的部件。

根據本發明的又一實施例,公開了一種用于管理分散式基礎結
構中的資源的系統,該計算機系統包括被配置為執行指令的計算機
處理器,該指令包括:將分散的硬件資源匯聚成資源池,該資源池
包括計算資源池、存儲器資源池和存儲資源池,其中該分散的硬件
資源與計算結構通信;在與該分散式基礎結構關聯的管理系統處接
收工作負荷請求;從該工作負荷請求確定資源要求;從該資源池向
動態地組成的計算節點(“DCCN”)分配專用資源,其中該分配基于
該資源要求。

在該系統中,其中該分散式基礎結構包括多個硬件架,該多個
硬件架包括硬件部件,其中該架中的該硬件部件通過該計算結構相
互通信。

在該系統中,還包括從該資源池向該DCCN動態地分配附加專
用資源。

在該系統中,還包括監視該資源池。

在該系統中,還包括將該分散式基礎結構劃分成多個視圖,其
中個別視圖描述由該視圖封裝的部件。

附圖說明

將通過結合附圖的以下具體描述容易地理解本發明,在附圖中,
相似標號表示相似結構單元,并且在附圖中:

圖1描繪了與本公開內容的一個實施例一致的傳統基礎結構。

圖2描繪了與本公開內容的一個實施例一致的分散式基礎結構。

圖3描繪了與本公開內容的一個實施例一致的邏輯資源池。

圖4描繪了與本公開內容的一個實施例一致的用于創建動態地
組成的計算節點的過程。

圖5描繪了與本公開內容的一個實施例一致的用于嵌套視圖的
流程圖。

圖6描繪了與本公開內容的一個實施例一致的在分散的硬件部
件上安裝軟件的架構。

圖7描繪了與本公開內容的一個實施例一致的用于在分散的部
件上安裝軟件的過程。

圖8描繪了與本公開內容的一個實施例一致的用于確定資源要
求的過程。

圖9描繪了與本公開內容的一個實施例一致的用于遷移軟件的
過程。

圖10描繪了與本公開內容的一個實施例一致的用于在兩個軟件
解決方案之間建立通信的過程。

具體實施方式

以下與圖示了本發明的原理的附圖一起提供了本發明的一個或
者多個實施例的具體描述。盡管結合這樣的實施例描述了本發明,
但是應當理解,本發明不限于任何一個實施例。恰好相反,本發明
的范圍僅由權利要求限制并且本發明涵蓋許多備選、修改和等效。
出于示例的目的,在以下描述中闡述了許多具體細節以便提供對本
發明的透徹理解。出于示例的目的而提供了這些細節,并且可以在
沒有這些具體細節中的一些或者所有具體細節的情況下根據權利要
求實現本發明。出于清楚的目的,尚未具體描述在與本發明有關的
技術領域中已知的技術材料從而使得沒有不必要地使本發明難以理
解。

應當認識到,可以用多種方式實施本發明、包括作為過程、裝
置、系統、設備、方法或者計算機可讀介質(比如計算機可讀存儲
介質或者計算機網絡),其中通過光或者電子通信鏈路發送計算機程
序指令。應用可以采用在通用計算機上執行的軟件的形式或者在硬
件中被硬接線或者硬編碼。在本說明書中,這些實現方式或者本發
明可以采用的任何其它形式可以被稱為技術。一般而言,可以在本
發明的范圍內變更公開的過程的步驟的順序。

這里描述的方法、過程和系統使分散的硬件資源和/或部件能夠
被組合成動態地組成的計算節點(這里也被稱為“DCCN”或者“計算
節點”)。傳統基礎結構包括在罩(enclosure)的內部預組裝的硬件部
件。這些基礎結構普遍地在罩基礎上被擴展并且經常在存儲服務器
和計算/存儲器服務器之間被劃分。然而,傳統基礎結構在云環境中
并未良好地伸縮。它們受制于環境中的服務器數目和服務器容量。
為了增加環境的資源,必須物理地添加新部件或者罩從而消耗時間
和添加成本。這里公開的方法、系統和過程通過提供一種用于將分
散的硬件部件組合成DCCN的機制來減輕這些顧慮。

圖1描繪了與本公開內容的一個實施例一致的傳統基礎結構。
不同于參照圖2等后續圖討論的系統,圖1中所示的系統被專門構
建用于給定的實體或者應用。該系統可以包括通過網絡104相互通
信的服務器100和存儲服務器102。在一個實施例中,網絡104可以
包括通過光纖信道交換機106連接的光纖信道。

服務器100可以包括經由網絡接口控制器(“NIC”)112與架頂
(“TOR”)交換機110通信的計算和/或存儲器資源108。計算/存儲
器資源108可以通過主機總線適配器(“HBA”)114與網絡104對接。
在一個實施例中,計算機服務器100主要地包括處理資源(比如計
算機存儲器或者處理器),并且包含有限存儲資源。

存儲服務器102可以包括由互連結構118連接的存儲資源116。
在一個實施例中,存儲服務器102可以是存儲區域網絡(“SAN”)的
一部分。存儲資源116可以例如是帶或者自旋盤資源。存儲服務器
102還可以包括與互連118通信的存儲處理器120。HBA120可以與
網絡104對接,從而允許從服務器100接收或者向服務器100傳輸
數據。

圖1的傳統基礎結構帶來許多挑戰。第一,構成硬件部件通常
由罩的類型內部(比如服務器架)捆綁在一起。例如,服務器100
可以包括在單個機器的內部捆綁的計算/存儲器資源108和TOR交換
機110。相似地,存儲服務器102可以包括在機器的內部捆綁在一起
的存儲資源116。添加附加資源因此可能需要物理地添加新罩或者部
件,從而造成系統停機和/或開支。

第二,傳統基礎結構中的流量流可以被表征為北-南(“N-S”),
這意味著I/O主要地從服務器100向南經過網絡104流向存儲服務器
102。服務器100可以按照這一N-S方式被綁定到存儲服務器102,
從而創建豎井式環境(siloedenvironment)。作為結果,完全地利用
的服務器組不能溢出而消耗來自分離、未充分利用的豎井式環境的
資源。相似地,數據服務(比如對齊復制(snapcopy)、災難恢復和
/或備份)不能在豎井式環境之間被共享。作為替代,每個豎井式環
境必須包括這些高可用性/彈性模型的它自己的實例。

N-S數據流也帶來延時和通信問題。例如,在基礎結構內的通信
可能需要沿著N-S數據路徑的多個跳躍和截獲。這些跳躍可能從在
硬件部件之間的通信所需要的不同層和協議而產生。例如,數據可
以由計算/存儲器資源108處理、使用HBA114和光纖信道交換機106
通過網絡104被傳輸、由存儲處理器120接收并且經由互連118被
傳達到存儲116。這些通信中的每個通信可以使用不同協議,由此增
加開銷、管理復雜性和故障排除復雜性。延時問題可能由于架外請
求而被進一步加劇,因為TOR連通可能與計算到存儲連通分離。

持久數據服務(比如對齊、去重復或者復制)也在傳統基礎結
構內受限。這些數據服務可以被限于存儲服務器102而在服務器100
處不可用。希望在服務器100處存儲持久數據的應用因此無法得知
這些服務,從而潛在地造成數據丟失或者破壞。備選地,數據服務
可以在存儲服務器102和服務器100二者上獨立地存在,但是具有
相異實現方式。

圖2和圖3中描繪的分散基礎結構解決了傳統基礎結構的限制。
在圖2和圖3中,硬件部件可以從它們的罩被分散并且被一起組合
成邏輯資源池。不同部件可以從這些池專用于具體應用和/或實體以
形成動態地組成的計算節點,并且可以按照需要動態地向這一計算
節點被添加或者從這一計算節點被去除。不同于通常被專門構建用
于具體應用的傳統基礎結構。這也可以不同于匯聚和分配虛擬資源
而不是物理資源的傳統的基于云的服務。

例如,圖2描繪了包括各種硬件部件的兩個分離的架200。這些
部件包括計算部件(例如,處理器)202、存儲器204、閃存206、
固態驅動(“SSD”)208、閃存210、圖形處理單元212和硬驅動214。
這些部件可以經由可以通過物理(“phy”)接口220訪問的計算結構
216相互通信。在一個實施例中,計算結構216跨分散式基礎結構中
的所有架伸展。這允許硬件部件經由計算結構相互直接地通信而無
論它們是否在相同架上。這一計算結構實現東-西(“E-W”)或者服
務器到服務器通信。架200也包括功率供應222和架外(“OOR”)
網絡接口224。

圖2中所示的部件被提供作為非限制示例。例如,架200可以
包括未描繪的附加硬件部件。相似地,架200可以包括比描繪的部
件更少的部件。附加地或者備選地,一個架可以專用于一個具體類
型的部件而另一個架專用于不同類型。

圖3描繪了被組合成邏輯池的來自多個系統的硬件資源的一個
示例實施例。分散式基礎結構可以包括多個系統300,這些系統300
包括通過計算結構(比如計算結構216)通信的硬件部件。在一個實
施例中,系統300可以與架200基本上相似而在一些實施例中可以
包括刀片罩。個別系統300可以包括一個或者多個刀片302,一個或
者多個刀片302包括計算(“CPU”)資源304、存儲器(“MEM”)資
源306和存儲資源308。

CPU304、MEM306和存儲308可以被組合并且與計算池310、
存儲器池312和存儲池314(統稱為“資源池”)在邏輯上關聯。在一
個實施例中,這些資源池可以包括在分散式基礎結構內的指明的類
型的所有資源。例如,計算池310可以包括分散式基礎結構中的每
個系統300上的每個計算資源304。相似地,存儲器池312可以包括
分散式基礎結構中的每個系統300上的每個存儲器資源306。例如,
回顧圖2,每個計算部件202可以屬于相同計算池,并且每個存儲器
資源204可以屬于相同存儲器池,而無論那些資源位于哪個架200
中。換而言之,在分散式基礎結構中的多個系統之間展開的分散的
硬件部件可以與資源池的集合在邏輯上關聯。

資源可以基于任何公共屬性被匯聚在一起。例如,所有固態驅
動可以被分組成SSD池,并且所有自旋盤資源可以被分組成自旋盤
池。相似地,池可以具有子池。例如,存儲池可以具有SSD子池和
自旋盤子池。在一個實施例中,池和子池可以使用如以下具體討論
的嵌套式視圖而被管理。

與資源池關聯的分散的硬件部件可以被組合以形成新的動態地
組成的計算節點。這一計算節點可以包括可以向給定的任務動態地
分配的一個或者多個專用硬件部件。例如,用戶可以請求資源以安
裝包括具體軟件應用的操作系統。該用戶可以從池被分配專用計算、
存儲器、網絡和存儲資源以操作OS和應用。

在一些實施例中,資源分配可以由管理實用程序(utility)或者
服務執行。管理實用程序可以具有進入系統和資源池的可視性并且
可以被配置為從用戶接收請求。在一個實施例中,管理實用程序在
分散式基礎結構外的系統上、在分散式基礎結構內的DCCN或者它
們的某個組合上駐留。如以下討論的那樣,管理實用程序可以執行
許多附加功能。

圖4描繪了用于從分散的硬件部件創建動態地組成的計算節點
的過程。在塊400處,可以將分散的硬件資源一起匯聚成資源池。
這一資源池可以例如與計算池310、存儲器池312和/或存儲池314
基本上相似。資源池可以包括分散式基礎結構中的給定的類型的所
有資源。附加地或者備選地,可以在多個池之間劃分給定的資源類
型。例如,可以在主存儲池與次存儲池之間劃分存儲資源。主存儲
池可以包含為具體用戶或者過程而保留的資源,而次資源池可以是
通用池。

在塊402處,可以在與分散式基礎結構關聯的管理實用程序處
接收工作負荷請求。工作負荷請求可以是包含用于動態地組成的計
算節點的請求、指令或者資源要求的任何通信。例如,可以從用戶
接收工作負荷請求并且工作負荷請求可以指定用于計算節點的硬件
要求。附加地或者備選地,工作負荷請求可以包括用于用戶想要在
計算節點上安裝的軟件的請求。接收請求的管理實用程序可以與以
上討論的管理實用程序基本上相似。在一個實施例中,管理實用程
序具有進入系統中的所有資源池的可視性。管理實用程序可以知道
正在使用哪些硬件資源和它們被分配給誰。

在塊404處,從工作負荷請求確定資源要求。如果工作負荷請
求包括資源要求,則可以從請求提取它們。如果工作負荷請求包括
用于軟件的請求,則管理實用程序可以查詢目錄或者其它實體以確
定用于該軟件的最小和/或最優資源要求。

在塊406處,可以從資源池向動態地組成的計算節點分配資源。
計算節點可以包括在分散式基礎結構中的一個或者多個系統上駐留
的硬件部件。例如,資源可以在兩個分離架上駐留并且通過計算結
構(比如計算結構216)通信。分配的資源可以被呈現給請求者(比
如計算機)并且可以包括計算、存儲器、網絡和存儲資源。在一個
實施例中,資源專用于請求者而未被與任何其它任務、用戶或者計
算節點共享。例如,請求者可以請求四個CPU核、1TB的存儲和10GB
的RAM。該請求者可以被分配請求的物理資源,并且那些資源可以
未與別的任何一方共享。

在塊408處,可以從DCCN動態地分配或者取消分配資源。例
如,管理實用程序可以接收用于附加資源的第二請求。基于第二請
求,管理實用程序可以向計算節點分配附加專用資源。相似地,資
源可以從計算節點被取消分配并且放回到資源池中。在一些實施例
中,管理實用程序可以監視計算節點的健康并且在必要時動態地分
配或者取消分配資源。例如,可以向迫近存儲容量的計算節點動態
地添加附加存儲資源。相似地,如果計算節點從未消耗多于它的分
配的存儲器的一半,則可以取消分配存儲器資源。

參照圖2、圖3和圖4討論的動態地組成的計算節點可以提供較
傳統基礎結構而言的許多益處。這些益處可以包括數據服務可用性、
減少的延時、動態資源分配和取消分配、增加的功率效率和管理以
及提高的監視能力。依次討論這些益處中的每個益處。

動態地組成的計算節點通過超出傳統豎井式系統分布數據服務
來提高服務可用性。數據服務傳統地在存儲服務器或者SAN(比如
存儲服務器102)內操作并且不可用于計算服務器(比如服務器100)。
在本地存儲中存儲持久數據的計算服務器處操作的應用因此無法得
知這些服務。對照而言,當前動態地組成的計算節點允許持久數據
由任何部件以對于所有部件一致的方式通過計算結構直接地訪問。
這允許數據服務應用于系統中的任何數據而不是僅在存儲服務器上
存儲的數據。例如,RAM頁面可以在執行應用之時被寫入到持久存
儲。傳統地,這些頁面無法得知數據服務,因為它們被寫入到計算
服務器上的存儲。然而,在動態地組成的計算節點中,這些頁面可
以被寫入到通過計算結構可訪問的存儲,并且因此可以從原本僅可
用于存儲服務器上的持久數據的數據服務受益。RAM頁面可以例如
被去重復以節省空間。

動態地組成的計算節點也最小化就架外流量和結構內通信二者
而言的延時。架外流量可以被接收和直接地傳達到計算結構,它在
該計算結構被路由到適當部件。相似地,在系統內的分散的部件可
以通過計算結構相互直接地通信。這減少在通信中涉及到的跳躍、
中介和協議的數目,由此提高效率。

跨所有分散的硬件部件延伸功率系統可以增強功率效率和管
理。不同部件可以基于它們執行的工作負荷而被分配更多或者更少
功率。未使用的部件直至它們被分配到DCCN才可以接收任何功率。
在一個實施例中,可以在工作負荷請求中指定與其它資源要求相似
的功率要求。附加地或者備選地,它們可以基于在工作負荷請求中
指定的軟件和/或部件被動態地確定。

可以使用帶內監視和/或帶外監視從管理實用程序監視分散的硬
件部件。這一監視允許管理實用程序提供關于部件及其利用的時間
點信息。基于這一信息,部件可以被重新分配給不同計算節點以提
高性能和效率。例如,管理實用程序可以使用監視信息以標識用于
給定的工作負荷請求的可用資源,或者標識用于現有DCCN的最優
資源。實用程序然后可以向DCCN分配那些資源。

本公開內容的一個實施例包括計算結構上的帶內監視。管理實
用程序可以與由給定的DCCN在操作期間使用的結構總線通信。使
用程序可以監視總線以收集關于構成部件的性能和利用的信息。相
似地,管理實用程序可以通路通過計算結構發布配置命令,比如用
于分配具體資源的指令。在一個實施例中,管理實用程序被動地在
總線中監視信息。附加地或者備選地,管理實用程序可以輪詢硬件
部件或者資源池以取回希望的信息。

在一些實施例中,帶內監視允許管理實用程序發現新添加的硬
件部件。這些部件可以在它們被連接到結構時廣播它們的存在和/或
管理實用程序可以周期性地輪詢連接到結構的所有部件以標識新資
源。

附加地或者備選地,本公開內容的一個實施例可以包括帶外監
視。分散式基礎結構中的個別部件可以包括用于在本地收集統計并
且向管理實用程序帶外發送它們的管理端口。相似地,配置信息和/
或指令可以被傳輸到管理端口而不是通過結構總線。配置修改可以
使用telnet、ssh等被發送到管理端口。如果部件操作正使結構飽和,
或者如果結構以其它方式不可用,則帶外監視可以是有益的。

一些實施例可以包括帶內監視和帶外監視二者。可以在計算結
構不可用或者未飽和時使用帶內監視。帶外監視可以用作后備,并
且管理實用程序可以基于結構飽和、可用性等在二者之間動態地切
換。

監視能力也可以提供在分散式基礎結構內的不同單元、部件和
信息的嵌套式視圖。分散式基礎結構中的系統和部件可以為了更大
透明性和控制而被劃分成層。例如,底層可以包含關于盒中的給定
刀片上的具體硬件資源的信息。下一層可以描述盒的當前狀態或者
庫存(比如哪些刀片或者線卡在盒中),并且可以體現在底層中包含
的信息。頂層可以描述分散式基礎結構中的所有盒的庫存和狀態,
并且可以包括來自中間層和底層二者的信息。以這一方式,不同視
圖可以被嵌套在彼此內以提供可變粒度水平。用戶或者管理實用程
序可以希望關于分散式基礎結構的總體健康的信息,并且因此僅從
最頂層提取信息。附加地或者備選地,用戶或者管理實用程序可以
希望關于在具體盒中的給定的刀片上操作的部件的信息,并且可以
向下鉆透過嵌套式視圖以獲取希望的信息。

視圖可以基于關于在分散式基礎結構內的部件或者子部件的任
何類型的可量化信息。例如,一個視圖可以是線卡利用視圖。另一
視圖可以基于用于盒中的個別刀片的連接速度、饋送或者其它端口
信息。這一端口信息然后可以在每盒基礎上被聚合在一起以提供第
二級視圖,并且然后在頂級被概括以提供用于整個分散式基礎結構
的概覽。用來創建一個或者多個視圖的其它信息可以包括用于計算
結構的轉發構造、連接的節點和節點拓撲約束、合計流量吞吐量、
路由和轉發信息、L1/L2高速緩存大小、時鐘頻率、可用dram存儲
器等。

雖然以上示例討論了在彼此內嵌套的三層,但是任何數目的視
圖和層符合本公開內容。相似地,母視圖可以添加子視圖未封裝的
新信息。這些視圖也可以用來如以下具體討論的那樣向不同虛擬計
算機動態地分配資源。

圖5描繪了用于在分散式基礎結構中創建嵌套式視圖的主要過
程。

在塊502處,可以將分散式基礎結構劃分成多個視圖,其中個
別視圖描述由該視圖封裝的部件。例如,分散式基礎結構可以與圖2
中所示的分散式基礎結構基本上相似。可以為每個架200創建三個
視圖。第一視圖可以描述個別計算資源的利用,第二視圖可以概括
個別存儲資源上的可用/消耗的空間,并且第三視圖可以概括可用存
儲器資源上的可用/消耗的存儲器。以這一方式,每個視圖包括描述
由該視圖封裝的部件的信息。

在塊504處,可以在第二視圖內嵌套第一視圖,其中第二視圖
描述由第一視圖和第二視圖二者封裝的部件。例如,可以為參照塊
502討論的每個架創建架視圖。可以在架視圖內嵌套用于每個架的計
算視圖、存儲器視圖和存儲視圖。也可以在架視圖中包括OOR網絡
連通信息。這些架視圖轉而可以被嵌套在頂級分散式基礎結構視圖
內。這一分散式基礎結構視圖因此可以包括關于架的信息(來自架
視圖)和關于架內的個別部件的信息(來自計算視圖、存儲器視圖
和存儲視圖)。附加地,可以從嵌套式視圖創建新視圖。例如,可以
創建描述系統中的所有計算、存儲器和存儲資源的全局計算視圖、
全局存儲器視圖和全局存儲視圖。這可以在向動態地組成的計算視
圖分配分散式部件時特別地有幫助,因為管理實用程序可以快速地
標識最優資源。

現在轉向圖6,討論了用于在被分組成動態地組成的計算節點的
分散式部件上疊加應用功能的系統和過程。圖6可以包括可以與以
上討論的架200基本上相似的架600和601。這些架可以包括分散的
硬件部件,比如計算602、存儲器604、閃存606、固態驅動608、
閃存610和GPU612。部件中的每個部件可以與計算結構616通信,
由此在架內和在架之間二者連接部件。可以如參照圖2討論的那樣
經由物理接口有助于與計算結構616的通信。計算結構616也可以
與架外網絡624通信。

圖6也包括分散式仲裁器626和軟件目錄628。分散式仲裁器
626可以是用來在已經被分組成DCCN的分散的硬件部件上疊加或
者安裝軟件應用的軟件應用。在一個實施例中,分散式仲裁器626
是以上討論的管理實用程序。附加地或者備選地,分散式仲裁器626
可以是與管理實用程序獨立地操作的分離的軟件實體。

軟件目錄628可以包括可以在動態地組成的計算節點上安裝的
各種軟件要約。目錄可以包括操作系統、應用、管理程序或者任何
其它類型的軟件應用。例如,軟件目錄可以包括多個存儲軟件要約,
比如基于SQL、塊、文件或者對象的存儲解決方案或者數據移動性、
復制或者去重復服務。在一些實施例中,分散式仲裁器626可以向
目錄628添加和/或從目錄628去除軟件。

在一些實施例中,分散式仲裁器可以接收標識用于在分散的硬
件部件上安裝的軟件的工作負荷請求。可以從軟件目錄628選擇這
一軟件,并且分散式仲裁器628可以標識計算資源要求1和2、存儲
器資源要求3以及存儲資源要求4。可以在架600或者架601中標識
滿足這些要求的可用資源,并且可以安裝軟件。一旦被安裝,分散
式仲裁器626就可以啟動應用或者引導操作系統并且暴露它們以用
于使用。參照圖7至圖10具體討論這一過程。

現在轉向圖7,討論了用于在包括分散的硬件部件的計算節點上
安裝軟件應用的過程。在塊700處,可以接收用于在DCCN上安裝
軟件的請求。在一個實施例中,請求與以上討論的工作負荷請求相
似。可以在分散式仲裁器、管理實用程序和/或二者處接收請求。

在塊702處,可以確定用于軟件的資源要求。這些資源要求可
以來自軟件目錄,比如軟件目錄628。附加地或者備選地,可以在請
求本身中包括它們。在一些實施例中,可以標識最小要求和最優要
求二者。分散式仲裁器然后可以決定是否使用最小要求、最優要求
或者在二者之間的某個要求。這一決定可以例如基于用戶或者策略。
這些資源要求可以例如是計算要求1和2、存儲器要求3和/或存儲
要求4。

在塊704處,可以從資源池標識可用資源。這些資源池可以與
以上討論的資源池基本上相似。在一個實施例中,可以從資源池標
識最優資源。例如,如果軟件應用需要1GB的存儲器,則可以查詢
存儲器資源池以標識具有鄰接的1GB存儲器組塊的存儲器資源。在
一些實施例中,可以使用以上討論的嵌套式視圖來標識這一鄰接存
儲器。

在706處,可以通過使充分資源專用于計算節點以滿足軟件實
例的資源要求來創建動態地組成的計算節點。這些資源可以包括被
連接到計算結構的任何硬件部件,并且可以在相同或者不同架上。
例如,在圖6中,可以通過從架601為存儲器要求3分配存儲器和
從架600為存儲要求4分配存儲來創建計算節點。可以從架600和
架601二者為計算要求1和2分配計算資源。這允許從分散式基礎
結構中的任何可用硬件部件創建動態地組成的計算節點。

在塊708處,可以在DCCN中的分配的資源上安裝軟件。換而
言之,可以在從匯聚的資源創建的計算節點上安裝軟件。一旦已經
安裝了軟件,則可以向請求者呈現有疊加的應用功能的完整DCCN。

圖8描繪了用于確定用于向動態地組成的計算節點分配的資源
的過程。在塊800處,可以接收用于在動態地組成的計算節點上安
裝軟件的請求。這可以與以上討論的塊700基本上相似。

在802處,可以接收定義第一資源集合的簡檔。可以例如在請
求中包括這一簡檔。在一些實施例中,簡檔可以包括分散式仲裁器
未另外考慮的特殊資源要求。例如,簡檔可以指定所有分配的存儲
器必須在鄰接塊中。附加地或者備選地,簡檔可以指定將適用的最
小資源要求和/或最大資源要求而無論軟件是否將被安裝在DCCN
上。分散式仲裁器可以總是適應在簡檔中定義的要求、使用盡力而
為以適應要求或者忽略要求。

在塊804處,可以基于軟件確定第二要求集合。例如,可以標
識為了軟件運行而需要的最小要求和/或最優要求。

在塊806處,可以組合第一資源要求集合和第二資源要求集合
以確定最終資源要求。例如,接收的簡檔可以指定所有存儲器必須
鄰接并且從軟件得到的要求可以指定需要至少2GB的存儲器。組合
的最終資源要求因此將是2GB的鄰接存儲器。

在塊808除,可以從資源池標識滿足要求的可用資源。如果不
存在滿足要求的可用資源,則分散式仲裁器可以提出報警。使用盡
力而為或者采取其它補救動作。

在塊810處,可以使用標識的資源以創建動態地組成的計算節
點,并且在塊812處,可以在計算節點上安裝軟件。

現在轉向圖9,討論了用于在資源之間遷移軟件以及退回改變的
過程。在900處,可以使用這里討論的方法中的任何方法在動態地
組成的計算節點上安裝軟件。

在902處,可以標識分散式基礎結構中的最優資源。例如,在
第一次安裝軟件時,它可以已經被分配有在分散式基礎結構內遍布
的不同存儲器部件上的存儲器。在塊902處,可以標識鄰接存儲器
塊。這一存儲器可以在創建DCCN時尚未可用和/或可以已經被新近
地添加到分散式基礎結構。在一些實施例中,可以由于硬件故障的
結果而標識最優資源。例如,如果原先分配的硬件部件之一出故障,
則可以標識新的最優資源。

在塊904處,可以向新標識的最優資源遷移軟件。這可以例如
通過向DCCN分配新資源并且然后取消分配舊資源而被實現。分散
式仲裁器、管理實用程序或者二者可以管理這一遷移過程。

最后,在塊906處,可以將軟件從最優資源向原有資源退回。
這例如如果在遷移操作中有錯誤或者如果新硬件部件之一出故障則
可以出現。在一些實施例中,可以標識新的最優資源,并且可以將
軟件遷移到那些新的最優資源而不是退回到原有硬件。

參照圖10,討論了描繪用于連接多個軟件實例的過程的流程圖。
這些實例可以被連接在一起以例如形成虛擬數據中心。相似地,軟
件實例可以被設計為相互交互比如應用服務器、web服務器和數據
庫。

在塊1000處,可以在動態地組成的計算節點上安裝第一實例。
可以使用這里討論的方法中的任何方法來安裝這一第一軟件實例。

在塊1002處,可以接收用于安裝第二軟件實例的請求。這一第
二軟件實例可以被設計為與第一軟件實例通信并且與第一軟件實例
組合提供功能。例如,第一軟件實例可以是web服務器并且第二軟
件實例可以是應用服務器。

在塊1004處,可以將第二資源集合專用于第二軟件實例。可以
按照在本申請中討論的任何方式標識、分配和/或專用這些資源。

最后,在塊1006處,可以在兩個軟件實例之間建立通信。可以
例如通過計算結構或者網絡建立這一通信。

為了清楚,已經用具體流程舉例說明了這里的過程和方法,但
是應當理解,其它序列可以是可能的并且可以并行執行一些過程和
方法而未脫離本發明的精神實質。附加地,可以細分或者組合步驟。
如這里討論的那樣,可以在某種形式的計算機可讀介質(比如存儲
器或者CD-ROM)中存儲或者通過網絡傳輸并且由處理器執行根據
本發明編寫的軟件。

這里引用的所有參考文獻旨在于通過引用而被結合。雖然以上
已經在具體實施例方面描述了本發明,但是設想了對本發明的變更
和修改將無疑地變得為本領域技術人員所清楚并且可以在所附權利
要求的范圍和等效內被實現。可以使用多于一個計算機(比如通過
在并行或者負荷分擔布置中使用多個計算機或者跨多個計算機分布
任務),從而使得它們作為整體執行這里標識的部件的功能;即,它
們取代單個計算機。以上描述的各種功能可以由單個過程或者在單
個計算機上或者分布于若干計算機上的多組過程執行。過程可以調
用其它過程以處置某些任務。可以使用單個存儲設備,或者可以使
用若干存儲設備以取代單個存儲設備。公開的實施例是例示性的而
非限制性的,并且本發明不限于這里給出的細節。存在實施本發明
的許多備選方式。因此,旨在于公開內容和所附權利要求被解釋為
覆蓋如落在本發明的真實精神實質和范圍內的所有這樣的變更和修
改。

關 鍵 詞:
包括 分散 部件 動態 組成 計算 節點
  專利查詢網所有資源均是用戶自行上傳分享,僅供網友學習交流,未經上傳用戶書面授權,請勿作他用。
關于本文
本文標題:包括分散的部件的動態地組成的計算節點.pdf
鏈接地址:http://www.rgyfuv.icu/p-6345695.html
關于我們 - 網站聲明 - 網站地圖 - 資源地圖 - 友情鏈接 - 網站客服客服 - 聯系我們

[email protected] 2017-2018 zhuanlichaxun.net網站版權所有
經營許可證編號:粵ICP備17046363號-1 
 


收起
展開
山东11选5中奖结果走势图