公有云提供商越來越多地為大計(jì)算量應(yīng)用提供基于GPU的云服務(wù),但組織需要合適的技能和預(yù)算來部署它們。
數(shù)據(jù)分析、人工智能和機(jī)器學(xué)習(xí)越來越受重視,這也就引導(dǎo)企業(yè)開始仔細(xì)研究圖形處理單元。

作為回應(yīng),頂級云供應(yīng)商Amazon Web Services(AWS)、Microsoft和Google現(xiàn)在已經(jīng)能夠提供支持圖形處理單元(GPU)的公共云實(shí)例。雖然這些GPU云實(shí)例具有很大的潛力,但它仍處于開發(fā)的早期階段。因此,現(xiàn)在還存在一些障礙,例如成本和很多定制開發(fā)工作(在許多情況下)。
不斷變化的市場
傳統(tǒng)上,資源密集型系統(tǒng)(也被稱為高性能計(jì)算(HPC))是面向研究、工程和視頻開發(fā)的技術(shù)。典型應(yīng)用包括基因組學(xué),計(jì)算金融,視頻渲染和可視化。
HPC系統(tǒng)在特殊配置的服務(wù)器上需要大量的處理能力。開發(fā)經(jīng)常需要花費(fèi)數(shù)年時(shí)間,應(yīng)用也需要幾天或更長時(shí)間才能在高端專用系統(tǒng)上運(yùn)行。因此,這些應(yīng)用難以構(gòu)建,運(yùn)行成本高,大多數(shù)企業(yè)都無法實(shí)現(xiàn)。
但最近,HPC市場動(dòng)態(tài)發(fā)生了變化。這些系統(tǒng)已經(jīng)從定制的CPU轉(zhuǎn)移到商業(yè)設(shè)備上。像Nvidia和Intel這樣的廠商將其GPU定位為適合HPC市場,而頂級的公有云供應(yīng)商依靠他們來支持HPC服務(wù)。
此外,客戶資料也已更改。歷史上,HPC系統(tǒng)通常部署在利基市場,但已經(jīng)以自己的方式進(jìn)入了企業(yè)的主流。預(yù)計(jì)隨著物聯(lián)網(wǎng)的出現(xiàn),企業(yè)處理的大量數(shù)據(jù)將呈指數(shù)級增長。隨著公司不斷地收集和挖掘更大的數(shù)據(jù)庫,他們正在尋求軟件來幫助進(jìn)行自動(dòng)化處理。因此,GPU系統(tǒng)(包括GPU云實(shí)例)已成為人工智能和機(jī)器學(xué)習(xí)應(yīng)用的計(jì)算引擎。
供應(yīng)商整合了其GPU云實(shí)例陣容 向GPU轉(zhuǎn)移的這一趨勢引起了最近進(jìn)入這一市場的頂級公有云供應(yīng)商的關(guān)注。在2016年第四季度,AWS和Microsoft Azure都分別公開了新的GPU云實(shí)例——分別是P2實(shí)例類型和N系列,而在二月份,Google也加入了戰(zhàn)團(tuán),開始GPU支持(目前正處于測試階段)。
雖然這些實(shí)例類型非常適合機(jī)器學(xué)習(xí)和其他計(jì)算密集型應(yīng)用,但仍然存在幾個(gè)影響采用的障礙。首先,這些服務(wù)通常是昂貴的。AWS和Microsoft Azure每小時(shí)每GPU的價(jià)格為0.90美元,而Google GPU云實(shí)例的價(jià)格為每小時(shí)0.70美元。相比之下,AWS針對通用計(jì)算實(shí)例定價(jià)為每小時(shí)0.0059美元。
此外,這個(gè)市場依賴于定制開發(fā)和高度專業(yè)的編程工具。熱門框架包括Apache Spark,Caffe,Apache SystemML,MXNet,TensorFlow和Torch。大多數(shù)企業(yè)的IT部門都缺乏編寫和管理使用這些框架構(gòu)建應(yīng)用程序的技能。組織需要對員工培訓(xùn)和認(rèn)證計(jì)劃來管理這些部署進(jìn)行投資。
HPC、機(jī)器學(xué)習(xí)等計(jì)算密集型應(yīng)用不斷受到企業(yè)的歡迎。而GPU云實(shí)例可以幫助支持這些工作負(fù)載,昂貴的價(jià)格和經(jīng)驗(yàn)的缺乏可能會(huì)影響許多企業(yè)在短期內(nèi)部署。

