基于共享GPU的深度學(xué)習(xí)訓(xùn)練性能實(shí)證研究
摘要: 深度學(xué)習(xí)應(yīng)用的訓(xùn)練過程是計(jì)算密集型的,它通常依靠圖形處理單元(Graphics Processing Unit, GPU)來加速訓(xùn)練過程。然而深度學(xué)習(xí)開發(fā)框架往往會(huì)獨(dú)占GPU,造成計(jì)算資源的浪費(fèi)。針對(duì)該問題,該實(shí)證研究對(duì)兩個(gè)深度學(xué)習(xí)應(yīng)用共享GPU訓(xùn)練的可行性進(jìn)行討論,系統(tǒng)地分析了有代表性的深度學(xué)習(xí)模型的靜態(tài)和運(yùn)行時(shí)特性,展示了共享GPU訓(xùn)練兩個(gè)模型時(shí),不同的模型組合和特征對(duì)整體... (共7頁)
開通會(huì)員,享受整站包年服務(wù)