#計算機概論 第十一章 #演算法
..在不同處理機核心上的計算工作之間必須進行大量的資料交換,而且該函式中所使用的 XGBoost 演算法應可利用 GPU 獲得更佳的效能。因此,我們提出幾種 效能改進方案,分別針對 CPU、GPU 以及分散式系統提出了相對應的軟體架構。 其中對應 CPU 的改進版本,在八核心的 Intel 處理機上成功達成 6 倍以上的效能提升;對應 GPU 的改進版本,在 TitanV GPU 上達成超過 12 倍的加速;在國家高速計算機中心的台灣杉二號上,以八個四核心的 CPU 節點執行我們的分散式版本 時,可獲得超過 20 倍的速度提升,並且觀察到高擴展性 (scalability),因此能利用50個4核心的節點在一個小時內完成原版本在三週內無法完成的計算工作,大幅改善該研究團隊的進度。