【廣告】
因?yàn)镃PU有大量的緩存和復(fù)雜的邏輯控制單元,因此它非常擅長(zhǎng)邏輯控制、串行的運(yùn)算。相比較而言,GPU因?yàn)橛写罅康乃阈g(shù)運(yùn)算單元,因此可以同時(shí)執(zhí)行大量的計(jì)算工作,它所擅長(zhǎng)的是大規(guī)模的并發(fā)計(jì)算, 計(jì)算量大但是沒有什么技術(shù)含量,而且要重復(fù)很多次。這樣一說(shuō),我們利用GPU來(lái)提高程序運(yùn)算速度的方法就顯而易見了。使用CPU來(lái)做復(fù)雜的邏輯控制,用GPU來(lái)做簡(jiǎn)單但是量大的算術(shù)運(yùn)算,就能夠大大地提高程序的運(yùn)行速度。
CPU有強(qiáng)大的算術(shù)運(yùn)算單 元,可以在很少的時(shí)鐘周期內(nèi)完成算術(shù)計(jì)算。同時(shí),有很大的緩存可以保存很多數(shù)據(jù)在里面。此外,還有復(fù)雜的邏輯控制單元,當(dāng)程序有多個(gè)分支的時(shí)候, 通過(guò)提供分支預(yù)測(cè)的能力來(lái)降低延了時(shí)。GPU是基于大的吞吐量設(shè)計(jì),有很多的算術(shù)運(yùn)算單元和很少的緩存。同時(shí)GPU支持大量的線程同時(shí)運(yùn)行,如果他們需要訪問同一個(gè)數(shù)據(jù),緩存會(huì)合并這些訪問,自然會(huì)帶來(lái)延了時(shí)的問題。盡管有延了時(shí),但是因?yàn)槠渌阈g(shù)運(yùn)算單元的數(shù)量龐大,因此能夠達(dá)到一個(gè)非常大的吞吐量的效果。
CPU控制技術(shù)的主要形式,時(shí)間控制。將時(shí)間定時(shí)應(yīng)用于各種操作中,就是所謂的時(shí)間控制。在執(zhí)行某一指令時(shí),應(yīng)當(dāng)在規(guī)定的時(shí)間內(nèi)完成,CPU的指令是從高速緩沖存儲(chǔ)器或存儲(chǔ)器中取出,之后再進(jìn)行指令譯碼操作,主要是在指令寄存器中實(shí)施,在這個(gè)過(guò)程中,需要注意嚴(yán)格控制程序時(shí)間。
更優(yōu)化的CPU架構(gòu)是superscalar架構(gòu)(超標(biāo)量架構(gòu))。這種架構(gòu)將取指、解了碼、執(zhí)行單元分開,有大量的執(zhí)行單元,然后每個(gè)取指 解了碼的部分都以并行的方式運(yùn)行。比如有2個(gè)取指 解了碼的并行工作線路,每個(gè)工作線路都將解了碼后的指令放入一個(gè)緩存緩沖區(qū)等待執(zhí)行單元去取出執(zhí)行。
關(guān)于CPU的多核和多線程
1、CPU的物理個(gè)數(shù)由主板上的插槽數(shù)量決定,每個(gè)CPU可以有多核心,每核心可能會(huì)有多線程。
2、多核CPU的每核(每核都是一個(gè)小芯片),在OS看來(lái)都是一個(gè)獨(dú)立的CPU。
3、對(duì)于超線程CPU來(lái)說(shuō),每核CPU可以有多個(gè)線程(數(shù)量是兩個(gè),比如1核雙線程,2核4線程,4核8線程),每個(gè)線程都是一個(gè)虛擬的邏輯CPU(比如windows下是以邏輯處理器的名稱稱呼的),而每個(gè)線程在OS看來(lái)也是獨(dú)立的CPU。