馬上註冊  |  找回密碼

SAY討論區

查看: 928|回復: 1
打印 上一主題 下一主題

通用計算已經爆發 NVIDIA官方發佈,命名為GTX680。 [複製鏈接]

Rank: 7Rank: 7Rank: 7

好友
0
帖子
44
積分
9162
最後登錄
2012-2-24
在線時間
0 小時
跳轉到指定樓層
樓主
發表於 2012-3-27 15:45:27 |只看該作者 |倒序瀏覽

NVIDIA官方發佈,命名為GTX680。

根據發佈內容,GK104將擁有1536 CUDA核心。圖片顯示出計算性能表現非常搶眼,領先HD 7970多達17%。

900.jpg

NVIDIA信心十足的產品誕生
NVIDIA日前在Facebook豪言:“等待Kepler中,請耐心,耐心,當時機成熟,它將不可戰勝”。儘管不到正式發佈,一切爆料都是浮雲。但NVIDIA的信心滿滿與VR-Zone曝光的內容相結合,是否暗示著新的Kepler架構,其性能表現將再次加強通用計算能力帶來的遊戲性能提升,而且進一步削弱了對傳統參數項目的依賴?下面讓我們走進NVIDIA通用計算的世界。

CUDA的過去與成長
首先,什麼是CUDA,CUDA即Compute Unified Device Architecture,直譯:統一計算架構,這是由NVIDIA所推出的一種集成技術,是對GPGPU的正式名稱,它包含了CUDA指令集架構(ISA)以及GPU內部的平行計算引擎。通過這項技術,使用者可以利用NVIDIA的GeForce8以後的GPU和較新的Quadro GPU進行計算,它率先利用GPU作為C-編譯器的開發環境。CUDA架構可以相容OpenCL或者NVIDIA自家的C-編譯器,而無論是哪種代碼,最終都會被驅動程式轉換成PTX代碼,交由NVIDIA核心計算。

03.jpg

CUDA——為GPU運算而生
正如前文所述,CUDA出現最早的是2006年推出的採用G80核心的GeForce8系列。當時是作為率先支持DirectX 10.0的GPU發佈的。

04.jpg

DirectX10.0成為CUDA開始展示魅力的舞臺
DirectX 10最大的革新就是統一渲染架構(Unified Shader Architecture)。這個架構標準的制定提升了GPU的可編程性能。NVIDIA借機提出了經過多年籌畫的CUDA通用計算架構。CUDA架構是第一個面向GPU的軟硬體結合通用處理解決方案,它的指令集架構能夠讓開發人員繞開傳統的圖形API而直接訪問GPU硬體,還包含了一個全新的C語言編譯器,開發人員可以用常見的C語言來為GPU編寫程式,編程效率成倍提高。



05.jpg

2010年,借通用計算之勢,微軟發佈了革命性的Windows 7
2010年10月23日,Windows 7帶著DirectX 11來到了大家面前,並成為繼Windows 95和Windows XP後,最受歡迎的Windows作業系統。在Windows7中,微軟附帶了一種名叫Direct Compute的API。簡單的說,所有符合Direct Compute規範的處理設備,不管是CPU還是GPU,在Windows 7作業系統中都被融合到了一起,作為統一的資料處理而用。GPU第一次以計算部件之一加入到了Windows之中。

與Windows7同年發佈的首款Fermi架構產品——GTX480
而當年3月27日發佈的新一代費米架構的顯卡GTX400系列也借此展示出強大的CUDA運算能力。

CUDA的現狀
NVIDIA CUDA架構不知不覺已經邁入第六個年頭。據外界估算,NVIDIA目前市值達到97億美元,接近競爭對手的兩倍。在硬體方面,CUDA成功延伸至GeForce娛樂領域,Quadro專業設計領域和Tesla高性能計算領域。

 

07.jpg

CUDA已延伸至NVIDIA多個子品牌並帶來革命
在GeForce娛樂領域,目前展現出CUDA優勢的莫過於2011年年度FPS大作《戰地3》,《戰地3》的歷史意義在於它是第一個完全只支持DirectX 11的遊戲。該遊戲採用的寒霜2引擎,大量的革命性的特性,極大的提升和影響了戰地3的圖形表現和遊戲體驗。其中就包含了Compute Shader和NVIDIA制定的新型FXAA抗鋸齒採樣技術。

 

08.jpg

《戰地3》堪稱是第一款拒絕Windows XP玩家的遊戲
在Compute Shader的支持下,PC版的戰地3擁有了遠比其他遊戲更加富裕的可用光源,這讓它有了極其真實的環境光照系統,進而擁有了遠比其他遊戲更加細膩的場景和細節刻畫能力。對於Compute Shader來說,執行單元的數量在大多數情況下並不是決定性的,真正關乎Compute Shader性能的要素,在於緩衝的數量、速度、操作方式以及整個構架的靈活度和並行度。而擁有充足緩衝以及完善的cache體系的NVIDIA Fermi構架在這方面做得非常好,CUDA的遊戲優勢得以盡展,輕鬆以中端產品GeForce GTX560Ti在1920X1200 Ultra 4AA/16AF的設置上,得到30幀/秒以上的良好遊戲體驗。

 

中端的GeFoece GTX560Ti即可流暢體驗戰地3的華麗特效
在專業領域,NVIDIA的Adobe自CS4時代以來一直保持著良好的合作關係,圖形設計與視頻剪輯、特效製作等常用的Photoshop、Premiere以及After Effects都能直接調用Quadro的CUDA來實現GPU加速。Premiere當中有一個非常有名的功能叫做水銀加速(Mercury GPU Acceleration),它可以調動GPU來實現很多需要即時渲染的內容,包含從預覽到輸出的多個環節,尤其是對於多軌視頻的應用有很強的提速作用。

 

 



 

 

10.jpg

Adobe Creative Suite 5.5 套件可以很好的利用NVIDIA的GPU進行加速
當然CUDA並不僅限於在Adobe系列套件中的應用,從視頻轉換軟體Badaboom和TMPGEnc到視頻優化軟體vReveal和TotalMedia,再到視頻編輯軟體PowerDirector7.0,CUDA的應用深入到了視頻領域的方方面面。
在高性能計算領域,曾經在2010年奪得全球超級電腦五百強排行榜第一位的中國“天河一號A”,就採用了7168塊NVIDIA Tesla M2050計算卡。

 

11.jpg

 在2010年讓中國人引以為豪的“天河一號A”
得益于NVIDIA CUDA的超高並行度和集成度,天河一號A比排行第二的“美洲虎”節能2900多千瓦,節能幅度達42%,能耗比出眾。

 

12.jpg

Tesla加速科學計算
CUDA的未來——寄予厚望的Kepler 12年前,在那場著名對決中擊敗人類棋王卡斯帕羅夫的IBM 深藍超級電腦,它擁有11.38GigaFlops。而現在的NVIDIA 已經可以把幾百台數百公斤重的深藍超級電腦塞到一個不到500平方毫米的小晶片裏。

 

 

IBM深藍與NVIDIA顯示晶片——摩爾定律的最佳佐證
因此,從以上這些資料來看,至少在理論浮點運算能力這個指標上,單顆Fermi晶片的運算能力已經遠遠超過了當前的CPU,達到小型工作站的水準。而這些理論性能的發揮,還要取決於NVIDIA所提供的軟體平臺、下游應用廠商、程式開發者的共同支援。 一旦Fermi的性能得以施展,GPU通用計算所爆發出的能量必將在高性能計算領域引起一輪新的革命。

2011年,CUDA 5歲了
事實上,NVIDIA顯卡的歷史從1999年第一代NVIDIA GeForce256開始算,到現在只不過短短的13年。但可以看到,隨著GPU中的Shader計算能力的迅速提升,NVIDIA順勢推出了CUDA技術,為無論是普通家庭用戶,還是專業用戶,抑或是高性能需求用戶,都提供了適合應用需求的解決方案。
而即將面世的Kepler,至少從目前網曝的參數看來,NVIDIA依然堅持以通用計算為先,兼顧圖形應用的發展道路。既符合微軟DirectX的發展趨勢,滿足作為顯卡本身的性能需求,也能順應高性能的需求,作為電腦運算部件之一為滿足高性能運算要求貢獻力量。

15.jpg

新年交替之際,NVIDIA開放CUDA平臺並放出了CUDA 4.1通用計算開發包
而且,NVIDIA在去年12月,邁出了具有歷史意義的一部——發佈編譯器源代碼,開放CUDA平臺,此舉讓開發者能夠利用現有工具實現無縫調試與分析,而且讓 PGI 能夠專注於更高級別的優化與語言特性。

 

The Linux Foundation官網最新放出的新聞稿
而最新消息,NVIDIA還剛剛加入了Linux基金會,國外媒體評論認為,即將到來的Kepler GPU可能將對高性能電腦進一步帶來強有力的衝擊,因為以Linux為系統主導的超級計算領域擁有更廣泛和通用的生態環境,這有利於擴大NVIDIA在超級電腦中的影響力。

17.jpg

CUDA未來的目標:從超級手機到超級電腦
NVIDIA越來越開放的態度,為CUDA的未來發展鋪平了道路,只要未來的NVIDIA GPU能在通用計算能力上持續領先對手,CUDA的未來可以說是無可限量。

分享分享0 收藏收藏0 讚好讚好0 Unlike!Unlike!0 分享 傳送 邀請

好友
0
帖子
361667
積分
382605
最後登錄
2024-5-9
在線時間
0 小時
No.1回覆者
發表於 2012-5-4 18:24:24 |只看該作者
快站沙發,不知道有沒有成功
您需要登錄後才可以回帖 登錄 | 馬上註冊 |

Archiver|手機版|SAY討論區

GMT+8, 2024-5-9 12:55 , Processed in 0.502747 second(s), 7 queries .

Powered by go2tutor.comDiscuz! X2

© 2024 Community Networks Limited

回頂部