Nvidia Tesla
Tesla da adlandırılan bir güçlü paralelleştirilmiş tasarıma sahip bir işlemci, bir akış işlemcisi gelen Nvidia . Tabanlı işlemci üzerindeki GPU teknolojisi edilebilir kullanılarak ele içi CUDA API ve OpenCL . Ürün, rakip AMD'nin FireStream veya FirePro ile doğrudan rekabet içindeydi .
G80 GPU tabanlı ilk kartların 2007 ortasında sunulmasının ardından, Tesla kartları bir yıl sonra Geforce 200 serisinin masaüstü grafik kartları için de kullanılan GT200 grafik yongasıyla izledi .
"Fermi" kod adı altında Nvidia, yeni nesil grafik işlemcisini 30 Eylül 2009'da, Tesla, Quadro kartları gibi ürünlerde ve değiştirilmiş bir biçimde (örn. Geforce 400 serisinde kullanılan Double Precision ile süslenmiştir . Nvidia, 09 Supercomputing Fuarı'nda 2010 yılının ikinci ve üçüncü çeyreği için Fermi grafik işlemcisine dayalı Tesla kartlarını duyurdu.
Daha yeni sürücülerle, OpenGL, CUDA ve OpenCL'deki olanaklar bazı durumlarda önemli ölçüde genişletildi.
teknoloji
Tesla
G80
G80 grafik işlemcisi yeni geliştirilmiş dayalı olması ilk Nvidia işlemci oldu bileşik gölgelendirme mimarisi . G80, 2006'nın sonundan beri Geforce 8800 GTX ve GTS grafik kartlarına kurulduktan sonra, Nvidia ilk Tesla modellerini 2007 ortalarında sundu. G80, Geforce 8800 Ultra'da kurulu olduğu için öncelikle A3 adımlamada kullanılır.
GT200
GT200 işlemci, Nvidia'nın Teslaser serisine yüklediği ikinci yongaydı. G80'in aksine Nvidia, Tesla modellerini en başından (dolayısıyla tanımlayıcıdaki T) kullanmayı planladı ve IEEE-754R spesifikasyonuna göre 30'dan fazla ek MADD birimini çift hassasiyet yeteneklerini uygulamaya koydu . Geforce - Grafik kartları gerekli olmazdı.
Fermi
Fermikern, 40 nm üretim süreci kullanılarak üretilmiştir ve yaklaşık üç milyar transistöre sahiptir . Selefi aksine, GT200 , büyük ölçüde dayalı yeni bir gelişmedir ait bileşik gölgelendirme mimarisi G80 grafik işlemcisi . Fermi, her biri 32 akış işlemcisine sahip 16 gölgelendirici kümesine bölünmüştür . Bu, toplam 512 akış işlemcisi olduğu anlamına gelir. Fermi-Chip, sinüs ve kosinüs hesaplaması için 16 "yükleme / saklama" biriminin yanı sıra dört ayrı "özel işlev birimine" sahiptir . Ayrıca Fermikern'de GDDR5 bellek için altı adet 64-bit bellek denetleyicisi vardır, bu da 384-bit bellek arayüzüyle sonuçlanır. Bu, belleğin 1,5 GB, 3 GB ve 6 GB'ye genişletilmesini sağlar. Bellek denetleyicisi artık kendi hata düzeltmesi olan ECC belleğini de kullanabilir.
Nvidia artık GPU hesaplamasına her zamankinden daha fazla önem veriyor, bu nedenle bu alandaki performansı artırmak için Fermikern'de birçok mimari değişiklik yapıldı. Fermi, C ++ için tam desteğe sahip ilk grafik işlemcisidir ve IEEE-754-2008 standardıyla (önceden IEEE-754-1985) tamamen uyumludur. İkincisi, çift hassasiyet yeteneklerini ( çift hassasiyetle hesaplama ) iyileştirmek için MAD'den daha doğru olan FMA'yı (Fused Multiply-Add) kullanabilmek için gerekli hale geldi . Bu, her Fermikern gölgelendirici kümesinin saat döngüsü başına 16 çift duyarlıklı işlem gerçekleştirmesine olanak tanır. Bu, Fermi'nin döngü başına çift hassasiyetle toplam 256 hesaplama yapabileceği anlamına gelirken, GT200'de yalnızca 30 hesaplama mümkündü. Paylaşılan belleğe ek olarak, Fermi grafik işlemcisi ayrıca GPU hesaplama yeteneklerini geliştirmek için bir L1 ve L2 önbelleğine sahiptir .
Kepler
GK104
22 Mart 2012 tarihinde Nvidia, yeni Kepler mimarisinin tanıtıldığı Geforce 600 serisinin ilk ekran kartı olan Geforce GTX 680'i tanıttı. Geforce GTX 680, 3.54 milyar transistörün yanı sıra sekiz gölgelendirici kümesi halinde organize edilmiş 1536 akış işlemcisi ve 128 doku biriminden oluşan GK104 grafik işlemcisine dayanıyor. GK104-GPU, TSMC'de 28 nm üretim sürecinde üretilir ve 294 mm² kalıp alanına sahiptir. Başlangıçta GK104, diğerlerinin yanı sıra performans sektörü için bir grafik yongası olarak planlanmıştı. azaltılmış "çift hassasiyetli" performans ile tanınabilir. Nvidia, GK100 grafik işlemcisini GK110 lehine düşürdükten sonra, GK110 yalnızca Kepler yenileme nesli için mevcut olduğundan GK104'ün üst düzey sektör için de kullanılması gerekiyordu.
GK110
Yaklaşık 561 mm²'de (üretim için optimize edilmiş B1 adımlamada 533 mm²) 7,1 milyar transistör ile GK110-GPU, Kepler neslinin en büyük ve en karmaşık grafik işlemcisidir. 15 SMX bloğuna (gölgelendirici kümeleri) dağıtılmış 2880 gölgelendirici ve 240 doku biriminden oluşur. Bunlar sırasıyla beş grafik işleme kümesine dağıtılır, bu da GK110'un 3: 1 oranına sahip olduğu anlamına gelir (2: 1 oranını kullanan Kepler neslinin geri kalan grafik işlemcilerinin aksine). GK110'un bir başka özel özelliği, tek hassasiyetten (FP32) değil, çift hassasiyetli işlemden (FP64) sorumlu olan SMX bloğu başına ek 64 ayrı ALU'dur . "Dinamik Paralellik", "Hyper-Q" ve "GPUDirect" özellikleri de profesyonel sektöre yöneliktir ve yalnızca GK110-GPU'da mevcuttur.
GK210
Maxwell mimarisinin sınırlamaları nedeniyle, GK110'un geliştirilmiş bir sürümü Tesla serisi için GK210 grafik işlemcisi için tasarlandı.
Maxwell
GM200
GM200 grafik işlemcisi aynı zamanda Geforce 900 serisinin üst düzey bir yongası olarak işlev görür ve bu işlevde Geforce 700 serisinin GK110 GPU'sunun yerini almıştır . GM200, 601 mm² yonga alanında 8 milyar transistöre sahiptir ve bu da onu pazardaki bugüne kadarki en büyük ve en karmaşık grafik işlemcisi yapmaktadır. Teknik bir bakış açısından, 96 raster, 3072 shader ve 192 doku birimine sahip GM200, GM204'ün% 50 daha büyük bir çeşididir. Bu aynı zamanda öncekilerden önemli ölçüde farklıdır: GF100, GF110 veya GK110 GPU'lar hala gelişmiş iki katına sahipti -hassas yetenekler (FP64) ve Quadro ve Tesla profesyonel serilerinde de kullanıldı . Bunun için GK110 z. B. Her SMX bloğuna 64 ayrı ALU takıldı, bu da 1/3 DP oranına sahip olduğu anlamına geliyordu. GM200'de bu ayrı ALU'lar eksik olduğundan (büyük olasılıkla alan nedeniyle silinmişlerdir, çünkü 600 mm²'nin üzerinde boyuta sahip grafik işlemcilerin üretimi teknik ve ekonomik nedenlerle pek mümkün değildir) sadece 1 DP oranına sahiptir. / 32. 3D uygulamalar için çift hassasiyetli işlemler gerekmediğinden, bu özellik oyun sektöründe bir rol oynamadı, ancak GM200'ü Quadro ve Tesla profesyonel serileri için uygunsuz hale getirdi.
Bu nedenle Nvidia, üç serinin tümü için üst düzey / meraklı bir çip geliştirme konusundaki önceki stratejisinden vazgeçti ve Tesla M40 için yalnızca GM200'ü kullandı. Bunun yerine, Tesla K80 için GK210 grafik işlemcisi olan Kepler GK110'un geliştirilmiş bir versiyonu tasarlandı.
GM204
GM204 grafik işlemcisi, Geforce 900 serisinin ilk GPU'suydu ve "ikinci nesil Maxwell mimarisini" kullanıyor. İlk Kepler nesli olan Geforce 600 serisinde olduğu gibi , Nvidia performans yongasını (GM204) üst düzey yongadan (GM200) önce pazara gönderiyor. Nvidia, AMD gibi, 20 nm üretim olmadan yaptığımız ardından TSMC , GM204 orijinal planlara 28 nm üretim Aksine üretilmeye devam edecektir. 398 mm² yonga alanında 5,2 milyar transistöre sahiptir. Temel yapı, ilk Maxwell neslinin GM107 GPU'suyla aynıdır: Gölgelendirici kümeleri (SMM) hala 128 gölgelendirici ve 8 doku birimi içerir, ancak 1. düzey önbellek ve dokular 64 kBayt'tan 96 kBayt'a değiştirilmiştir - Önbellek, küme başına 24 kByte'dan 48 kByte'a yükseltildi. GM204, her biri bir tarama motorunda asılı dört küme ile toplam 16 gölgelendirici kümesinden oluşur; bu, GM204'ün 2048 akış işlemcisine, 128 doku birimine, 64 ROP'a ve 2 MB düzey 2 önbelleğe sahip olduğu anlamına gelir. Bu sınıftaki diğer GPU'lara kıyasla 256 bitlik küçük bellek arayüzünü telafi etmek için Nvidia, bellek yükünü yaklaşık% 25 oranında azaltması beklenen bir bant genişliği koruyucusu olan "Üçüncü Nesil Delta Renk Sıkıştırma" özelliğini tanıttı.
Çift Hassasiyet performansındaki Tek Hassasiyetin 1 / 32'si ile sınırlamalar nedeniyle, Kepler mimarisine sahip Tesla K kartları daha yüksek performanslarıyla sunulmaya devam edecek.
Pascal
GP100
Pascal çipleri "GP100" olarak adlandırılır ve yüksek bilgi işlem gücü ve verimlilikleri sayesinde, özellikle yüksek performanslı bilgi işlem ve derin öğrenme için uygundur. Tesla P100 ile Nvidia, 2016 baharında GPC 2016'da GP100 çipli ilk bilgi işlem hızlandırıcısını sundu. Pascal, orta vadede profesyonel sektördeki Kepler ve Maxwell grafik yongalarının yerini alacak. GPU100, 15 milyar transistörden oluşur ve 3840 adede kadar gölgelendirici çekirdeği içerir. Nvidia, GP100 GPU'yu TSMC'de, önceki 28 nm teknolojisinden önemli ölçüde daha fazla enerji verimli olan 16 nm FinFET sürecini kullanarak üretiyor. Bellek söz konusu olduğunda, Nvidia en azından Tesla P100'de HBM 2 (Yüksek Bant Genişlikli Bellek 2) kullanıyor. Şu anda yalnızca AMD'nin Fiji GPU'lu grafik kartları için kullandığı HBM 1 ile karşılaştırıldığında, HBM 2, daha yüksek aktarım hızları ve GPU başına daha fazla bellek sağlar.
AMD'nin Fiji muadili gibi, GP100 de bir aracı (veya "taşıyıcı") üzerine oturur ve 16 GByte ECC korumalı HBM-2 belleğine toplam 4096 veri hattı üzerinden bağlanır. Dört bellek yığını, sinyal yollarını azaltmak ve sonuç olarak aktarım hızını en üst düzeye çıkarmak için GPU'ya çok yakın yerleştirilmiştir. Tesla P100 ile saniyede 720 GB'dir.
Volta
GV100
Volta, öncelikle yapay zeka veya derin öğrenme alanındaki hesaplamalara göre uyarlanmıştır. "GV100" adı verilen GPU, 21,1 milyar transistörden oluşur ve 815 mm² yonga alanında 5376 gölgelendirici işleme çekirdeği içerir. Nvidia, GV100 GPU'yu 12 nanometre FFN sürecini kullanarak Tayvanlı fason üretici TSMC'de üretiyor.
Tesla V100'de ise, Nvidia yonga verimini artırmak için 84 gölgelendirici kümesinin yalnızca 80'ini etkinleştiriyor. Bu, 5120 gölgelendirici çekirdeklerinin FP32 için mevcut olduğu anlamına gelir. GV100-GPU, tek duyarlıklı hesaplamaların 15 TFlops'a kadar (FP16 için 30 TFlops) yapılmasına izin verir, 2560 çift duyarlıklı birimler teorik olarak 7.5 FP64-TFlop'u yönetir. PCIe kartı ile Volta, SXM2 varyantına kıyasla (biraz daha düşük saat frekansı nedeniyle - 1455 MHz yerine 1370) 14 veya 7 TFlopsluk teorik olarak biraz daha düşük bir hesaplama gücü elde ediyor. Ek olarak, Volta 640 derin öğrenme özel birimi içerir. Bu sözde tensör çekirdeklerinden, her akışlı çok işlemcide sekiz tensör çekirdeği bulunur. Hem eğitim sırasında hem de sinir ağlarının çıkarımı sırasında 120 Tflops'a kadar bir bilgi işlem gücü elde edebilirsiniz. Ancak, yalnızca sınırlı ölçüde programlanabilirler.
Tesla V100'de 900 GByte / s'ye ulaşan bellek için HBM-2 bellek (High Bandwidth Memory 2) kullanılır. Önceki Tesla P100'de olduğu gibi, bellek boyutu 16 GB'de kalıyor. Teorik olarak 32 GB'a kadar bellek genişletmesi mümkündür. Tesla P100'deki Pascal çipiyle karşılaştırıldığında, Volta'nın L1 önbelleği, 4 kat daha düşük bir gecikme süresine sahiptir ve yaklaşık 14 terabayt / sn'lik bir iş hacmine ulaşır.
Turing
TU104
Tesla serisinin yeni Turing kartı T4, 75 watt'lık PCIe 3.0 güç sınırındadır ve bu nedenle sunucular için idealdir.
İşlemciler
GPU ile hesaplamalara odaklandığı için çoğu kartta çıkış bağlantı noktaları bulunmadığından, burada en önemlisi OpenCL ve CUDA hesaplama arayüzleri . OpenCL 2.0 Değerlendirme desteği, Kepler, Maxwell ve Pascal için 378.66 sürücü sürümüyle mevcuttur. OpenGL 4.6, Linux için 381 ve Windows için 387'den en son sürücülerle Fermi'den mümkündür.
yonga | üretim | birimleri | arayüz | |||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Nm cinsinden süreç |
Transis- milyonlarca müdahale |
- Alan mm² |
ROP parçacık fonksiyonları |
ROP'lar | Birleşik gölgelendiriciler | Gölgelendirici modeli |
Doğrudan X |
GL'yi aç |
CL'yi aç |
Cuda CAPA bility |
Cuda SDK (maks.) |
donanım | ||
Akış işlemcileri |
Gölgelendirici - küme |
|||||||||||||
birimleri | ||||||||||||||
Tesla G80 | 90 | 681 | 484 | 6 | 24 | 128 | 8 | 4.0 | 10.0 | 3.3 | 1.1 | 1.0 | 6.5 | PCIe |
Tesla GT200 / b | 65/55 | 1400 | 576/470 | 8 | 32 | 240 | 10 | 4.0 | 10.1 | 3.3 | 1.1 | 1.3 | 6.5 | PCIe 2.0 |
Fermi GF100 | 40 | 3000 | 526 | 6 | 48 | 512 | 16 | 5.0 | 11.0 | 4.6 | 1.1 | 2.1 | 8.0 | PCIe 2.0 |
Fermi GF110 | 40 | 3000 | 526 | 6 | 48 | 512 | 16 | 5.0 | 11.0 | 4.6 | 1.1 | 2.1 | 8.0 | PCIe 2.0 |
Kepler GK104 | 28 | 3540 | 294 | 4. | 32 | 1536 | 8 | 5.0 | 11.0 | 4.6 | 1.2 (2.0) | 3.0 | 10.0 | PCIe 3.0 |
Kepler GK110 | 28 | 7100 | 561 | 6 | 48 | 2880 | 15 | 5.0 | 11.0 | 4.6 | 1.2 (2.0) | 3.0 | 10.0 | PCIe 3.0 |
Kepler GK210 | 28 | yaklaşık 7100 | yaklaşık 561 | 6 | 48 | 2880 | 15 | 5.0 | 11.0 | 4.6 | 1.2 (2.0) | 3.5 | 10.0 | PCIe 3.0 |
Maxwell GM200 | 28 | 8.000 | 601 | 6 | 96 | 3072 | 24 | 5.0 | 12.0 | 4.6 | 1.2 (2.0) | 5.2 | 10.0 | PCIe 3.0 |
Maxwell GM204 | 28 | 5.200 | 398 | 4. | 64 | 2048 | 16 | 5.0 | 12.1 | 4.6 | 1.2 (2.0) | 5.2 | 10.0 | PCIe 3.0 |
Maxwell GM206 | 28 | 2.940 | 227 | 2 | 32 | 1024 | 8 | 5.0 | 12.1 | 4.6 | 1.2 (2.0) | 5.2 | 10.0 | PCIe 3.0 |
Pascal GP100 | 16 | 15.300 | 610 | 10 | 96 | 3840 | 60 | 5.0 | 12.1+ | 4.6 | 1.2 (2.0) | 6.0 | 10.0 | PCIe 3.0 , NVLink |
Volta GV100 | 12'si | 21.100 | 815 | 128 | 5376 | 84 | 5.0 | 12.1+ | 4.6 | 1.2 (2.0) | 7.0 | 10.0 | PCIe 3.0 , NVLink | |
Turing TU104 | 12'si | 13.600 | 545 | 64 | 2560 | 40 | 6.3 | 12.1+ | 4.6 | 1.2 (2.0) | 7.5 | 10.0 | PCIe 3.0 , NVLink |
Model verileri
Model adı | işlemci | Depolama | |||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Tür |
Stream İşlemcisi SORS |
Saat çipi |
Saat gölgelendiricisi |
GFLOPS'ta bilgi işlem gücü | Boyutu içinde MB'ye |
İnceliğini |
Tür | Depolama arayüzü |
Depolama verim oranı |
||||
Yarım Hassas (FP16) |
Single Prec. (MAD + MUL) |
Single Prec. (MAD veya FMA) |
Double Prec. (FMA) |
||||||||||
birimleri | MHz | MHz | MB | MHz | GB / sn | ||||||||
Tesla C870 | G80 | 128 | 600 | 1350 | Hayır? | 519 | Hayır | 1536 | 800 | GDDR3 | 384 bit | 77 | |
Tesla D870 | 2 × G80 | 256 | 600 | 1350 | Hayır? | 1037 | Hayır | 3072 | 800 | GDDR3 | 2 × 384 bit | 2 × 77 | |
Tesla S870 | 4 × G80 | 512 | 600 | 1350 | Hayır? | 2074 | Hayır | 6144 | 800 | GDDR3 | 4 × 384 bit | 4 × 77 | |
Tesla C1060 | GT200 | 240 | 602 | 1296 | ? | 933 | 622 | 78 | 4096 | 800 | GDDR3 | 512 bit | 102 |
Tesla S1070 | 4 × GT200 | 960 | 602 | 1296 | ? | 3732 | 2488 | 311 | 16.384 | 800 | GDDR3 | 4 × 512 bit | 4 × 102 |
4 × GT200b | 1440 | ? | 4147 | 2765 | 345 | ||||||||
Tesla C2050 | Fermi GF100 | 448 | 575 | 1150 | ? | Hayır | 1030 | 515 | 3072 | 1500 | GDDR5 | 384 bit | 144 |
Tesla M2050 | GF100 | 448 | 575 | 1150 | ? | Hayır | 1030 | 515 | 3072 | 1550 | GDDR5 | 384 bit | 148 |
Tesla C2070 | GF100 | 448 | 575 | 1150 | ? | Hayır | 1030 | 515 | 6144 | 1500 | GDDR5 | 384 bit | 144 |
Tesla M2070 | GF100 | 448 | 575 | 1150 | ? | Hayır | 1030 | 515 | 6144 | 1550 | GDDR5 | 384 bit | 150 |
Tesla S2050 | 4 × GF100 | 1792 | 575 | 1150 | ? | Hayır | 4120 | 2060 | 12.288 | 1500 | GDDR5 | 4 × 384 bit | 4 × 144 |
Tesla S2070 | 4 × GF100 | 1792 | 575 | 1150 | ? | Hayır | 4122 | 2061 | 24.576 | 1500 | GDDR5 | 4 × 384 bit | 4 × 144 |
Tesla M2090 | Fermi GF110 | 512 | 650 | 1300 | ? | Hayır | 1331 | 666 | 6144 | 1850 | GDDR5 | 384 bit | 177 |
Tesla K10 | 2 × GK104 | 3072 | 745 | ? | Hayır | 4580 | 191 | 8192 | 2500 | GDDR5 | 2 × 256 bit | 2 × 160 | |
Tesla K20 | GK110 | 2496 | 705 | ? | Hayır | 3524 | 1175 | 5120 | 2600 | GDDR5 | 320 bit | 208 | |
Tesla K20X | GK110 | 2688 | 735 | ? | Hayır | 3935 | 1312 | 6144 | 2600 | GDDR5 | 384 bit | 250 | |
Tesla K40 | GK110B | 2880 | 745 (Yükseltme: 810/875) | ? | Hayır | 4290 | 1430 | 12.288 | 3004 | GDDR5 | 384 bit | 288 | |
Tesla K80 | 2 × GK210 | 5760 | 590 | ? | Hayır | 5591-8736 | 1864-2912 | 24.576 | 3004 | GDDR5 | 2 × 384 bit | 2 × 288 | |
Tesla M4 | GM206 | 1024 | 872 (Yükseltme: 1072) | ? | Hayır | 1786-2195 | 56-69 | 4096 | 2750 | GDDR5 | 128 bit | 88 | |
Tesla M40 | GM200 | 3072 | 948 (Yükseltme: 1114) | ? | Hayır | 5825-6844 | 182-214 | 12288 | 3000 | GDDR5 | 384 bit | 288 | |
Tesla M6 | GM204 | 1536 | 930 (Yükseltme 1180) | ? | Hayır | 2857 | 2857/32 | 8192 | 2750 | GDDR5 | 256 bit | 160 | |
Tesla M60 | 2x GM204 | 4096 | 900 (Yükseltme: 1180) | ? x SP | Hayır | 7373-9667 | 230-302 | 2 × 8192 | 2500 | GDDR5 | 2 × 256 bit | 2 × 160 | |
Tesla P4 | GP104 | 2560 | 810 (Yükseltme: 1063) | 2x SP | Hayır | 5500 | 1/32 SP | 8000 | 1500 (ef. 6000) | GDDR5 | 256 bit | 192 | |
Tesla P40 | GP102 | 3840 | 1303 (Yükseltme: 1531) | 2x SP | Hayır | 12000 | 1/32 SP | 24000 | 1251 (eff. 10008) | GDDR5 X | 384 bit | 346 | |
Tesla P100 "PCIe 12 GB 250 W" | GP100 | 3584 | 1175 (Yükseltme: 1300)? | 2x SP | Hayır | 8000-9300 | 4700 | 12288 | 700 | HBM2 | 3072 bit | 540 | |
Tesla P100 "PCIe 16 GB 250 W" | GP100 | 3584 | 1175 (Yükseltme: 1300)? | 2x SP | Hayır | 8000-9300 | 4700 | 16384 | 700 | HBM2 | 4096 bit | 720 | |
Tesla P100 "NVLink 300W" | GP100 | 3584 | 1328 (Yükseltme: 1480) | 2x SP | Hayır | 9519-10609 | 5300 | 16384 | 700 | HBM2 | 4096 bit | 720 | |
Tesla V100 PCle 250 W | GV100 | 5120 | (Yükseltme: 1370) | 8x SP Tensör Modu | Hayır | 14.000 | 7000 | 16384 | 876 (ef. 1752) | HBM2 | 4096 bit | 900 | |
Tesla V100 SXM2 NVLink 300 W | GV100 | 5120 | (Yükseltme: 1455) | 8x SP Tensör Modu | Hayır | 15.000 | 7500 | 16384 | 876 (ef. 1752) | HBM2 | 4096 bit | 900 | |
Tesla T4 PCIe 70 W | TU104 | 2560 | 1005 (Yükseltme: 1515) | 8x SP Tensör Modu | Hayır | 8100 | 1/32 SP | 16384 | 1250 (ef. 10.000) | GDDR6 | 256 bit | 320 |
İnternet linkleri
- nVidia Tesla resmi nVidia ana sayfasında
- Resmi Nvidia ana sayfasında Fermi mimarisi
- Teknik Rapor - nVidia Fermi Mimarisi (PDF; 869 kB; İngilizce)
Bireysel kanıt
- ↑ ATI Stream Technology - Commercial ( İnternet Arşivi'nde 19 Şubat 2010 tarihli Memento )
- ↑ Tom donanımı: GTX 480'in DP hızı düşürüldü ( İnternet Arşivinde 2 Temmuz 2010 tarihli orijinalin hatırası ) Bilgi: Arşiv bağlantısı otomatik olarak eklendi ve henüz kontrol edilmedi. Lütfen orijinal ve arşiv bağlantısını talimatlara göre kontrol edin ve ardından bu uyarıyı kaldırın. , 6 Nisan 2010 tarihli mesaj
- ↑ golem: Nvidia, Fermi için ilk performans değerlerini açıkladı , 16 Kasım 2009'dan bir mesaj
- ↑ de.download.nvidia.com (PDF)
- ↑ de.download.nvidia.com (PDF)
- ↑ de.download.nvidia.com (PDF)
- ↑ Tesla K80 - süper bilgisayarlar için 8,7'ye kadar TFLOPS içeren çift Kepler. ComputerBase, 17 Kasım 2014, erişim tarihi 6 Ağustos 2015 .
- ↑ a b Başlatma analizi: nVidia GeForce GTX Titan X. 3DCenter.org, 18 Mart 2015, 10 Haziran 2015'te erişildi .
- ↑ Lansman analizi: nVidia GeForce GTX 970 & 980.3DCenter, 19 Eylül 2014, 3 Şubat 2015'te erişildi .
- ↑ heise.de
- ↑ images.nvidia.com (PDF)
- ↑ çevrimiçi: Tesla V100: Nvidia, ilk Volta hesaplama kartlarını derin öğrenme araştırmacılarına verir. heise çevrimiçi, 12 Eylül 2017'de erişildi .
- ↑ heise.de
- ↑ streamcomputing.eu
- ↑ developer.nvidia.com
- ↑ Teknik Rapor Kepler GK110 (PDF; 1.7 MB)
- ↑ Arşivlenmiş kopya ( İnternet Arşivinde 21 Haziran 2016 tarihli orijinalin hatırası ) Bilgi: Arşiv bağlantısı otomatik olarak eklendi ve henüz kontrol edilmedi. Lütfen orijinal ve arşiv bağlantısını talimatlara göre kontrol edin ve ardından bu uyarıyı kaldırın. (PDF; 2 MB)
- ↑ images.nvidia.com (PDF)
- ↑ techpowerup.com
- ↑ anandtech.com
- ↑ techpowerup.com
- ↑ techpowerup.com
- ↑ Anlamlı program kodu ile gerçek anlamda asla elde edilemeyecek, hesaplamalı olarak belirlenmiş, teorik maksimum hesaplama gücü.
- ↑ TESLA M2090 ÇİFT YUVARLAK BİLGİSAYAR İŞLEMCİSİ MODÜLÜ Kart Özellikleri (PDF; 348 kB)
- ↑ Ürüne genel bakış M2090 (PDF; 423 kB)
- ↑ TESLA K10 GPU ACCELERATOR Kart Özellikleri (PDF; 650 kB)
- ↑ NVIDIA® Tesla® Kepler GPU Hesaplama Hızlandırıcıları (PDF; 296 kB)
- ↑ TESLA K10 K20 K20X GPU HIZLANDIRICI Kart Özellikleri (PDF; 193 kB)
- ↑ Hassan Mujtaba: NVIDIA Tesla K80 "GK210-DUO" Grafik Kartı Profesyonel Pazara Giden - 2 TFlop'tan Fazla Çift Hassas Hesaplama içerir. WCCFtech.com, 29 Kasım 2014'te erişildi .
- ↑ techpowerup.com
- ↑ techpowerup.com
- ↑ techpowerup.com
- ↑ heise.de
- ↑ techpowerup.com
- ↑ heise.de
- ↑ Arşivlenmiş kopya ( İnternet Arşivi'nde 18 Ekim 2016 tarihli orijinalin hatırası ) Bilgi: Arşiv bağlantısı otomatik olarak eklendi ve henüz kontrol edilmedi. Lütfen orijinal ve arşiv bağlantısını talimatlara göre kontrol edin ve ardından bu uyarıyı kaldırın.
- ↑ a b NVIDIA Tesla V100 | NVIDIA. NVIDIA Corporation, 12 Eylül 2017'de erişildi (Amerikan İngilizcesi).
- ↑ a b Veri Sayfası NVIDIA V100 GPU ACCELERATOR. (PDF) NVIDIA Corporation, Temmuz 2017, erişim tarihi 12 Eylül 2017 .
- ↑ xcelerit.com
- ↑ nvidia.com