baner achos

Newyddion y Diwydiant: Mae Jim Keller wedi lansio sglodion RISC-V newydd

Newyddion y Diwydiant: Mae Jim Keller wedi lansio sglodion RISC-V newydd

Mae'r cwmni sglodion Tenstorrent dan arweiniad Jim Keller wedi rhyddhau ei brosesydd Wormhole cenhedlaeth nesaf ar gyfer llwythi gwaith AI, y mae'n disgwyl iddo gynnig perfformiad da am bris fforddiadwy.Ar hyn o bryd mae'r cwmni'n cynnig dau gerdyn PCIe ychwanegol a all ddarparu ar gyfer un neu ddau brosesydd Wormhole, yn ogystal â gorsafoedd gwaith TT-LoudBox a TT-QuietBox ar gyfer datblygwyr meddalwedd. Mae holl gyhoeddiadau heddiw wedi'u hanelu at ddatblygwyr, nid y rhai sy'n defnyddio byrddau Wormhole ar gyfer llwythi gwaith masnachol.

“Mae bob amser yn braf cael mwy o’n cynnyrch yn nwylo datblygwyr. Gall systemau datblygu rhyddhau sy’n defnyddio ein cardiau Wormhole™ helpu datblygwyr i raddio a datblygu meddalwedd AI aml-sglodion,” meddai Jim Keller, Prif Swyddog Gweithredol Tenstorrent.Yn ogystal â'r lansiad hwn, rydym yn gyffrous i weld y cynnydd rydym yn ei wneud gyda thâp allan a phweru ein cynnyrch ail genhedlaeth, Blackhole.

1

Mae pob prosesydd Wormhole yn cynnwys 72 o greiddiau Tensix (pump ohonynt yn cefnogi creiddiau RISC-V mewn gwahanol fformatau data) a 108 MB o SRAM, gan ddarparu 262 FP8 TFLOPS ar 1 GHz gyda phŵer dylunio thermol o 160W. Mae'r cerdyn sglodion sengl Wormhole n150 wedi'i gyfarparu â chof fideo GDDR6 12 GB ac mae ganddo led band o 288 GB/s.

Mae proseswyr Wormhole yn darparu graddadwyedd hyblyg i ddiwallu anghenion amrywiol llwythi gwaith. Mewn gosodiad gweithfan safonol gyda phedair cerdyn Wormhole n300, gellir cyfuno'r proseswyr yn un uned sy'n ymddangos yn y feddalwedd fel rhwydwaith craidd Tensix eang, unedig. Mae'r ffurfweddiad hwn yn caniatáu i'r cyflymydd drin yr un llwyth gwaith, ei rannu rhwng pedwar datblygwr neu redeg hyd at wyth model AI gwahanol ar yr un pryd. Nodwedd allweddol o'r graddadwyedd hwn yw y gall redeg yn lleol heb yr angen am rithwiroli. Mewn amgylchedd canolfan ddata, bydd proseswyr Wormhole yn defnyddio PCIe ar gyfer ehangu y tu mewn i'r peiriant, neu Ethernet ar gyfer ehangu allanol.

O ran perfformiad, cyflawnodd cerdyn sglodion sengl Wormhole n150 Tenstorrent (72 craidd Tensix, amledd 1 GHz, 108 MB SRAM, 12 GB GDDR6, lled band 288 GB/s) 262 FP8 TFLOPS ar 160W, tra bod y bwrdd sglodion deuol Wormhole n300 (128 craidd Tensix, amledd 1 GHz, 192 MB SRAM, cyfanswm o 24 GB GDDR6, lled band 576 GB/s) yn darparu hyd at 466 FP8 TFLOPS ar 300W.

I roi 300W o 466 FP8 TFLOPS mewn cyd-destun, byddwn yn ei gymharu â'r hyn y mae arweinydd y farchnad AI, Nvidia, yn ei gynnig ar y pŵer dylunio thermol hwn. Nid yw A100 Nvidia yn cefnogi FP8, ond mae'n cefnogi INT8, gyda pherfformiad brig o 624 TOPS (1,248 TOPS pan fydd yn brin). Mewn cymhariaeth, mae H100 Nvidia yn cefnogi FP8 ac yn cyrraedd perfformiad brig o 1,670 TFLOPS ar 300W (3,341 TFLOPS pan fydd yn brin), sy'n sylweddol wahanol i Wormhole n300 Tenstorrent.

Fodd bynnag, mae un broblem fawr. Mae Wormhole n150 Tenstorrent yn gwerthu am $999, tra bod yr n300 yn gwerthu am $1,399. Mewn cymhariaeth, mae cerdyn graffeg Nvidia H100 sengl yn gwerthu am $30,000, yn dibynnu ar faint. Wrth gwrs, nid ydym yn gwybod a all pedwar neu wyth prosesydd Wormhole gyflawni perfformiad un H300 mewn gwirionedd, ond eu TDPs yw 600W a 1200W yn y drefn honno.

Yn ogystal â'r cardiau, mae Tenstorrent yn cynnig gorsafoedd gwaith parod ar gyfer datblygwyr, gan gynnwys 4 cerdyn n300 yn y TT-LoudBox mwy fforddiadwy sy'n seiliedig ar Xeon gydag oeri gweithredol, a'r TT-QuietBox uwch gyda swyddogaeth oeri hylif Xiaolong sy'n seiliedig ar EPYC.


Amser postio: Gorff-29-2024