Zobrazit předchozí téma :: Zobrazit následující téma |
Autor |
Zpráva |
pcmaster

Založen: 28. 07. 2007 Příspěvky: 1827
|
Zaslal: 16. únor 2011, 19:29:20 Předmět: Viacero grafickych kariet (DirectX) |
|
|
Zdarec,
neviem sa nikde docitat, ci je nejaky problem zapojit do vsetkych PCI-E slotov graficke karty a potom ich vsetky (pripojena na monitor bude maximalne jedna, alebo nijaka!) pouzivat.
Pouzivanim myslim, ze ich DXGI1.1 (DX11, NT6.1) vsetky najde, na kazdej spojazdni kontext (pripadne sharovany kontext???) a potom bude mozno veselo na kazdej paralelne (nezavisle od ostatnych kariet) pustat rendering ci cokolvek (v roznych CPU vlaknach). Vidite v tom nejaky problem?
SLI ani CrossFire neprichadza do uvahy, kazdopadne otazka este je, ci bude mat chipset dosky nejake negativne nasledky na pozadovanu funkcnost (pripadny mensi pocet PCI-E lanes nepocitam). Karty by optimalne mohli byt uplne rozne. Spravu vsetkych GPU pamati si bude robit aplikacia sama (pripadne pouzije niektore DX11 automaticke sharovane veci... ak take existuju )
Hm? Mate k tomu niekto nieco povedat? Cokolvek? _________________ Off-topic flame-war addict since the very beginning. Registered since Oct. 2003!
Interproductum fimi omne est.
Naposledy upravil pcmaster dne 16. únor 2011, 20:06:23, celkově upraveno 2 krát |
|
Návrat nahoru |
|
 |
Marek

Založen: 28. 07. 2007 Příspěvky: 1782 Bydliště: Velká Morava
|
|
Návrat nahoru |
|
 |
pcmaster

Založen: 28. 07. 2007 Příspěvky: 1827
|
Zaslal: 16. únor 2011, 20:01:33 Předmět: |
|
|
Jedna sa o velmi specificky DX10/DX11, nejde o novu aplikaciu kde by sa dalo vybrat, v com bude. Akym sposobom je ten clanok relevantny plz? _________________ Off-topic flame-war addict since the very beginning. Registered since Oct. 2003!
Interproductum fimi omne est.
Naposledy upravil pcmaster dne 16. únor 2011, 20:02:45, celkově upraveno 1 krát |
|
Návrat nahoru |
|
 |
VladR
Založen: 30. 07. 2007 Příspěvky: 1322 Bydliště: Greater New York City Area
|
Zaslal: 16. únor 2011, 20:02:22 Předmět: |
|
|
Default tusim Cuda vyrobi context na GPU 0 (inak zavolas cudaSetDevice () pred context creation).
Vo vseobecnosti, ked mas X GPU, tak potrebujes X CPU threadov (ci uz OpenMP, pthreads, ...), kazdy s vlastnym contextom.
To som neskusal, ale tiez ma byt mozne vlastnit GPU context viacerymi threadmi. To je uz na testovani, ci context switching za to stoji (ale u teba to asi nie je potrebne, lebo ty mas prave viac GPU).
Ten zvysok je asi jasny. Medzi CPU threadmi komunikujes normalne ako vzdy, akurat to treba synchronizovat.
Ohladom shared memory - na to su CUDA pinned host memory. Pozri tiez Infiniband. |
|
Návrat nahoru |
|
 |
pcmaster

Založen: 28. 07. 2007 Příspěvky: 1827
|
Zaslal: 16. únor 2011, 20:03:35 Předmět: |
|
|
Chlapi, asi som sa nevyjadril jasne. Vobec sa nejedna o GPGPU a keby aj, tak len v ramci DX11 (hardware s DX10 alebo DX11 alebo oboje). CUDA neprichadza do uvahy, rovnako nie CL. Jedna sa o RASTERIZACIU, kazdopadne to je dost irrelevantne. _________________ Off-topic flame-war addict since the very beginning. Registered since Oct. 2003!
Interproductum fimi omne est. |
|
Návrat nahoru |
|
 |
VladR
Založen: 30. 07. 2007 Příspěvky: 1322 Bydliště: Greater New York City Area
|
Zaslal: 16. únor 2011, 20:20:14 Předmět: |
|
|
Pokial narazas na klasicky rasterizing, tak ako si predstavujes spravu vsetkych bufrov a ich spojenie do jedneho ? Ved to by vsetko muselo ist cez zbernicu, cize by to bolo vsetko mozne, len nie rychle.
Alebo mas na mysli rasterizaciu sta raytracing ? Ten ale nespominas. |
|
Návrat nahoru |
|
 |
pcmaster

Založen: 28. 07. 2007 Příspěvky: 1827
|
Zaslal: 16. únor 2011, 20:27:31 Předmět: |
|
|
Nie, myslim klasicku rasterizaciu, v mnohych prechodoch, kde spajanie bufferov (tj prekopirovanie par fullscreen textur hore dole) je sice pomale, ale cas na to potrebny je zanedbatelny v porovnani so samotnym vykreslovanim. Cas na kompletny frame v minutach. Rozne casti a prechody a vsetko bude mozne rucne rozdelit na viacero kariet, spravova bufferov a textur bude uplne rucna.
Ale ako vidis, je to pre moju povodnu a hlavnu otazku uplne irrelevantne
Ja sa pytam, ci to vobec pojde, konkretne s aktualnymi verziami Windows a DirectX. Prd o tom viem najst Nie, ako to bude rychle. _________________ Off-topic flame-war addict since the very beginning. Registered since Oct. 2003!
Interproductum fimi omne est. |
|
Návrat nahoru |
|
 |
nou

Založen: 28. 07. 2007 Příspěvky: 1050
|
Zaslal: 16. únor 2011, 20:53:36 Předmět: |
|
|
Windows Vista. iba nVidia karty alebo len ATI karty kedze je mozne mat len jeden graficky ovladac.
Windows XP/7 je mozne mat viacero kariet s roznimy ovladacmi.
ale aj tak treba mat pripojeny monitor na kazdu kartu. kedze Windows kazdu nepirpojenu kartu vypne. alebo spravit si dummy plug pomocou jedneho odporu do konektoru aby si myslel ze je pripojeny monitor. http://blog.zorinaq.com/?e=11
takze jediny problem vidim v tom ziskat pre kazdu jednotlivu kartu kontext a teda aby sa to renderovalo na danej karte. mozno bude treba mat na kazdej virtualnej ploche okno. _________________ Najjednoduchšie chyby sa najtažšie hľadajú. |
|
Návrat nahoru |
|
 |
Marek

Založen: 28. 07. 2007 Příspěvky: 1782 Bydliště: Velká Morava
|
Zaslal: 17. únor 2011, 02:03:33 Předmět: |
|
|
pcmaster> Aha, už rozumím. Nevidím důvod, proč by to nemělo jít. _________________ AMD Open Source Graphics Driver Developer |
|
Návrat nahoru |
|
 |
pcmaster

Založen: 28. 07. 2007 Příspěvky: 1827
|
Zaslal: 17. únor 2011, 13:21:27 Předmět: |
|
|
Super Tak som zvedavy, dam vediet za nejaky cas, ako to facha...
Edit: Tak ked sme uz pri tom, tak ako velmi sa prejavi x8 PCI-e (x8+x8 ), ktore zvlada vacsina dosiek? Niektore vam ten x16 slot prepnu dokonca len do x4 (x16+x4)!!! No a velmi malo drahsich doskie vie x16+x16. Tak ci sa oplati velmi investovat do drahsej.
Kopirovat sa bude kopec veci, povedal by som, ze vacsinou "broadcastovat" z CPU na vsetky GPU a potom este par krat kopirovat buffery a textury z jedneho GPU na druhe GPU. Kazdopadne nepredpokladam, ze toto bude uzke hrdlo... Kde este sa prejavi pocet PCI-e lanes? _________________ Off-topic flame-war addict since the very beginning. Registered since Oct. 2003!
Interproductum fimi omne est. |
|
Návrat nahoru |
|
 |
nou

Založen: 28. 07. 2007 Příspěvky: 1050
|
|
Návrat nahoru |
|
 |
Vilem Otte

Založen: 18. 09. 2007 Příspěvky: 462 Bydliště: Znojmo - Sedlesovice, Kravi Hora
|
Zaslal: 17. únor 2011, 17:03:20 Předmět: |
|
|
Není třeba mít více CPU jader, v praxi je to relativně jednoduché - vytvoříš dva kontexty na různých zařízeních (jsou pro to příkazy - cudaGLSetDevice, pokud se pamatuju, je to v CUDA jazyce, jde to také i v "nativním" GL, ale nevím zda driver nepošle podle sebe kontext na zařízení, kde se má zpracovat - či to řešíš ty).
Vše můžeš řídit z jediného CPU vlákna! Nepotřebuješ jich více. Věc je, že výkon ti vzroste, pokud budeš stíhat přenášet data, jinak ti nepomůže ani 10 GPU najednou
Zase tak horké jako u CPU to ale tady není, nárust není tak dramatický (jako v případě ray tracerů - 1 core využití na 6-core Ci7 je 6x pomalejší než 6 core využití na 6-core Ci7. A to už jsou venku 12-core Opertony (na dual socketu by to mohlo dávat ven pořádný výkon). _________________ Should array indices start at 0 or 1? My compromise of 0.5 was rejected without, I thought, proper consideration. |
|
Návrat nahoru |
|
 |
|