ČeskéHry.cz - KOMUNITA HERNÍCH VÝVOJÁŘŮ

pcmaster · Založen: 28. 07. 2007 Příspěvky: 1827

Zdarec,

neviem sa nikde docitat, ci je nejaky problem zapojit do vsetkych PCI-E slotov graficke karty a potom ich vsetky (pripojena na monitor bude maximalne jedna, alebo nijaka!) pouzivat.
Pouzivanim myslim, ze ich DXGI1.1 (DX11, NT6.1) vsetky najde, na kazdej spojazdni kontext (pripadne sharovany kontext???) a potom bude mozno veselo na kazdej paralelne (nezavisle od ostatnych kariet) pustat rendering ci cokolvek (v roznych CPU vlaknach). Vidite v tom nejaky problem?
SLI ani CrossFire neprichadza do uvahy, kazdopadne otazka este je, ci bude mat chipset dosky nejake negativne nasledky na pozadovanu funkcnost (pripadny mensi pocet PCI-E lanes nepocitam). Karty by optimalne mohli byt uplne rozne. Spravu vsetkych GPU pamati si bude robit aplikacia sama (pripadne pouzije niektore DX11 automaticke sharovane veci... ak take existuju Very Happy

)

Hm? Mate k tomu niekto nieco povedat? Cokolvek?
_________________
Off-topic flame-war addict since the very beginning. Registered since Oct. 2003!
Interproductum fimi omne est.

Marek

http://www.geeks3d.com/20110216/opencl-support-gets-better-and-better-nvidia-amd-intel-gpu-caps-viewer/
_________________
AMD Open Source Graphics Driver Developer

pcmaster · Založen: 28. 07. 2007 Příspěvky: 1827

Jedna sa o velmi specificky DX10/DX11, nejde o novu aplikaciu kde by sa dalo vybrat, v com bude. Akym sposobom je ten clanok relevantny plz?
_________________
Off-topic flame-war addict since the very beginning. Registered since Oct. 2003!
Interproductum fimi omne est.

VladR

Default tusim Cuda vyrobi context na GPU 0 (inak zavolas cudaSetDevice () pred context creation).

Vo vseobecnosti, ked mas X GPU, tak potrebujes X CPU threadov (ci uz OpenMP, pthreads, ...), kazdy s vlastnym contextom.

To som neskusal, ale tiez ma byt mozne vlastnit GPU context viacerymi threadmi. To je uz na testovani, ci context switching za to stoji (ale u teba to asi nie je potrebne, lebo ty mas prave viac GPU).

Ten zvysok je asi jasny. Medzi CPU threadmi komunikujes normalne ako vzdy, akurat to treba synchronizovat.

Ohladom shared memory - na to su CUDA pinned host memory. Pozri tiez Infiniband.

pcmaster · Založen: 28. 07. 2007 Příspěvky: 1827

Chlapi, asi som sa nevyjadril jasne. Vobec sa nejedna o GPGPU a keby aj, tak len v ramci DX11 (hardware s DX10 alebo DX11 alebo oboje). CUDA neprichadza do uvahy, rovnako nie CL. Jedna sa o RASTERIZACIU, kazdopadne to je dost irrelevantne.
_________________
Off-topic flame-war addict since the very beginning. Registered since Oct. 2003!
Interproductum fimi omne est.

VladR

Pokial narazas na klasicky rasterizing, tak ako si predstavujes spravu vsetkych bufrov a ich spojenie do jedneho ? Ved to by vsetko muselo ist cez zbernicu, cize by to bolo vsetko mozne, len nie rychle.

Alebo mas na mysli rasterizaciu sta raytracing ? Ten ale nespominas.

pcmaster · Založen: 28. 07. 2007 Příspěvky: 1827

Nie, myslim klasicku rasterizaciu, v mnohych prechodoch, kde spajanie bufferov (tj prekopirovanie par fullscreen textur hore dole) je sice pomale, ale cas na to potrebny je zanedbatelny v porovnani so samotnym vykreslovanim. Cas na kompletny frame v minutach. Rozne casti a prechody a vsetko bude mozne rucne rozdelit na viacero kariet, spravova bufferov a textur bude uplne rucna.

Ale ako vidis, je to pre moju povodnu a hlavnu otazku uplne irrelevantne Very Happy

Ja sa pytam, ci to vobec pojde, konkretne s aktualnymi verziami Windows a DirectX. Prd o tom viem najst Smile

Nie, ako to bude rychle.
_________________
Off-topic flame-war addict since the very beginning. Registered since Oct. 2003!
Interproductum fimi omne est.

nou · Založen: 28. 07. 2007 Příspěvky: 1050

Windows Vista. iba nVidia karty alebo len ATI karty kedze je mozne mat len jeden graficky ovladac.
Windows XP/7 je mozne mat viacero kariet s roznimy ovladacmi.

ale aj tak treba mat pripojeny monitor na kazdu kartu. kedze Windows kazdu nepirpojenu kartu vypne. alebo spravit si dummy plug pomocou jedneho odporu do konektoru aby si myslel ze je pripojeny monitor. http://blog.zorinaq.com/?e=11

takze jediny problem vidim v tom ziskat pre kazdu jednotlivu kartu kontext a teda aby sa to renderovalo na danej karte. mozno bude treba mat na kazdej virtualnej ploche okno.
_________________
Najjednoduchšie chyby sa najtažšie hľadajú.

Marek

pcmaster> Aha, už rozumím. Nevidím důvod, proč by to nemělo jít.
_________________
AMD Open Source Graphics Driver Developer

pcmaster · Založen: 28. 07. 2007 Příspěvky: 1827

Super

Tak som zvedavy, dam vediet za nejaky cas, ako to facha...
Edit: Tak ked sme uz pri tom, tak ako velmi sa prejavi x8 PCI-e (x8+x8 ), ktore zvlada vacsina dosiek? Niektore vam ten x16 slot prepnu dokonca len do x4 (x16+x4)!!! No a velmi malo drahsich doskie vie x16+x16. Tak ci sa oplati velmi investovat do drahsej.

Kopirovat sa bude kopec veci, povedal by som, ze vacsinou "broadcastovat" z CPU na vsetky GPU a potom este par krat kopirovat buffery a textury z jedneho GPU na druhe GPU. Kazdopadne nepredpokladam, ze toto bude uzke hrdlo... Kde este sa prejavi pocet PCI-e lanes?
_________________
Off-topic flame-war addict since the very beginning. Registered since Oct. 2003!
Interproductum fimi omne est.

nou · Založen: 28. 07. 2007 Příspěvky: 1050

to sa da vyskusat hned. staci zobrat kartu a zalepit piny od konca. cim viac sa ich zalepi tym menej liniek ostane. takto sa da simulovat 8x 4x aj 2x PCIe slot v plnom 16x porte. http://www.tomshardware.com/reviews/pci-express-scaling-analysis,1572-3.html
_________________
Najjednoduchšie chyby sa najtažšie hľadajú.

Vilem Otte

Není třeba mít více CPU jader, v praxi je to relativně jednoduché - vytvoříš dva kontexty na různých zařízeních (jsou pro to příkazy - cudaGLSetDevice, pokud se pamatuju, je to v CUDA jazyce, jde to také i v "nativním" GL, ale nevím zda driver nepošle podle sebe kontext na zařízení, kde se má zpracovat - či to řešíš ty).

Vše můžeš řídit z jediného CPU vlákna! Nepotřebuješ jich více. Věc je, že výkon ti vzroste, pokud budeš stíhat přenášet data, jinak ti nepomůže ani 10 GPU najednou Wink

Zase tak horké jako u CPU to ale tady není, nárust není tak dramatický (jako v případě ray tracerů - 1 core využití na 6-core Ci7 je 6x pomalejší než 6 core využití na 6-core Ci7. A to už jsou venku 12-core Opertony (na dual socketu by to mohlo dávat ven pořádný výkon).
_________________
Should array indices start at 0 or 1? My compromise of 0.5 was rejected without, I thought, proper consideration.

	Obsah fóra České-Hry.cz -> 3D API / 3D Enginy	Časy uváděny v GMT + 1 hodina
Strana 1 z 1