CUDA instalēšana operētājsistēmā Windows Tam nav jābūt par galvassāpēm, ja sekojat skaidram ceļam, ko apstiprina oficiālās rokasgrāmatas. Šajā praktiskajā un tehniskajā rokasgrāmatā mēs apskatīsim visu nepieciešamo, lai precīzi noregulētu rīku komplektu, draiverus un verifikācijas rīkus gan vietējā Windows vidē, gan WSL. Mērķis ir iegūt funkcionējošu un pārbaudītu instalāciju., gatavs paātrināt jūsu GPU darbplūsmas.
Papildus klasiskajām darbībām mēs apskatīsim Visual Studio saderību, kluso instalēšanu, Conda pakotnes un NVIDIA Wheels, verifikāciju ar CUDA piemēriem, WSL īpatnības un galvenās laidiena piezīmes (piemēram, draivera noņemšanu no instalētāja CUDA 13). Jūs arī uzzināsiet, kā diagnosticēt bieži sastopamas problēmas. (ieskaitot reālu gadījumu ar Lenovo Ideapad un 526.56 draiveriem) un īpašas prasības konkrētiem scenārijiem, piemēram, Model Builder ar CUDA 10.1 un cuDNN 7.6.4.
Kas ir CUDA?
CUDA ir NVIDIA paralēlās programmēšanas platforma un modelis, kas ļauj paātrināt skaitļošanas ziņā ietilpīgu lietojumprogrammu darbību GPU. Ar CUDA C/C++ un tā paplašinājumiem Jūs varat koncentrēties uz algoritma paralēlošanu, kamēr CUDA izpildlaiks pārvalda izpildi un atmiņu starp centrālo procesoru (CPU) un grafisko procesoru (GPU). Sadalot seriālo (CPU) un paralēlo (GPU) darbu, Ir iespējams palielināt veiktspēju, izmantojot tūkstošiem pavedienu un koplietota mikroshēmas atmiņa.
Šajā rokasgrāmatā galvenā uzmanība pievērsta tam, kā precīzi noregulēt vidi operētājsistēmā Windows (gan vietējā, gan WSL), instalēt rīkkopu, apkopot piemērus un pārbaudīt, vai sistēma pareizi nosaka GPU. Verifikācija ar paraugiem, piemēram, deviceQuery un bandwidthTest Tas ir kritisks elements, kas bieži tiek ignorēts un kuru mēs šeit īpaši aplūkojam.

Sistēmas prasības un atbalstītās Windows versijas
Lai izmantotu CUDA, nepieciešams saderīgs NVIDIA GPU un atbalstīta Windows operētājsistēma. Atbalstītās operētājsistēmas versijas ietverWindows 11 24H2, 23H2 un 22H2-SV2; Windows 10 22H2; Windows Server 2022 un Windows Server 2025. Ierīču pārvaldniekā pārbaudiet, vai jūsu karte ir redzama sadaļā Displeja adapteri, un pārbaudiet tās saderību oficiālajā CUDA saderīgo GPU sarakstā (NVIDIA lapa).
Kompilatora līmenī rīkkopa atbalsta MSVC 193x programmā Visual Studio 2022 17.x (C++11/14/17/20) un MSVC 192x programmā Visual Studio 2019 16.x (C++11/14/17). Visual Studio 2015 atbalsts tika pārtraukts versijā 11.1.VS 2017 versijā tā tika novecojusi 12.5 versijā un noņemta 13.0 versijā. Ņemiet vērā, ka 32 bitu kompilācija tika noņemta, sākot ar CUDA 12.0 (vietējā un krustkompilācija); ja jums ir nepieciešama 32 bitu versija, jums būs jāizmanto vecāki rīkkopa.
Lai gan NVIDIA draiveris turpinās atļaut 32 bitu bināros failus darbināt GeForce GPU līdz pat Ada arhitektūrai, Ada būs pēdējā ar šādu atbalstu.Hopper vairs neatbalsta 32 bitu lietojumprogrammas. Tas ir ļoti svarīgi, ja ražošanas vidē uzturat mantotu programmatūru un jums ir jāplāno jauninājumi.
Operētājsistēmā Windows 10 un jaunākās versijās NVIDIA draiveris var darboties divos modeļos: WDDM (displeja ierīcēm) un TCC (Tesla Compute Cluster) GPU bez video izejas, piemēram, Tesla vai noteiktiem Titan modeļiem. Ar nvidia-smi Varat pārbaudīt pašreizējo režīmu un, ja tas tiek atbalstīts, pārslēgties starp tiem. Galddatoros ar spēļu grafiskajām kartēm WDDM būs norma; darbstacijās ar skaitļošanas kartēm TCC parasti ir iespējots pēc noklusējuma..
Rīkkopa instalēšana operētājsistēmā Windows: soli pa solim
- Pārliecinieties, vai jums ir CUDA saderīga grafiskā karte un atbalstīta Windows versija.Ierīču pārvaldniekā (Displeja adapteri) varat redzēt ražotāju un modeli.
- Lejupielādējiet NVIDIA CUDA rīkkopu no oficiālās lejupielāžu lapas. Jums ir pieejami divi formāti: tīkla instalētājs (lejupielādē tikai to, kas ir atlasīts instalēšanas laikā) un pilnais instalētājs (ietver visus komponentus, noderīgs bezsaistē vai uzņēmuma izvietošanai).
- Palaidiet instalētāju un izpildiet grafiskā vedņa norādījumus. lai instalētu Toolkit, piemērus un integrāciju ar Visual Studio, ja nepieciešams.
- Automatizētās instalācijās varat izmantot klusuma režīmu ar
-sun pievienojiet parametrus, lai izvēlētos konkrētas apakšpakotnes. Karodziņš-nJa nepieciešams, izvairieties no automātiskas restartēšanas. - Pabeigt un restartēt ja tiek pieprasīts.
- Atveriet komandu uzvedni un palaidiet
nvcc -Vlai redzētu instalēto CUDA kompilatora versiju.
Klusā instalēšana un rīkkopas apakšpakotnes
Instalētājs ļauj izvietot noteiktus rīkkopa komponentus, kas ir noderīgi pārvaldītās vai CI vidēs. Dažas reprezentatīvas apakšpakotnes CUDA 13.0 versijā (noklusējuma ceļš C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v13.0) ir:
- cublas_13.0 / cublas_dev_13.0: cuBLAS izpildlaika bibliotēkas.
- crt_13.0: kompilators CUDA lietojumprogrammām.
- ctadvisor_13.0NVCC/NVRTC izsekošanas analīze, lai samazinātu kompilācijas laiku.
- cuda_profiler_api_13.0 y cuadrt_13.0CUDA profilētājs un izpildlaika API.
- cufft_13.0 / cufft_dev_13.0: aproce.
- cuobjdump_13.0 y nvdisasm_13.0: komunālie pakalpojumi kabīnu pārbaudei.
- cupti_13.0profilēšanas rīku saskarne.
- curand_13.0 / curand_dev_13.0: KURANDS.
- cusolver_13.0 / cusolver_dev_13.0 y cusparse_13.0 / cusparse_dev_13.0: lineārās algebras bibliotēkas.
- cuxxfilt_13.0: demangler cu++ filtrs.
- dokumentācija_13.0HTML un PDF ceļveži (programmēšana, labākā prakse utt.).
- nsight_compute_13.0, nsight_systems_13.0 y nsight_vse_13.0Nsight rīki.
- npp_13.0 / npp_dev_13.0AES.
- nvcc_13.0CUDA kompilators.
- nvfatbin_13.0, nvjitlink_13.0, nvtx_13.0, nvm_13.0, nvptxcompiler_13.0: rīku ķēdes rīki/bibliotēkas un trases.
- nvjpeg_13.0 / nvjpeg_dev_13.0: nvJPEG.
- nvml_dev_13.0NVML galvenes un bibliotēkas.
- nvprune_13.0: objektu/statiskās informācijas apgriešana pēc ierīču mērķiem.
- noslogotības_kalkulators_13.0: aizņemtības izklājlapa.
- opencl_13.0OpenCL bibliotēka.
- dezinfekcijas līdzeklis_13.0Datoru dezinfekcijas API.
- vilces_13.0 y vizuālās_studijas_integrācija_13.0Vilces spēks un integrācija VS.
Ja pirms instalēšanas ir jāpārbauda saturs, pilno instalētāju var izvilkt, izmantojot ar LZMA saderīgu rīku (piemēram, 7-Zip). Toolkit faili atrodas mapē CUDAToolkit Pēc failu izvilkšanas tajos atradīsiet .dll un .nvi failus, kurus varat ignorēt, ja vēlaties tikai pārskatīt instalācijas koku. Atinstalēšanu var veikt, izmantojot vadības paneli > programmas un funkcijas.
Uzstādīšana ar pip (NVIDIA Wheels)
Python centrētām vidēm NVIDIA piedāvā Wheels, kas instalē CUDA izpildlaiku un bibliotēkas, izmantojot pip. Šīs pakotnes ir paredzētas lietošanai izpildlaikā. un neietver izstrādes rīkus (tos var instalēt atsevišķi, ja nepieciešams). Piezīme: CUDA vide tiek pārvaldīta pip vidē, tāpēc, ja plānojat izmantot CUDA ārpus tās, jums būs jāpielāgo resursdatora vide.
Vispirms instalējiet nvidia-pyindex lai pip varētu atrisināt moduļus no NVIDIA NGC repozitorija. Ja nepieciešams, atjaunināt pip un setuptools lai izvairītos no turpmākām kļūdām. Varat arī pievienot rindiņu ar nvidia-pyindex tev requirements.txt ja jūs strādājat ar šo konvenciju.
Uzstādīšanas pārbaude: paraugi un testi
Pārbaudiet kompilatora versiju ar nvcc -V no CMD. Klonējiet CUDA paraugus no github.com/nvidia/cuda-samplesKompilējiet un palaidiet tos, kā norādīts repozitorijā. Ir ļoti ieteicams kompilēt un palaist deviceQuery lai apstiprinātu, ka GPU ir noteikts un konfigurācija ir pareiza.
Pārbaude bandwidthTest validē resursdatora un ierīces veiktspēju un komunikāciju. Abos gadījumos svarīgi ir tas, ka ierīce parādās.Tas atbilst jūsu aparatūrai un iztur testus. Ja deviceQuery GPU nav atrasts, pārbaudiet draivera instalāciju un to, vai ierīce darbojas sistēmā.
CUDA un WSL operētājsistēmās Windows 11 un Windows 10 21H2+
Windows 11 un jaunākās Windows 10 versijas (21H2 un jaunākas) atbalsta GPU paātrinātu mašīnmācīšanās rīku palaišanu, izmantojot WSL. Jūs varēsiet izmantot TensorFlow, PyTorch, Docker un NVIDIA Container Toolkit. glibc balstītā Linux distro ietvaros (Ubuntu, Debian utt.).
Galvenās darbības: instalējiet NVIDIA CUDA iespējotu draiveri WSL, iespējojiet WSL un pievienojiet Ubuntu/Debian tipa izplatījumu. Pārliecinieties, vai jums ir jaunākā WSL kodola versija. (vismaz 5.10.43.3). To var pārbaudīt programmā PowerShell, izmantojot: wsl cat /proc/versionPēc tam izpildiet NVIDIA CUDA lietotāja rokasgrāmatu WSL vidē, lai strādātu ar NVIDIA Docker vai instalētu PyTorch/TensorFlow attiecīgajā distro.
Pārbaudes un diagnostika operētājsistēmā Windows
Lai uzzinātu, kāda veida grafiskā karte jums ir: sadaļā Iestatījumi > Sistēma > Displejs > Papildu iestatījumi, zīmolu un modeli atradīsiet sadaļā “Displeja informācija”. Uzdevumu pārvaldniekā, cilnē VeiktspējaAtlasiet GPU, lai skatītu lietojumu, modeli un atmiņu. Ja tas neparādās, pārbaudiet Ierīču pārvaldnieku > Displeja adapteri un instalējiet atbilstošo draiveri kartei.
Lai redzētu draivera "ziņoto" CUDA versiju, palaidiet nvidia-smi. Lai uzzinātu instalētā Toolkit kompilatora versiju, lieto nvcc --version. Paturiet to prātā nvidia-smi Tas parāda maksimālo draivera atbalstīto CUDA “API” versiju, nevis to no rīkkopa, kas atrodas diskā.
Mākoņa izmantošana: instanču piemērs ar GPU
Ja nepieciešama jauda pēc pieprasījuma, mākoņpakalpojumu sniedzēji piedāvā instances ar tādām grafiskajām kartēm kā NVIDIA A100, RTX 4090 vai A6000. Šī pieeja nodrošina samaksu par lietošanu, gandrīz tūlītēju izvietošanu un gatavas veidnes. populāriem ietvariem (PyTorch, TensorFlow). Lielām darba slodzēm vai īslaicīgiem slodzes pieaugumiem tā ir efektīva alternatīva, kas neprasa ieguldījumus patentētā aparatūrā un nodrošina atbalstu jaunākajām CUDA versijām.
Juridiskie paziņojumi un preču zīmes
NVIDIA dokumentācija un programmatūra tiek nodrošināta “tādā stāvoklī, kādā tā ir”, paturot visas tiesības un bez jebkādām netiešām garantijām par piemērotību pārdošanai vai piemērotību noteiktam mērķim. NVIDIA var mainīt specifikācijas un dokumentus bez iepriekšēja brīdinājuma.Vienmēr pārbaudiet jaunāko informāciju un ievērojiet trešo pušu pārdošanas un licencēšanas noteikumus. OpenCL ir Apple Inc. preču zīme, kas licencēta Khronos; NVIDIA un tās logotips ir reģistrētas preču zīmes ASV un citās valstīs.
Ar visu iepriekš minēto jums tagad ir nepieciešamās daļas CUDA instalēšanai, konfigurēšanai un validēšanai operētājsistēmā Windows (un arī WSL vai Linux, kad tas ir nepieciešams). No prasībām un draiveriem līdz integrācijai ar Visual Studio un verifikācijai ar paraugiemGalvenais ir saskaņot draivera versiju, rīku komplektu un vidi, kā arī paļauties uz tādiem rīkiem kā nvidia-smi, nvcc un paraugus, lai apstiprinātu, ka visa ķēde darbojas, kā paredzēts.