Vous n'êtes pas identifié(e).
L'icône rouge permet de télécharger chaque page du wiki visitée au format PDF et la grise au format ODT →
Ci-dessous, les différences entre deux révisions de la page.
Les deux révisions précédentes Révision précédente Prochaine révision | Révision précédente | ||
atelier:chantier:opencl-avec-amd [20/02/2021 15:29] Debian Alain [Script git] |
atelier:chantier:opencl-avec-amd [26/06/2022 11:22] (Version actuelle) Debian Alain [Préambule] |
||
---|---|---|---|
Ligne 3: | Ligne 3: | ||
* Objet : installer openCL sur debian carte AMD | * Objet : installer openCL sur debian carte AMD | ||
* Niveau requis : <del>débutant</del> avisé | * Niveau requis : <del>débutant</del> avisé | ||
- | * Commentaires : //openCL pour carte AMD Radeon RX 5xx et BLENDER 2.82a sur DEBIAN TESTING BULLSEYE // | + | * Commentaires : //openCL pour carte AMD Radeon RX 5xx / RX 6xxx et BLENDER 2.82a /2.93.4 sur DEBIAN TESTING BULLSEYE / DEBIAN BOOKWORM-SID // |
* Débutant, à savoir : [[:doc:systeme:commandes:le_debianiste_qui_papillonne|Utiliser GNU/Linux en ligne de commande, tout commence là !.]] :-) | * Débutant, à savoir : [[:doc:systeme:commandes:le_debianiste_qui_papillonne|Utiliser GNU/Linux en ligne de commande, tout commence là !.]] :-) | ||
* Suivi : {{tag>en-chantier à-tester à-placer}} - FIXME Pour choisir, voir les autres Tags possibles dans [[:atelier:#tags|l'Atelier]]. | * Suivi : {{tag>en-chantier à-tester à-placer}} - FIXME Pour choisir, voir les autres Tags possibles dans [[:atelier:#tags|l'Atelier]]. | ||
Ligne 17: | Ligne 17: | ||
===== Introduction ===== | ===== Introduction ===== | ||
- | Ce petit tuto reprend les étapes d'installation du pilote openCL sur ce matériel et système : | + | Ce petit tuto reprend les étapes d'installation du pilote openCL sur ces matériels et système : |
- | * carte AMD (RX 550 4GB et | + | * carte AMD RX 550 4GB |
- | * RX 570 ITX 8GB) | + | * carte AMD RX 570 8GB ITX |
- | le tout , fait sur linux [[doc:systeme:apt:sources.list:testing|debian testing bullseye]] et avec | + | * carte AMD RX 6800 16GB |
- | * X.org GNOME 3.34.2 et 3.36.2 | + | * carte AMD RX 6900 XT 16GB |
- | * blender 2.82a et | + | le tout , fait sur linux [[doc:systeme:apt:sources.list:testing|debian testing bullseye]] / debian bookworm sid et avec |
- | * processeur AMD RYZEN 7 1700 X | + | * X.org GNOME 3.34.2 , 3.36.2 , 40.4 , 41.1 et 42.1 |
+ | * Blender 2.82a , 2.93.4 , 2.93.5 et 3.1.2. | ||
+ | * Darktable 3.6.1-1 | ||
+ | * processeur AMD RYZEN 7 1700 X et AMD RYZEN 9 3900 X | ||
Un grand merci à **PLOP6** via ([[doc:reseau:freenode|irc]]) sans qui rien de ce tuto n'aurait été possible. | Un grand merci à **PLOP6** via ([[doc:reseau:freenode|irc]]) sans qui rien de ce tuto n'aurait été possible. | ||
Ligne 55: | Ligne 58: | ||
<code user>cd ~/Téléchargements/</code> | <code user>cd ~/Téléchargements/</code> | ||
- | === Téléchargement de l'archive du pilote amdgpu-pro === | + | ==== Téléchargement de l'archive du pilote amdgpu-pro ==== |
- | - Soit : (version 19.50 pour ubuntu 18.04 LTS) :<code user>wget --referer=https://www.amd.com/ -P $HOME/Téléchargements/ https://drivers.amd.com/drivers/linux/19.50/amdgpu-pro-19.50-967956-ubuntu-18.04.tar.xz</code> | + | - Soit : (version 19.50 pour ubuntu 18.04 LTS , RX 500) :<code user>wget --referer=https://www.amd.com/ -P $HOME/Téléchargements/ https://drivers.amd.com/drivers/linux/19.50/amdgpu-pro-19.50-967956-ubuntu-18.04.tar.xz</code> |
- | - Soit : (version 20.10 pour ubuntu 18.04 LTS) :<code user> wget --referer=https://www.amd.com/ -P $HOME/Téléchargements/ https://drivers.amd.com/drivers/linux/amdgpu-pro-20.10-1048554-ubuntu-18.04.tar.xz</code> | + | - Soit : (version 20.10 pour ubuntu 18.04 LTS , RX 500) :<code user> wget --referer=https://www.amd.com/ -P $HOME/Téléchargements/ https://drivers.amd.com/drivers/linux/amdgpu-pro-20.10-1048554-ubuntu-18.04.tar.xz</code> |
+ | - Soit : (version 21.30 pour ubuntu 20.04.3 LTS , RX 6000) :<code user> wget --referer=https://www.amd.com/ -P $HOME/Téléchargements/ https://drivers.amd.com/drivers/linux/amdgpu-pro-21.30-1290604-ubuntu-20.04.tar.xz</code> | ||
Au cas où ces liens ne fonctionnent pas, vous pouvez vous connecter en graphique là : | Au cas où ces liens ne fonctionnent pas, vous pouvez vous connecter en graphique là : | ||
Ligne 64: | Ligne 68: | ||
* Ou en manuel : \\ https://www.amd.com/fr/support/graphics/radeon-500-series/radeon-rx-500-series/radeon-rx-550 | * Ou en manuel : \\ https://www.amd.com/fr/support/graphics/radeon-500-series/radeon-rx-500-series/radeon-rx-550 | ||
* Ou encore là : \\ https://www.amd.com/fr/support/graphics/radeon-500-series/radeon-rx-500-series/radeon-rx-570 | * Ou encore là : \\ https://www.amd.com/fr/support/graphics/radeon-500-series/radeon-rx-500-series/radeon-rx-570 | ||
+ | * voire , ici : \\ https://www.amd.com/fr/support/graphics/amd-radeon-6000-series/amd-radeon-6800-series/amd-radeon-rx-6800 | ||
- Cherchez la ligne <code>+ Ubuntu X86 64-bit</code>et trouvez la case ''Téléchargement'' sur laquelle vous cliquez. | - Cherchez la ligne <code>+ Ubuntu X86 64-bit</code>et trouvez la case ''Téléchargement'' sur laquelle vous cliquez. | ||
- Vous téléchargez ensuite l'archive dans le répertoire ''~/Téléchargements'' de votre Debian. | - Vous téléchargez ensuite l'archive dans le répertoire ''~/Téléchargements'' de votre Debian. | ||
+ | |||
+ | <note>AMD procède actuellement à une restructuration de ses pilotes . | ||
+ | les archives sont devenues particulièrement pénibles à trouver . | ||
+ | il faut désormais passer par un fichier *.deb qui installe des sources dans /etc/apt/sources.list.d/ | ||
+ | les quelles sources sont à peu près utilisables sous ubuntu mais pas encore sous debian (non fonctionnelles pour l'instant) . | ||
+ | un travail conjoint semble être en cours entre AMD et Debian pour pouvoir enfin installer OpenCL ROCm (sur Debian) . | ||
+ | par ailleurs , vous remarquerez que toutes les archives sont passées en 21.30 (RX6000) , même pour les RX500(vieilles cartes) . | ||
+ | |||
+ | Pour les RX 500 , les pilotes OpenCL sont normalement fonctionnels sur debian 10 (buster, sûr) et 11 (bullseye , normalement) . Mais je vous conseille plutôt d'utiliser les derniers pilotes OpenCL (RX6000). | ||
+ | </note> | ||
<note tip>[[doc:systeme:sudo|sudo]] a l'avantage de passer des commandes root tout en restant user</note> | <note tip>[[doc:systeme:sudo|sudo]] a l'avantage de passer des commandes root tout en restant user</note> | ||
Ligne 73: | Ligne 88: | ||
- installer aussi clinfo et mesa-utils :<code user>sudo apt install clinfo mesa-utils </code> | - installer aussi clinfo et mesa-utils :<code user>sudo apt install clinfo mesa-utils </code> | ||
- | ==== Scripts ==== | + | ==== Scripts (RX 500) ==== |
Créer les scripts suivants : | Créer les scripts suivants : | ||
Ligne 161: | Ligne 176: | ||
<note important>Une fois les scripts copiés/collés, enregistrés, pour pouvoir les utiliser en user((utilisateur)), n'oubliez pas de modifier les droits d'utilisations des scripts((actuellement réservés à root)) avec la commande [[doc:systeme:chmod|chmod]].</note> | <note important>Une fois les scripts copiés/collés, enregistrés, pour pouvoir les utiliser en user((utilisateur)), n'oubliez pas de modifier les droits d'utilisations des scripts((actuellement réservés à root)) avec la commande [[doc:systeme:chmod|chmod]].</note> | ||
+ | ==== Télécharger les scripts (mon Google Drive) ==== | ||
+ | <code user>firefox https://drive.google.com/file/d/1jjH6TviDG0Yje-qAeHyvI78d_IeIPpMi/view?usp=sharing </code> | ||
+ | <code user>firefox https://drive.google.com/file/d/1J9MYmjxYpI9-MS9IRRcKTGGleBSVLPtg/view?usp=sharing </code> | ||
+ | <code user>firefox https://drive.google.com/file/d/11FWH7hDB3EYN3NN_MprdzpCyskl2Alxv/view?usp=sharing </code> | ||
+ | <code user>firefox https://drive.google.com/file/d/1ZiOWEEBBxgs9q2OLzfgIuebkxxwMcGH0/view?usp=sharing </code> | ||
+ | <code user>firefox https://drive.google.com/file/d/1ddBtZC5ZE3t_b-U1k4H7rbNrFUxn1_sH/view?usp=sharing </code> | ||
==== Autorisation des scripts (les rendre exécutables) ==== | ==== Autorisation des scripts (les rendre exécutables) ==== | ||
Ligne 192: | Ligne 213: | ||
un script git qui télécharge amdgpu-pro et installe OpenCL et Vulkan . | un script git qui télécharge amdgpu-pro et installe OpenCL et Vulkan . | ||
- | (actuellement la version 20.45 du 17/12/2020 pour ubuntu 20.04.1 LTS . | + | actuellement la version 21.30 du 04/08/2021 pour ubuntu 20.04.3 LTS . |
- | ne fonctionne pas pour RX 5000 ET RX 6000 , uniquement RX 500) | + | fonctionne, en théorie , pour RX 5000 ET RX 6000 . |
+ | prise en charge du noyau 5.11 . | ||
+ | |||
+ | maintenant fonctionnel sur debian sid . (noyau 5.15.6 kernel.org) | ||
+ | |||
+ | [[https://github.com/kytulendu| -- site github de kytulendu -- ]] | ||
[[https://gist.github.com/kytulendu/3351b5d0b4f947e19df36b1ea3c95cbe| -- script git -- ]] | [[https://gist.github.com/kytulendu/3351b5d0b4f947e19df36b1ea3c95cbe| -- script git -- ]] | ||
Ligne 201: | Ligne 227: | ||
<note tip> installer "git" au préalable | <note tip> installer "git" au préalable | ||
<code user>sudo apt install --reinstall git </code></note> | <code user>sudo apt install --reinstall git </code></note> | ||
+ | |||
+ | <note tip> merci à kytulendu </note> | ||
+ | |||
+ | ==== télécharger les scripts git ==== | ||
+ | <code user>firefox https://drive.google.com/file/d/1yJA2dej3A2Vda8cy1GlaAWXKkFqlXrl4/view?usp=sharing</code> | ||
+ | |||
+ | <code user>firefox https://drive.google.com/file/d/1tElemvFCCjWh8S1nXlgBhbQY_Y0QPaRT/view?usp=sharing</code> | ||
+ | |||
+ | |||
+ | ===== Commande AMD (archive) ===== | ||
+ | |||
+ | Télécharger l'archive 21.30 | ||
+ | <code user> wget --referer=https://www.amd.com/ -P $HOME/Téléchargements/ https://drivers.amd.com/drivers/linux/amdgpu-pro-21.30-1290604-ubuntu-20.04.tar.xz</code> | ||
+ | |||
+ | se placer dans le bon répertoire : | ||
+ | <code user>cd ~/Téléchargements/ </code> | ||
+ | |||
+ | décompacter l'archive : | ||
+ | <code user>tar -xJf amdgpu-pro-21.30-1290604-ubuntu-20.04.tar.xz </code> | ||
+ | |||
+ | se placer dans le bon dossier : | ||
+ | <code user>cd ~/Téléchargements/amdgpu-pro-21.30-1290604-ubuntu-20.04 </code> | ||
+ | |||
+ | appliquer la commande : | ||
+ | [[https://community.amd.com/t5/drivers-software/opencl-linux-debian-bullseye-sid/m-p/441901#M138183|mon fil sur AMD]] | ||
+ | <code user>sudo ./amdgpu-install --opencl=legacy --headless --no-dkms </code> | ||
+ | <note>merci roesjka mais selon les derniers développements , cette commande installe le pilote legacy . | ||
+ | |||
+ | donc , à priori , pour les générations "vega" et "pré - vega" . </note> | ||
+ | |||
+ | [[https://community.amd.com/t5/drivers-software/install-drivers-21-30-to-get-opencl-rocr-support-on-ubuntu-20-04/m-p/492118| lien deepdelirum ]] | ||
+ | <code user>sudo ./amdgpu-install --opencl=rocr --headless</code> | ||
+ | vous pourrez obtenir ceci (malheureusement) : | ||
+ | <code>Des erreurs ont été rencontrées pendant l'exécution : | ||
+ | amdgpu-dkms | ||
+ | amdgpu-pro-rocr-opencl | ||
+ | E: Sub-process /usr/bin/dpkg returned an error code (1)</code> | ||
+ | |||
+ | une autre commande | ||
+ | vérifier l'installation : | ||
+ | <code user>clinfo </code> | ||
+ | |||
+ | pour désinstaller : | ||
+ | <code user>sudo amdgpu-uninstall </code> | ||
+ | ===== Commande AMD (sources) ===== | ||
+ | |||
+ | AMD vient de créer une archive au format DEB . | ||
+ | à tester : | ||
+ | |||
+ | <code user> wget --referer=https://www.amd.com/ -P $HOME/Téléchargements/ https://repo.radeon.com/amdgpu-install/22.10.2/ubuntu/focal/amdgpu-install_22.10.2.50102-1_all.deb </code> | ||
+ | |||
+ | archive 22.10.2 , en théorie pour AMD RX 6000 . a vérifier . | ||
+ | |||
+ | aux dernières nouvelles , sur ma config , installe le dépôt AMD (ubuntu). | ||
+ | |||
+ | [[https://amdgpu-install.readthedocs.io/en/latest/|La Documentation officielle A.M.D. (AMDGPU) ]] | ||
+ | |||
+ | [[https://rocmdocs.amd.com/en/latest/Current_Release_Notes/Current-Release-Notes.html|La Documentation officielle A.M.D. (Rocm) ]] | ||
+ | |||
+ | ce paquet deb installe le sources suivant : | ||
+ | |||
+ | <file apt_sources amdgpu-proprietary.list> | ||
+ | # Enabling this repository requires acceptance of the following license: | ||
+ | # /usr/share/amdgpu-install/AMDGPUPROEULA | ||
+ | #deb https://repo.radeon.com/amdgpu/22.10.2/ubuntu bionic proprietary | ||
+ | </file> | ||
+ | |||
+ | <code user>amdgpu-install --opencl=rocr --no-dkms</code> | ||
+ | <code>Lecture des listes de paquets... Fait | ||
+ | Construction de l'arbre des dépendances... Fait | ||
+ | Lecture des informations d'état... Fait | ||
+ | E: Impossible de trouver le paquet amdgpu-lib | ||
+ | E: Impossible de trouver le paquet amdgpu-lib32 | ||
+ | E: Impossible de trouver le paquet rocm-hip-runtime | ||
+ | E: Impossible de trouver le paquet rocm-opencl-runtime | ||
+ | </code> | ||
+ | |||
+ | |||
===== Utilisation ===== | ===== Utilisation ===== | ||
Ligne 212: | Ligne 316: | ||
un grand merci à plop6 (irc) sans qui rien n'aurai été possible ... | un grand merci à plop6 (irc) sans qui rien n'aurai été possible ... | ||
+ | |||
+ | Blender , depuis la version 3.1.2 , n'est plus disponible que en deb(défectueux sur ma distribution) , | ||
+ | en flatpak (que j'ai utilisé) ou en snap . voire dans la logithèque . | ||
+ | |||
+ | qui plus est , il n'utilise plus openCL (depuis la version 3.0) mais le pilote habituel , openGL . | ||
+ | Désormais , ne sont disponibles dans Blender que les options CUDA et Optix . | ||
+ | |||
+ | [[https://docs.nvidia.com/cuda/cuda-installation-guide-linux/index.html|-- Nvidia CUDA -- ]] | ||
+ | |||
+ | [[https://en.wikipedia.org/wiki/OptiX|-- Nvidia Optix -- ]] | ||
+ | |||
+ | Actuellement , pour tester openCL , je recommande plutôt l'utilisation de Darktable . | ||
+ | ses réglages permettent d'activer openCL s'il est présent dans le systeme . | ||
+ | |||
+ | |||
===== Post Scriptum ===== | ===== Post Scriptum ===== | ||
la carte (RX 550) est montée en pointe , à 75 °C , au maxi une conso de 22 watts et un ventilo de 1300 RPM . | la carte (RX 550) est montée en pointe , à 75 °C , au maxi une conso de 22 watts et un ventilo de 1300 RPM . | ||
+ | |||
la RX 570 , elle , est montée , en pointe à 66 °C , conso maxi 100 watts et un ventilo à 1900 Tr/Min . | la RX 570 , elle , est montée , en pointe à 66 °C , conso maxi 100 watts et un ventilo à 1900 Tr/Min . | ||
+ | |||
+ | la RX 6800 est montée , en pointe , à 71 °C . conso maxi environ 220 watts . | ||
voici quelques écrans que vous obtiendrez peut être à la fin de l'installation : | voici quelques écrans que vous obtiendrez peut être à la fin de l'installation : | ||
- | tests fait avec la version 19.50 . | + | tests fait avec les versions : |
+ | |||
+ | -19.50 (RX 550) , | ||
+ | |||
+ | -20.10 (RX 570) et | ||
- | la version 20.10 donne le même résultat . | + | -21.30 (RX 6800) |
- | (légèrement updaté) | + | |
==== AMD RX 550 4GB DDR5 ==== | ==== AMD RX 550 4GB DDR5 ==== | ||
Ligne 619: | Ligne 744: | ||
</code> | </code> | ||
- | ==== pilote 20.10 CL Info ==== | + | ==== AMD RX 6800 16GB GDDR6 ==== |
- | <code user>clinfo</code> | + | lspci -nnkd::0300 |
- | <code>Number of platforms 1 | + | <code user>0a:00.0 VGA compatible controller [0300]: Advanced Micro Devices, Inc. [AMD/ATI] Navi 21 [Radeon RX 6800/6800 XT / 6900 XT] [1002:73bf] (rev c3) |
+ | Subsystem: Sapphire Technology Limited Navi 21 [Radeon RX 6800/6800 XT / 6900 XT] [1da2:e437] | ||
+ | Kernel driver in use: amdgpu | ||
+ | Kernel modules: amdgpu | ||
+ | </code> | ||
+ | |||
+ | glxinfo -B | ||
+ | <code user>name of display: :0 | ||
+ | display: :0 screen: 0 | ||
+ | direct rendering: Yes | ||
+ | Extended renderer info (GLX_MESA_query_renderer): | ||
+ | Vendor: AMD (0x1002) | ||
+ | Device: AMD Radeon RX 6800 (SIENNA_CICHLID, DRM 3.42.0, 5.14.0-3-amd64, LLVM 12.0.1) (0x73bf) | ||
+ | Version: 21.2.4 | ||
+ | Accelerated: yes | ||
+ | Video memory: 16384MB | ||
+ | Unified memory: no | ||
+ | Preferred profile: core (0x1) | ||
+ | Max core profile version: 4.6 | ||
+ | Max compat profile version: 4.6 | ||
+ | Max GLES1 profile version: 1.1 | ||
+ | Max GLES[23] profile version: 3.2 | ||
+ | Memory info (GL_ATI_meminfo): | ||
+ | VBO free memory - total: 15158 MB, largest block: 15158 MB | ||
+ | VBO free aux. memory - total: 16286 MB, largest block: 16286 MB | ||
+ | Texture free memory - total: 15158 MB, largest block: 15158 MB | ||
+ | Texture free aux. memory - total: 16286 MB, largest block: 16286 MB | ||
+ | Renderbuffer free memory - total: 15158 MB, largest block: 15158 MB | ||
+ | Renderbuffer free aux. memory - total: 16286 MB, largest block: 16286 MB | ||
+ | Memory info (GL_NVX_gpu_memory_info): | ||
+ | Dedicated video memory: 16384 MB | ||
+ | Total available memory: 32752 MB | ||
+ | Currently available dedicated video memory: 15158 MB | ||
+ | OpenGL vendor string: AMD | ||
+ | OpenGL renderer string: AMD Radeon RX 6800 (SIENNA_CICHLID, DRM 3.42.0, 5.14.0-3-amd64, LLVM 12.0.1) | ||
+ | OpenGL core profile version string: 4.6 (Core Profile) Mesa 21.2.4 | ||
+ | OpenGL core profile shading language version string: 4.60 | ||
+ | OpenGL core profile context flags: (none) | ||
+ | OpenGL core profile profile mask: core profile | ||
+ | |||
+ | OpenGL version string: 4.6 (Compatibility Profile) Mesa 21.2.4 | ||
+ | OpenGL shading language version string: 4.60 | ||
+ | OpenGL context flags: (none) | ||
+ | OpenGL profile mask: compatibility profile | ||
+ | |||
+ | OpenGL ES profile version string: OpenGL ES 3.2 Mesa 21.2.4 | ||
+ | OpenGL ES profile shading language version string: OpenGL ES GLSL ES 3.20 | ||
+ | </code> | ||
+ | |||
+ | OpenCL enfin prêt pour RX6000 (RX6800) noyau 5.15.6 minimum : | ||
+ | clinfo : | ||
+ | <code user>alain@sid:~$ clinfo | ||
+ | Number of platforms 1 | ||
Platform Name AMD Accelerated Parallel Processing | Platform Name AMD Accelerated Parallel Processing | ||
Platform Vendor Advanced Micro Devices, Inc. | Platform Vendor Advanced Micro Devices, Inc. | ||
- | Platform Version OpenCL 2.1 AMD-APP (3075.10) | + | Platform Version OpenCL 2.0 AMD-APP (3314.0) |
Platform Profile FULL_PROFILE | Platform Profile FULL_PROFILE | ||
- | Platform Extensions cl_khr_icd cl_amd_event_callback cl_amd_offline_devices | + | Platform Extensions cl_khr_icd cl_amd_event_callback |
- | Platform Host timer resolution 1ns | + | |
Platform Extensions function suffix AMD | Platform Extensions function suffix AMD | ||
Platform Name AMD Accelerated Parallel Processing | Platform Name AMD Accelerated Parallel Processing | ||
Number of devices 1 | Number of devices 1 | ||
- | Device Name Ellesmere | + | Device Name gfx1030 |
Device Vendor Advanced Micro Devices, Inc. | Device Vendor Advanced Micro Devices, Inc. | ||
Device Vendor ID 0x1002 | Device Vendor ID 0x1002 | ||
- | Device Version OpenCL 1.2 AMD-APP (3075.10) | + | Device Version OpenCL 2.0 |
- | Driver Version 3075.10 | + | Driver Version 3314.0 (HSA1.1,LC) |
- | Device OpenCL C Version OpenCL C 1.2 | + | Device OpenCL C Version OpenCL C 2.0 |
Device Type GPU | Device Type GPU | ||
- | Device Board Name (AMD) Radeon RX 570 Series | + | Device Board Name (AMD) Navi 21 [Radeon RX 6800/6800 XT / 6900 XT] |
- | Device Topology (AMD) PCI-E, 0b:00.0 | + | Device PCI-e ID (AMD) 0x73bf |
+ | Device Topology (AMD) PCI-E, 0000:0a:00.0 | ||
Device Profile FULL_PROFILE | Device Profile FULL_PROFILE | ||
Device Available Yes | Device Available Yes | ||
Compiler Available Yes | Compiler Available Yes | ||
Linker Available Yes | Linker Available Yes | ||
- | Max compute units 32 | + | Max compute units 30 |
SIMD per compute unit (AMD) 4 | SIMD per compute unit (AMD) 4 | ||
- | SIMD width (AMD) 16 | + | SIMD width (AMD) 32 |
SIMD instruction width (AMD) 1 | SIMD instruction width (AMD) 1 | ||
- | Max clock frequency 1244MHz | + | Max clock frequency 2475MHz |
- | Graphics IP (AMD) 8.0 | + | Graphics IP (AMD) 10.3 |
Device Partition (core) | Device Partition (core) | ||
- | Max number of sub-devices 32 | + | Max number of sub-devices 30 |
Supported partition types None | Supported partition types None | ||
Supported affinity domains (n/a) | Supported affinity domains (n/a) | ||
Ligne 660: | Ligne 837: | ||
Preferred work group size (AMD) 256 | Preferred work group size (AMD) 256 | ||
Max work group size (AMD) 1024 | Max work group size (AMD) 1024 | ||
- | Preferred work group size multiple 64 | + | Preferred work group size multiple (kernel) 32 |
- | Wavefront width (AMD) 64 | + | Wavefront width (AMD) 32 |
Preferred / native vector sizes | Preferred / native vector sizes | ||
char 4 / 4 | char 4 / 4 | ||
Ligne 679: | Ligne 856: | ||
Support is emulated in software No | Support is emulated in software No | ||
Single-precision Floating-point support (core) | Single-precision Floating-point support (core) | ||
- | Denormals No | + | Denormals Yes |
Infinity and NANs Yes | Infinity and NANs Yes | ||
Round to nearest Yes | Round to nearest Yes | ||
Ligne 696: | Ligne 873: | ||
Support is emulated in software No | Support is emulated in software No | ||
Address bits 64, Little-Endian | Address bits 64, Little-Endian | ||
- | Global memory size 8022630400 (7.472GiB) | + | Global memory size 17163091968 (15.98GiB) |
- | Global free memory (AMD) 7815016 (7.453GiB) | + | Global free memory (AMD) 16760832 (15.98GiB) 16760832 (15.98GiB) |
Global memory channels (AMD) 8 | Global memory channels (AMD) 8 | ||
- | Global memory banks per channel (AMD) 16 | + | Global memory banks per channel (AMD) 4 |
Global memory bank width (AMD) 256 bytes | Global memory bank width (AMD) 256 bytes | ||
Error Correction support No | Error Correction support No | ||
- | Max memory allocation 4244635648 (3.953GiB) | + | Max memory allocation 14588628168 (13.59GiB) |
Unified memory for Host and Device No | Unified memory for Host and Device No | ||
+ | Shared Virtual Memory (SVM) capabilities (core) | ||
+ | Coarse-grained buffer sharing Yes | ||
+ | Fine-grained buffer sharing Yes | ||
+ | Fine-grained system sharing No | ||
+ | Atomics No | ||
Minimum alignment for any data type 128 bytes | Minimum alignment for any data type 128 bytes | ||
- | Alignment of base address 2048 bits (256 bytes) | + | Alignment of base address 1024 bits (128 bytes) |
+ | Preferred alignment for atomics | ||
+ | SVM 0 bytes | ||
+ | Global 0 bytes | ||
+ | Local 0 bytes | ||
+ | Max size for global variable 14588628168 (13.59GiB) | ||
+ | Preferred total size of global vars 17163091968 (15.98GiB) | ||
Global Memory cache type Read/Write | Global Memory cache type Read/Write | ||
Global Memory cache size 16384 (16KiB) | Global Memory cache size 16384 (16KiB) | ||
Global Memory cache line size 64 bytes | Global Memory cache line size 64 bytes | ||
Image support Yes | Image support Yes | ||
- | Max number of samplers per kernel 16 | + | Max number of samplers per kernel 29631 |
Max size for 1D images from buffer 134217728 pixels | Max size for 1D images from buffer 134217728 pixels | ||
- | Max 1D or 2D image array size 2048 images | + | Max 1D or 2D image array size 8192 images |
Base address alignment for 2D image buffers 256 bytes | Base address alignment for 2D image buffers 256 bytes | ||
Pitch alignment for 2D image buffers 256 pixels | Pitch alignment for 2D image buffers 256 pixels | ||
Max 2D image size 16384x16384 pixels | Max 2D image size 16384x16384 pixels | ||
- | Max 3D image size 2048x2048x2048 pixels | + | Max 3D image size 16384x16384x8192 pixels |
Max number of read image args 128 | Max number of read image args 128 | ||
Max number of write image args 8 | Max number of write image args 8 | ||
+ | Max number of read/write image args 64 | ||
+ | Max number of pipe args 16 | ||
+ | Max active pipe reservations 16 | ||
+ | Max pipe packet size 1703726280 (1.587GiB) | ||
Local memory type Local | Local memory type Local | ||
- | Local memory size 32768 (32KiB) | + | Local memory size 65536 (64KiB) |
- | Local memory syze per CU (AMD) 65536 (64KiB) | + | Local memory size per CU (AMD) 65536 (64KiB) |
Local memory banks (AMD) 32 | Local memory banks (AMD) 32 | ||
Max number of constant args 8 | Max number of constant args 8 | ||
- | Max constant buffer size 4244635648 (3.953GiB) | + | Max constant buffer size 14588628168 (13.59GiB) |
Preferred constant buffer size (AMD) 16384 (16KiB) | Preferred constant buffer size (AMD) 16384 (16KiB) | ||
Max size of kernel argument 1024 | Max size of kernel argument 1024 | ||
- | Queue properties | + | Queue properties (on host) |
Out-of-order execution No | Out-of-order execution No | ||
Profiling Yes | Profiling Yes | ||
+ | Queue properties (on device) | ||
+ | Out-of-order execution Yes | ||
+ | Profiling Yes | ||
+ | Preferred size 262144 (256KiB) | ||
+ | Max size 8388608 (8MiB) | ||
+ | Max queues on device 1 | ||
+ | Max events on device 1024 | ||
Prefer user sync for interop Yes | Prefer user sync for interop Yes | ||
+ | Number of P2P devices (AMD) 0 | ||
Profiling timer resolution 1ns | Profiling timer resolution 1ns | ||
- | Profiling timer offset since Epoch (AMD) 1591853725436918849ns (Thu Jun 11 07:35:25 2020) | + | Profiling timer offset since Epoch (AMD) 0ns (Thu Jan 1 01:00:00 1970) |
Execution capabilities | Execution capabilities | ||
Run OpenCL kernels Yes | Run OpenCL kernels Yes | ||
Run native kernels No | Run native kernels No | ||
- | Thread trace supported (AMD) Yes | + | Thread trace supported (AMD) No |
- | Number of async queues (AMD) 2 | + | Number of async queues (AMD) 8 |
- | Max real-time compute queues (AMD) 0 | + | Max real-time compute queues (AMD) 8 |
- | Max real-time compute units (AMD) 909198854 | + | Max real-time compute units (AMD) 30 |
- | SPIR versions 1.2 | + | |
printf() buffer size 4194304 (4MiB) | printf() buffer size 4194304 (4MiB) | ||
Built-in kernels (n/a) | Built-in kernels (n/a) | ||
- | Device Extensions cl_khr_fp64 cl_amd_fp64 cl_khr_global_int32_base_atomics cl_khr_global_int32_extended_atomics cl_khr_local_int32_base_atomics cl_khr_local_int32_extended_atomics cl_khr_int64_base_atomics cl_khr_int64_extended_atomics cl_khr_3d_image_writes cl_khr_byte_addressable_store cl_khr_fp16 cl_khr_gl_sharing cl_amd_device_attribute_query cl_amd_vec3 cl_amd_printf cl_amd_media_ops cl_amd_media_ops2 cl_amd_popcnt cl_khr_image2d_from_buffer cl_khr_spir cl_khr_gl_event | + | Device Extensions cl_khr_fp64 cl_khr_global_int32_base_atomics cl_khr_global_int32_extended_atomics cl_khr_local_int32_base_atomics cl_khr_local_int32_extended_atomics cl_khr_int64_base_atomics cl_khr_int64_extended_atomics cl_khr_3d_image_writes cl_khr_byte_addressable_store cl_khr_fp16 cl_khr_gl_sharing cl_amd_device_attribute_query cl_amd_media_ops cl_amd_media_ops2 cl_khr_image2d_from_buffer cl_khr_subgroups cl_khr_depth_images cl_amd_copy_buffer_p2p cl_amd_assembly_program |
NULL platform behavior | NULL platform behavior | ||
- | clGetPlatformInfo(NULL, CL_PLATFORM_NAME, ...) No platform | + | clGetPlatformInfo(NULL, CL_PLATFORM_NAME, ...) AMD Accelerated Parallel Processing |
- | clGetDeviceIDs(NULL, CL_DEVICE_TYPE_ALL, ...) No platform | + | clGetDeviceIDs(NULL, CL_DEVICE_TYPE_ALL, ...) Success [AMD] |
- | clCreateContext(NULL, ...) [default] No platform | + | clCreateContext(NULL, ...) [default] Success [AMD] |
- | clCreateContext(NULL, ...) [other] Success [AMD] | + | |
clCreateContextFromType(NULL, CL_DEVICE_TYPE_DEFAULT) Success (1) | clCreateContextFromType(NULL, CL_DEVICE_TYPE_DEFAULT) Success (1) | ||
Platform Name AMD Accelerated Parallel Processing | Platform Name AMD Accelerated Parallel Processing | ||
- | Device Name Ellesmere | + | Device Name gfx1030 |
clCreateContextFromType(NULL, CL_DEVICE_TYPE_CPU) No devices found in platform | clCreateContextFromType(NULL, CL_DEVICE_TYPE_CPU) No devices found in platform | ||
clCreateContextFromType(NULL, CL_DEVICE_TYPE_GPU) Success (1) | clCreateContextFromType(NULL, CL_DEVICE_TYPE_GPU) Success (1) | ||
Platform Name AMD Accelerated Parallel Processing | Platform Name AMD Accelerated Parallel Processing | ||
- | Device Name Ellesmere | + | Device Name gfx1030 |
clCreateContextFromType(NULL, CL_DEVICE_TYPE_ACCELERATOR) No devices found in platform | clCreateContextFromType(NULL, CL_DEVICE_TYPE_ACCELERATOR) No devices found in platform | ||
clCreateContextFromType(NULL, CL_DEVICE_TYPE_CUSTOM) No devices found in platform | clCreateContextFromType(NULL, CL_DEVICE_TYPE_CUSTOM) No devices found in platform | ||
clCreateContextFromType(NULL, CL_DEVICE_TYPE_ALL) Success (1) | clCreateContextFromType(NULL, CL_DEVICE_TYPE_ALL) Success (1) | ||
Platform Name AMD Accelerated Parallel Processing | Platform Name AMD Accelerated Parallel Processing | ||
- | Device Name Ellesmere | + | Device Name gfx1030 |
- | </code> | + | |
+ | ICD loader properties | ||
+ | ICD loader Name OpenCL ICD Loader | ||
+ | ICD loader Vendor OCL Icd free software | ||
+ | ICD loader Version 2.2.14 | ||
+ | ICD loader Profile OpenCL 3.0 | ||
+ | </code> | ||
==== Solution Alternative ==== | ==== Solution Alternative ==== |