Cuda Visual Profiler

Un outil de CUDA utile de NVIDIA
Télécharger maintenant

Cuda Visual Profiler Classement & Résumé

Publicité

  • Rating:
  • Licence:
  • Freeware
  • Nom de l'éditeur:
  • Nvidia
  • Systèmes d'exploitation:
  • Windows XP / Vista / XP X64 / Vista64
  • Taille du fichier:
  • 5.6 MB

Cuda Visual Profiler Mots clés


Cuda Visual Profiler La description

CUDA de Visual Profiler est un outil dédié pour travailler avec les cartes GPU NVIDIA et avec la boîte à outils dédiée. Caractéristiques principales: Exécuter un programme CUDA avec Profilage activé et afficher la sortie de profileur comme une table. Le tableau présente les colonnes suivantes pour chaque méthode de GPU: Horodatage: horodatage de démarrage Méthode: nom de la méthode de GPU. Ceci est soit « memcopy » pour les copies de mémoire ou le nom d'un noyau GPU. Temps GPU temps CPU flux Id: Numéro d'identification pour le flux Colonnes uniquement pour les méthodes du noyau: Occupation compteurs de profils: gld uncoalesced: Nombre de charges de mémoire globale non coalescé GLD coalisée: Nombre de charges de mémoire globale coalisées gst uncoalesced: Nombre de magasins de mémoire globale non coalescé gst coalisée: Nombre de magasins de mémoire globale coalisées charge locale: Nombre de charges de mémoire locale magasin: Nombre de magasins de mémoire locale branche: Nombre d'événements de branchement (instruction et / ou une pile de synchronisation) branche divergente: Nombre de branches divergentes au sein d'une chaîne des instructions: Nombre d'instructions dynamiques (en chercher) sérialisation de chaîne: nombre de fils dans une sérialisation de chaîne basé sur l'adresse (GRF ou constante) lancé cta: Nombre de CTAs lancé sur le PM PTC taille de la grille X: nombre de blocs dans la grille le long de la dimension X taille de la grille Y: nombre de blocs dans la grille le long de la dimension Y taille de bloc X: le nombre de fils dans un bloc le long de la dimension X taille de bloc Y: le nombre de fils dans un bloc le long de la dimension Y taille de bloc Z: nombre de fils dans un bloc le long de la dimension Z dyn SMEM par bloc: dynamique partagée taille de la mémoire par bloc en octets sta SMEM par bloc: taille de la mémoire statique partagée par bloc en octets reg par thread: Nombre de registres par fil Colonnes uniquement pour les méthodes memcopy: transfert de mem dir: direction de transfert de la mémoire, 0: hôte au périphérique, 1: Dispositif pour l'hôte taille de transfert de mem: taille de transfert de mémoire en octets S'il vous plaît se référer à la section « Interprétation des compteurs de profils » ci-dessous pour plus d'informations sur les compteurs profileur. Notez que les compteurs profileurs sont également appelés signaux profileurs. Afficher le tableau récapitulatif de profileur. Il a les colonnes suivantes pour chaque méthode GPU: Méthode: Nom de la méthode #calls: Nombre d'appels GPU USEC: Temps total GPU en microsecondes USEC CPU: Temps total de CPU en microsecondes % du temps de GPU: Pourcentage du temps GPU Les comptages totaux pour chaque compteur profileur Afficher différents types de parcelles: Résumé de profilage barre de données graphique GPU Temps terrain Hauteur GPU temps terrain Largeur parcelle comptoir de bar Profiler parcelle colonne Table sortie Profiler bar Comparaison Résumé parcelle Analyse des listes de sortie du profileur sur la méthode avec le nombre élevé de: magasins incohérents charges incohérentes sérialisations de chaîne Comparer la sortie profileur pour programme fonctionne multiples du même programme ou pour différents programmes. Chaque exécution du programme est appelé une session. Enregistrer les données de profilage pour plusieurs sessions. Un groupe de sessions est appelé projet. Import / Export CUDA Profiler données au format CSV.


Cuda Visual Profiler Logiciels associés