NVIDIA CUDA Toolkit

24 de enero de 2025 - 3.2 GB - Gratis

Última Versión

NVIDIA CUDA Toolkit 12.8.0 (for Windows 11) ÚLTIMO
Revisado por

Daniel Leblanc
Sistema Operativo

Windows 11
Ránking Usuario

Haga clic para votar
Autor / Producto

NVIDIA Corporation / Enlace Externo
Nombre de Fichero

cuda_12.8.0_571.96_windows.exe

NVIDIA CUDA Toolkit proporciona un entorno de desarrollo para crear aplicaciones de alto rendimiento aceleradas por GPU.

Con el CUDA Toolkit, puede desarrollar, optimizar e implementar sus aplicaciones en sistemas integrados acelerados por GPU, estaciones de trabajo de escritorio, centros de datos empresariales, plataformas basadas en la nube y supercomputadoras HPC.

El kit de herramientas incluye bibliotecas aceleradas por GPU, herramientas de depuración y optimization tools, un compilador C/C++ y una biblioteca de tiempo de ejecución para implementar su aplicación.

Las bibliotecas CUDA aceleradas por GPU permiten una aceleración directa en múltiples dominios, como álgebra lineal, procesamiento de imágenes y video, aprendizaje profundo y análisis de gráficos. Para desarrollar algoritmos personalizados, puede utilizar integraciones disponibles con lenguajes y paquetes numéricos de uso común, así como API de desarrollo bien publicadas.

Sus aplicaciones CUDA se pueden implementar en todas las familias de GPU NVIDIA disponibles en las instalaciones y en instancias de GPU en la nube. Utilizando las capacidades integradas para distribuir cálculos en configuraciones de múltiples GPU, los científicos e investigadores pueden desarrollar aplicaciones que escalan desde estaciones de trabajo con una sola GPU hasta instalaciones en la nube con miles de GPU.

IDE con herramientas gráficas y de línea de comandos para depurar, identificar cuellos de botella de rendimiento en la GPU y la CPU, y proporcionar orientación de optimización contextual. Desarrolle aplicaciones utilizando un lenguaje de programación que ya conoce, incluidos C, C++, Fortran y Python.

Para comenzar, explore los recursos en línea para comenzar, las guías de optimización, los ejemplos ilustrativos y colabore con la comunidad de desarrolladores en rápido crecimiento. ¡Descargue NVIDIA CUDA Toolkit para PC hoy!

Características y aspectos destacados

GPU Timestamp: Hora de inicio
Método: Nombre del método de la GPU. Esto es "memcpy*" para copias de memoria o el nombre de un kernel de GPU. Las copias de memoria tienen un sufijo que describe el tipo de transferencia de memoria, p. ej., "memcpyDToHasync" significa una transferencia asíncrona de la memoria del dispositivo a la memoria del host
Tiempo de GPU: Es el tiempo de ejecución del método en la GPU
Tiempo de CPU: Es la suma del tiempo de GPU y la sobrecarga de la CPU para iniciar ese método. A nivel de datos generados por el controlador, el tiempo de CPU es solo la sobrecarga de la CPU para iniciar el método para métodos no bloqueantes; para los métodos bloqueantes, es la suma del tiempo de GPU y la sobrecarga de la CPU. Todos los lanzamientos de kernel son no bloqueantes por defecto. Pero si se habilitan los contadores del perfilador, los lanzamientos de kernel son bloqueantes. Las solicitudes de copia de memoria asíncrona en diferentes flujos no son bloqueantes
ID de flujo: Número de identificación para el flujo
Columnas solo para métodos de kernel
Ocupación: La ocupación es la relación entre el número de warps activos por multiprocesador y el número máximo de warps activos
Contadores del perfilador: Consulte la sección de contadores del perfilador para obtener una lista de los contadores admitidos
Tamaño de la cuadrícula: El número de bloques en la cuadrícula a lo largo de las dimensiones X, Y y Z se muestra como [num_blocks_X num_blocks_Y num_blocks_Z] en una sola columna
Tamaño del bloque: El número de subprocesos en un bloque a lo largo de las dimensiones X, Y y Z se muestra como [num_threads_X num_threads_Y num_threads_Z] en una sola columna
smem dinámico por bloque: Tamaño de la memoria compartida dinámica por bloque en bytes
smem estático por bloque: Tamaño de la memoria compartida estática por bloque en bytes
reg por subproceso: Número de registros por subproceso
Columnas solo para métodos de memcopy
Tamaño de transferencia de memoria: Tamaño de transferencia de memoria en bytes
Tipo de transferencia de memoria del host: Especifica si una transferencia de memoria utiliza memoria "Paginable" o "Bloqueada en página"