当前位置: 首页 > news >正文

CUDA 参考文章

CUDA:NVCC编译过程和兼容性详解_nvcc把cuda代码转换成什么-CSDN博客icon-default.png?t=O83Ahttps://blog.csdn.net/fb_help/article/details/80462853

1、CUDA:NVCC编译过程和兼容性详解

 

CUDA:NVCC编译过程和兼容性详解
https://codeyarns.com/2014/03/03/how-to-specify-architecture-to-compile-cuda-code/
https://docs.nvidia.com/cuda/cuda-compiler-driver-nvcc/index.html#supported-phases

CUDA:NVCC编译过程和兼容性详解
前言
编译流程
一些基础知识
        GPU的“代”
        GPU的小“代”
应用程序的兼容性
        虚拟架构
        真实架构
提高兼容性的方式
        即时编译(Just-In-Time)
        Fatbinaries
–generate-code
        CUDA程序兼容性
总结
————————————————

                            版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
                        
原文链接:https://blog.csdn.net/fb_help/article/details/80462853

2、CUDA学习入门(二)(CUDA编译过程 & CUDA 线程层次)

虚拟架构代号    真实架构代号    CUDA支持版本    支持架构    支持硬件
compute_50    sm_50    CUDA 6~11    Maxwell    Tesla/Quadro M series
compute_52    sm_52    CUDA 6~11    Maxwell    GTX-980, GTX Titan X
compute_53    sm_53    CUDA 6~11    Maxwell    Tegra TX1, Jetson Nano
compute_60    sm_60    CUDA 8    Pascal    Tesla P100
compute_61    sm_61    CUDA 8    Pascal    GTX 1080, GTX1070
compute_62    sm_62    CUDA 8    Pascal    Jetson TX2
compute_70    sm_70    CUDA 9    Volta    Tesla V100
compute_72    sm_72    CUDA 9    Volta    Jetson AGX Xavier
compute_75    sm_75    CUDA 10    Turing    RTX 2080, RTX 2070 Tesla T4
compute_80    sm_80    CUDA 11.1    Ampere    A100
compute_86    sm_86    CUDA 11.1    Ampere    RTX 3090
compute_87    sm_87    CUDA 11.1    Ampere    Jetson AGX Orin
compute_89    sm_89    CUDA 11.8    Lovelace    RTX 4090
compute_90    sm_90    CUDA 12    Hopper    H100 H200
compute_95    sm_95    CUDA 12    Blackwell    B100
————————————————

我这里介绍的CUDA代码编译过程较为笼统,只是对大的过程进行概括,更加细节的可以参考下面这位大佬的文章:

https://blog.csdn.net/fb_help/article/details/80462853


                        
原文链接:https://blog.csdn.net/weixin_44222088/article/details/135716596


http://www.mrgr.cn/news/39383.html

相关文章:

  • 网络爬虫自动化Selenium浏览器操作
  • Quill Editor 富文本编辑器的高度问题
  • vue 项目中的配置文件(.env)的用法
  • 理解Python闭包概念
  • 在Python中实现多目标优化问题(1)
  • Object Pascal 过程与函数
  • 三元祖表的定义
  • RVC变声器入门
  • PostgreSQL数据库与PostGIS在Windows中的部署与运行
  • 《OpenCV 计算机视觉》—— Harris角点检测、SIFT特征检测
  • 彩虹易支付最新版源码及安装教程(修复BUG+新增加订单投诉功能)
  • Grafana链接iframe嵌入Web前端一直跳登录页面的问题记录
  • C#基于SkiaSharp实现印章管理(10)
  • C++番外篇-------排序算法总结
  • 前海桂湾地铁E出口免费停车位探寻
  • rocky9.2实现lvs(DR模式)+keepalived实现高可用的案例详解(双机热备、lvs负载均衡、对后端服务器健康检查)
  • 端侧多模态 | 不到10亿参数的端侧Agent竟媲美GPT-4V?AI手机不远了!
  • Java 之 ssm框架入门
  • Java中的PriorityQueue详解
  • 2-107 基于matlab的hsv空间双边滤波去雾图像增强算法