当前位置: 首页 > news >正文

cuda基础知识

一 基本概念

1 warp

一个Grid可以包括多个SM,也可以访问Global Memory和Constant Memory。

一个Block只能在一个SM中,且一个SM包含多个Block,Block可以访问Shared Memory。

一个Block中有多个Thread,而一个Thread只能访问Registers或local Memory。

从硬件上看

SP(Streaming Processor):流处理器, 是GPU最基本的处理单元,在fermi架构开始被叫做CUDA core

SM(Streaming MultiProcessor): 一个SM由多个CUDA core组成,**每个SM根据GPU架构不同有不同数量的CUDA core**,Pascal架构中一个SM有128个CUDA core。
SM还包括特殊运算单元(SFU),共享内存(shared memory),寄存器文件(Register File)和调度器(Warp Scheduler)等。register和shared memory是稀缺资源,这些有限的资源就使每个SM中active warps有非常严格的限制,也就限制了并行能力。

从软件上看


http://www.mrgr.cn/news/39006.html

相关文章:

  • 用CMake添加gtest测试用例gtest_discover_tests指令函数的分析
  • 扣子创建的智能体,发布成api,使用java进行调用
  • 关于PHP 匿名函数在处理数据结构中的应用
  • 深入解析网络通信的四大关键要素:网卡、MAC地址、IP地址、子网掩码与端口
  • 【Bug】解决 Ubuntu 中 “error: Unable to Find Python3 Executable” 错误
  • 代替@Autowire去注入,使你的代码更简便
  • 【Kubernetes】常见面试题汇总(三十八)
  • CDGA|利用人工智能与边缘计算显著提升数据治理效率与效果的实践案例
  • MES管理系统解决方案对中小企业有哪些帮助
  • Python编码系列—Python访问者模式:为对象结构添加新功能的艺术
  • 好用的电容笔有哪些推荐?2024盘点五款高性价比平替电容笔!
  • 视频美颜SDK与直播美颜工具API的架构设计与实现
  • Comfyui 学习笔记3
  • 强化学习入门——Pybullet初体验
  • 股票接口api,如何用excel获得股票实时数据
  • 基于PHP+MySQL组合开发的分类信息网站源码系统 带完整代码包以及搭建部署教程
  • MongoDB 工具包安装(mongodb-database-tools)
  • 安卓13默认使用大鼠标 与配置分析 andriod13默认使用大鼠标 与配置分析
  • Exception in thread “threadPoolTaskExecutor-1“ java.lang.NullPointerException
  • 图纸加密软件有哪些?2024好用不踩雷的10款图纸加密软件推荐!