当前位置: 首页 > news >正文

大模型时代的基础架构 读书笔记

第一章 AI与大模型时代对基础架构的需求

  1. 大部分机器学习算法的核心操作都是基于乘加累积运算的向量卷积运算。所以“加速” AI 运算指的就是如何通过 GPU 中的海量计算单元实现并行化的向量卷积运算。
  2. 能实现 AI 运算的硬件:
    在这里插入图片描述

第二章 软件程序与专用硬件的结合

  1. GPU 中能多线程并发执行运算的硬件单元分类:
    在这里插入图片描述
  2. GPU 执行运算的简要步骤:
    在这里插入图片描述
  3. GPU 中 CUDA Core 执行运算的简要步骤:
    在这里插入图片描述
  4. 出现机器学习框架的原因:
    1. 提供综合、统一、便捷的框架给开发者使用。避免自己单独造各种机器学习算法的轮子。
    2. 单纯面向底层硬件编程,不但学习曲线陡峭、上手难度高,而且产出效率低。不利于 AI 产品的快速落地。
  5. 机器学习框架支持的训练方式:
    在这里插入图片描述

第三章 GPU 硬件架构剖析

💡 以 nVIDIA 最新发布的 Ada Lovelace 架构的纯计算型 GPGPU - L40 为例介绍 GPU 的硬件架构。

  1. Tesla L40 纯计算卡的硬件参数及性能信息:
    在这里插入图片描述
  2. Ada Lovelace 架构:
    在这里插入图片描述

http://www.mrgr.cn/news/96571.html

相关文章:

  • Android设计模式之代理模式
  • 项目上传github——SSH连接配置文档
  • 【MySQL】从零开始:掌握MySQL数据库的核心概念(四)
  • 【MySQL】从零开始:掌握MySQL数据库的核心概念(五)
  • Transformer-BiLSTM、Transformer、CNN-BiLSTM、BiLSTM、CNN五模型多变量回归预测
  • 车载以太网网络测试-25【SOME/IP-报文格式-1】
  • Cocos Creator Shader入门实战(七):RGB不同算法效果的实现,及渲染技术、宏定义、属性参数的延伸配置
  • AIGC1——AIGC技术原理与模型演进:从GAN到多模态融合的突破
  • 01-Docker 安装
  • 五.ubuntu20.04 - ffmpeg推拉流以及Nginx、SRS本地部署
  • YOLOv11模型的常见处理
  • 我的机器学习学习之路
  • 【TensorRT】TensorRT从安装到推理——Python 环境下 MobileNetV4 三分类任务
  • VUE如何前端控制及动态路由详细讲解
  • Go 语言常见错误
  • Java 大视界 -- Java 大数据在智慧矿山设备故障预测与预防性维护中的技术实现(163)
  • 【蓝桥杯—单片机】通信总线专项 | 真题整理、解析与拓展 (更新ing...)
  • 基于FPGA的ESP8266无线数据传输(温湿度DTH11、光照强度BH1750、WIFI模块)连接中国移动onenet云平台,仿真+上板通过+可视化平台搭建
  • Verilog中X态的危险:仿真漏掉的bug
  • 【区块链安全 | 第十四篇】类型之值类型(一)