当前位置: 首页 > news >正文

使用 CUDA 12.9 编译 PyTorch 2.4.0

最近跑的一个项目需要 torch==2.4.0,但是 GPU 需要 CUDA 12.9,PyTorch 官方这个配置的预编译包,因此需要手动编译。

  • 操作系统:Ubuntu 24.04 LTS
  • GPU:NVIDIA RTX PRO 6000 (SM 12.0, CUDA 12.9)
  1. 获取源码:

    git clone -b v2.4.0 --depth 1 https://github.com/pytorch/pytorch
    cd pytorch
    git submodule sync
    git submodule update --init --recursive --depth 1 --progress
    
  2. 安装编译环境:

    sudo apt install libnvtoolsext1
    sudo ln -s /usr/lib/x86_64-linux-gnu/libnvToolsExt.so.1 /usr/lib/x86_64-linux-gnu/libnvToolsExt.so
    sudo ln -s /usr/lib/x86_64-linux-gnu/libnvToolsExt.so.1 /usr/local/cuda-12.9/lib64/libnvToolsExt.so
    sudo ln -sf /usr/lib/x86_64-linux-gnu/libnvToolsExt.so.1.0.0 /usr/local/cuda-12.9/lib64/libnvToolsExt.so.1
    cd pytorch
    sudo cp third_party/nccl/nccl/src/include/nvtx3/nvToolsExt.h /usr/local/cuda-12.9/include/
    sudo cp third_party/nccl/nccl/src/include/nvtx3/nvToolsExtCuda*.h /usr/local/cuda-12.9/include/conda create -n torch-builder python=3.12
    conda activate torch-builder
    pip install cmake==3.18.4 mkl-static mkl-include
    pip install -r requirements.txt
    export TORCH_CUDA_ARCH_LIST="8.0;8.9"
    export _GLIBCXX_USE_CXX11_ABI=1
    export CMAKE_PREFIX_PATH=${CONDA_PREFIX:-"$(dirname $(which conda))/../"}
    
  3. 编译:

    python setup.py develop
    

参考:pytorch/pytorch#v2.4.0

http://www.wxhsa.cn/company.asp?id=3563

相关文章:

  • 豆包生成C#即梦API HTTP调用实例代码
  • 解析几何笔记
  • 基于SOA海鸥优化算法的PID控制器最优控制参数计算matlab仿真
  • 详细介绍:boost::circular_buffer的使用方法简介
  • 基于禁忌搜索算法的TSP问题最优路径搜索matlab仿真
  • PDD9.14 笔试 - 浪矢
  • 增肌,减脂,变瘦的联系和区别
  • (eval):1: _python-argcomplete: function definition file not found
  • 详细介绍:【Spring Boot 报错已解决】Web server failed to start. Port 8080 was already in use.
  • Nordic Neuton.AI 技术优势;
  • channel Sounding 工作流程
  • 基于Zhang-Suen算法的图像细化处理FPGA实现,包含testbench和matlab验证程序
  • channel Sounding RTT和PBR 属性总结
  • 二分查找方法
  • 复制一个数组的方法
  • 判断目标是否在数组里面
  • 选择排序方法
  • ArcGIS Pro 遇到严重的应用程序错误而无法启动 - 教程
  • 第一次作业
  • markdown文件上传到博客园教程
  • 【展厅多媒体】从技术到体验,AR在展厅中的一体化整合 - 指南
  • LilCTF 2025
  • AES算法原理与举例说明
  • ffplay音频重采样 - 教程
  • devexpress gridcontrol表格知识
  • 深入解析:Qt串口通信学习
  • 字符串算法笔记
  • 【光照】Unity[经验模型]和[物理模型]
  • 实用指南:浅聊一下Redisson分布式锁
  • JavaScript起源