依赖环境:N卡GPU驱动,其次是conda的环境。该方法保证可以成功,并且初始化也很快。

前话

解决这个问题首先要明确的是不同的torch或者tensorflow的版本,对应不同的cuda和cudnn,并且相同版本的cuda在torch和tensorflow需要的cudnn都不相同。如果版本不对应,是无法安装GPU版本的torch或者tensorflow的,即使安装成功,其初始化速度也非常慢,需要手动调整才可以。
cuda和cudnn是两个不同的软件库,cuda是英伟达开发的通用并行计算平台和编程模型,所以在一般的GPU并行计算时,总会看到它的身影。cudnn则是英伟达开发的基于cuda的深度学习加速库,主要目标是深度学习。也就是说,如果想要使用英伟达的卡做深度学习,就必须安装这两个软件。并且这些软件的版本必须要对应,这样GPU才能正常工作,并确保最佳的性能和稳定性。

GPU版本的torch 安装方法

为了不破坏现有的python环境,可以先搭建另外一个环境:

conda create -n env_name python=3.*

这个方法可以安装很多个环境,不要怕折腾坏了,如果折腾坏了,可以直接卸载:

conda uninstall env_name --all

卸载后,干干净净,感觉跟没发生过一样。然后再来一遍。。。

然后按照torch官方出的旧版本torch安装方法进行安装,推荐使用conda安装,具体网址:
https://pytorch.org/get-started/previous-versions/
举个栗子:

# Linux and Windows
# CUDA 11.7
conda install pytorch==2.0.0 torchvision==0.15.0 torchaudio==2.0.0 pytorch-cuda=11.7 -c pytorch -c nvidia
# CUDA 11.8
conda install pytorch==2.0.0 torchvision==0.15.0 torchaudio==2.0.0 pytorch-cuda=11.8 -c pytorch -c nvidia
# CPU Only
conda install pytorch==2.0.0 torchvision==0.15.0 torchaudio==2.0.0 cpuonly -c pytorch

该方法可以直接安装pytorch=2.0.0,并且自动配置好显卡配置,而最后一行是CPU安装方法。

GPU版本的TensorFlow安装方法

同样,也是使用codna安装。先将对应版本的cudn和cudnn,然后再安装tensorflow-gpu,可以参考下面的网站,但是仅供参考,我发现有时候并不好用,具体看运气,下面我只给出已经验证过的方法。
https://tensorflow.google.cn/install/source_windows?hl=en#gpu
tensroflow-gpu 1.15:

conda install cudatoolkit=10.0
conda install cudnn=7.3.1 
pip install tensorflow-gpu==1.15 

tensorflow-gpu 2.5.0:

conda install cudatoolkit=11.3
conda install cudnn=8.2.1
pip install tensorflow-gpu==2.5.0

tensorflow-gpu 2.6.0:

conda install cudatoolkit=11.4
conda install cudnn=8.2.4
pip install tensorflow-gpu==2.6.0

tensorflow-gpu 2.7.0:

conda install cudatoolkit=11.4.1
conda install cudnn=8.2.4
pip install tensorflow-gpu==2.7.0
06-09 23:09