在Aistudio中使用GPU跑tensorflow
- 在Aistudio中使用GPU跑tensorflow
- 查看显卡驱动
- 查看显卡驱动对应的cuda版本
- 选择cudnn版本号
- 下载cuda和cudnn
- 在aistudio上配置和安装
- 导入
- 安装与解压
- 修改权限和配置环境
- 配置python
- 安装tf
- 保存环境
- 最终效果
在Aistudio中使用GPU跑tensorflow
我试了好多方法在aistudio上用tf都是用的cpu在跑,这个方法也是借鉴了网上很多人写的博客,我把需要下载的东西都放在百度云里了,方便大家使用。
查看显卡驱动
使用命令行nvidia-smi查看显卡驱动。到目前位置我是见到有两种驱动,一种是418的一种是396的。
查看显卡驱动对应的cuda版本
网址:https://docs.nvidia.com/cuda/cuda-toolkit-release-notes/index.html
因为显卡驱动是向下兼容的,所以按照道理应该找396版本驱动对应的cuda安装,才能保证以后在无论打开了那个版本的GPU都可以正常使用。所以可以选择安装9.2一下版本的cuda。
选择cudnn版本号
这里还是附上网址:https://tensorflow.google.cn/install/source#linux
这里就发现了一个很坑爹的问题了,百度的Aistudio内置的是python3.7,支持python3.7的tensorflow-gpu只有1.13和1.14,但是他们要求的cuda版本是10,这就很坑爹了有没有,aistudio的显卡只支持9.2一下的cuda,但是又配了一个3.7的python,这就摆明了不想让我们白嫖百度的显卡跑tensorflow啊!!
不过没关系,python3.6也可以后续安装,先把cuda装好,后续的事情慢慢来。
最终我选择了使用tensorflow-gpu-1.12.0版本,对应的cudnn的版本号是7,对应的cuda版本号是9。
下载cuda和cudnn
附上网址吧:
cuda下载地址:https://developer.nvidia.com/cuda-toolkit-archive
反正显卡驱动向下兼容,这里我就选用上面表里说明的下载cuda9.0吧。
cudnn下载地:https://developer.nvidia.com/rdp/cudnn-archive
下载前需要注册登录,老黄的垃圾网站,又卡又没有中文!
cudnn需要和linux系统版本对应,查看linux版本
这里选择对应的cudnn版本下载就可以了。
这里附上这两个东西的百度云:链接:https://pan.baidu.com/s/1EOKPs5hTzZDv-bP1VFaoOw
提取码:4f2d
名字太长了,我稍微改了一下。
在aistudio上配置和安装
导入
在aistudio中创建数据集,将刚才下载好的两个文件传进来。
上传完以后在载入aistudio时勾选这个数据集,然后进入aistudio。
在终端中输入
cp /home/aistudio/data/data34586/cuda9_0linux.run /home/aistudio
cp /home/aistudio/data/data34586/cudnn9_0.tgz home/aistudio
将数据集拷贝进来,下次打开时就可以把挂载的数据集取消掉了。
安装与解压
先新建一个文件夹:
mkdir cuda9
安装cuda:
sh cuda9_0linux.run --silent --toolkit --toolkitpath=$HOME/cuda9
解压下载的cudnn,默认会解压到cuda文件夹中:
tar -zxvf cudnn9_0.tgz
解压把cudnn的指定文件copy到cuda安装文件对应的目录中:
cp cuda/include/cudnn.h cuda9/include/
cp cuda/lib64/libcudnn* cuda9/lib64/
修改权限和配置环境
在终端里输入:
chmod a+r ~/cuda9/include/cudnn.h
chmod a+r ~/cuda9/lib64/libcudnn*
vi ~/.bashrc
点击键盘i开启编辑模式,在打开文件的最后加入:
export PATH=/home/aistudio/cuda9/bin${PATH:+:${PATH}}
export LD_LIBRARY_PATH=/home/aistudio/cuda9/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}
export CUDA_HOME=/home/aistudio/cuda9
然后esc再:wq保存退出。
再输入:
source ~/.bashrc
配置python
在终端输入:
conda create -n env_name python=3.6
source activate env_name
安装tf
在终端输入:
pip install -i https://pypi.tuna.tsinghua.edu.cn/simple tensorflow-gpu==1.12.0
保存环境
配置好虚拟环境之后压缩
conda info --env
tar -zcvf /home/aistudio/env_nmae.gz /opt/conda/envs/env_name
重启aistudio后,解压压缩的虚拟环境
tar -zxvf env_nmae.gz
conda create -n new_env --clone opt/conda/envs/env_name
最终效果
最后看一下效果,模型确实在使用GPU在跑,成功!