关于配置gpu环境那些事儿


我自闭了,在我不长的工作生涯中,我认为最困难的部分就是配置环境了。因为我快被配置gpu环境给搞疯了。

事情是这样的,最近搞我的bert的模型,领导说你在gpu上测试一下效率,我说:好的。
然而我本地电脑并没有cuda,然后我就开始了配置环境的漫漫长路。

我首先看了一下我电脑的显卡驱动版本,嗯391,太低了,我于是准备升级一下。三下五除二我就下载了一个最新版本的显卡驱动,一路点击,然后它就卡住了,我心想这种小问题很好解决,我的解决办法就是关机重启。
我等待了很长时间,然而屏幕并没有任何反应,很好,第一步成功的把电脑搞坏了。电脑找不到显卡驱动,新的没安好,旧的卸载了,于是我选择了下班,我真的一点办法都没有。

第二天我一大早来到公司希望电脑它能自我修复,然而并没有。于是我将我的问题告诉了我的领导,同事以及 没有以及。我们尝试了很多办法,结果就是:此路不通。终于领导说:重装系统吧,然而这时发现了电脑上存在一个昨天留下的还原点,好吧开始还原,终于我的电脑可以用了。
我再也不敢升级驱动了,然后我就开始安装cuda,首先你需要按照你的显卡驱动版本找到对应的cuda版本,然后你需要根据你的cuda版本找到cudnn的版本,然后你需要根据你的cuda和cudnn版本下载对应的torch版本,然后你需要根据以上所有版本安装对应的onnxruntime-gpu版本。总之这个流程就是这样,这里提到几个注意点:
1、cuda有些本地安装下面有相关版本的补丁,我觉得有必要安一下。
2、下载前先卸载之前的cuda,如果有的话。
3、贴一下相关版本对照链接
cuda和驱动对应:
https://docs.nvidia.com/cuda/cuda-toolkit-release-notes/index.html
cudnn 下载和对应CUDA版本:
https://developer.nvidia.com/rdp/cudnn-archive

原创文章,作者:ItWorker,如若转载,请注明出处:https://blog.ytso.com/288255.html

(0)
上一篇 2022年9月8日
下一篇 2022年9月8日

相关推荐

发表回复

登录后才能评论