租用GPU云服务器进行深度学习(AutoDL,超保姆级,适重大更新)
1.熟悉并认识AutoDL
AutoDL是国内主流的云端GPU算力租赁平台,专为深度学习、人工智能科研与算法开发打造,汇聚4090、A100、H100等各类高性能显卡,预装PyTorch、MMDetection系列等主流框架与配套环境,开箱即用、无需复杂配置,支持Jupyter、远程VS Code、终端等多种开发方式,采用按需按量计费模式,国内网络访问稳定高速,能低成本满足模型训练、项目复现、算法调试等需求,是学生与开发者低成本使用高性能算力的常用工具。
AutoDL链接:AutoDL
这是官方的帮助文档:AutoDL帮助文档
1.1 主界面
1.1.1 顶部导航栏
- 算力市场:这里是购买 GPU 实例的地方,你可以选择不同型号的显卡(RTX 4090、A100、H100 等)和配置
- AI 应用:提供了很多一键部署的 AI 应用,比如 Stable Diffusion、ChatGLM 等,不用自己写代码就能用
- AI 服务器:适合企业用户的物理服务器租赁
- 帮助文档:遇到问题时第一时间来这里查,几乎所有常见问题都有详细解答
- 控制台:就是我们现在所在的页面
- 炼丹师:个人中心,包含成长值、会员福利等内容
1.1.2. 左侧菜单栏
左侧是常用功能的快捷入口
- 容器实例:管理你购买的所有 GPU 实例,包括启动、关机、连接、释放等操作
- 文件存储:相当于你的云端硬盘,可以永久存储数据,不会因为实例释放而丢失
- 镜像:保存你自己配置好的环境,下次创建实例时可以直接使用,不用重新配置
- 公开数据:平台提供了很多常用的公开数据集,比如 ImageNet、COCO 等,可以直接挂载到实例使用,不用自己下载
- 费用:查看消费明细、充值、开具发票
- 账号:管理个人信息、认证信息、安全设置
1.1.3 重要功能介绍
(1)算力市场
这里是购买 GPU 实例的地方,你可以选择不同型号的显卡(RTX 4090、A100、H100 等)和配置,不过1块多的很容易被抢完。
(2)容器实例
管理你购买的所有 GPU 实例,包括启动、关机、连接、释放等操作
(3)文件存储
相当于你的云端硬盘,可以永久存储数据,不会因为实例释放而丢失。但是不同区之间是不相通的,所以如果你要用的代码或者数据在北京B区,那么你就要去租北京B区的实例。
(4)镜像
保存你自己配置好的环境,下次创建实例时可以直接使用,不用重新配置。这里以我之前创建的一个实例为例说明(命名为MapQR)
这里就能看见我之前保存的镜像(MapQR)
(4)公开数据
平台提供了很多常用的公开数据集,比如 ImageNet、COCO 等,可以直接挂载到实例使用,不用自己下载
1.2 创建一个实例
(1)
我们先进入算力市场选择一个我们心仪的实例
(2)
选择GPU数量
(3)
勾选是否需要扩容
(4)
这里有三种镜像可供选择
(5)基础镜像
(6)社区镜像
(7)我的镜像
这里我们可以选择我们之前保存的镜像
都设置好后就可以创建并开机了
2.利用pycharm专业版建立远程SSH连接
2.1 连接教程
(1)
首先,我们需要一个pycharm专业版,没有的同学不要急(万能的淘宝)
注意这里的登录指令和密码(重点)
(2)打开pycharm
我们打开pycharm专业版
(3) 文件-设置
(4)添加解释器-选择SSH
(5)
这里就要用到我们之前的登录指令与密码
登录指令:ssh -p 21664 root@connect.westd.seetacloud.com
密码:123456
该怎么填写呢?
端口号:21664
主机:connect.westd.seetacloud.com
用户名:root
(我们这里暂且还用不到密码,只用登录指令即可)
(6)填写密码
(7)
我这里和我参考的一位博主不太一样:(但我后面用着感觉没什么问题,我自己也是小白,不太明白)
这是另一位博主的
2026.4.27更新:
我用另一台电脑登录的时候出现了,哈哈
(8)选择系统解释器
(9)选择我们创建的解释器
创建好后,我们就能在python解释器中看见我们之前创建的解释器(端口21664,我这里有俩个是因为之前我就创建了一个,然后为了写博客又创建了一遍)
(10)工具-部署-配置
(11)
选择端口21664(左上角的勾号要点),点击确定后,我们就可以使用了
2.2 使用
(1) 创建一个终端(并点击加号右边的符号,选择我们的云服务器21664,带有remote的)
这有俩个端口21664,但其中只有一个是我们要用的,就是Remote 3.8的,俩者区别如下:
选好后就可以啦
3.基础操作
3.1 如何上传资源至服务器
3.1.1 使用文件存储的方式
(1)
我们的实例是西北B区
(2)文件存储-西北B区-上传
(3)查找我们的挂载目录
(4)# 查看文件 ls /root/autodl-fs
3.1.2 pycharm上传代码
(1)右键项目源码-部署-上传
(2)左侧会出现一个文件传输,点击即可
(3)复制地址并运行
正确运行啦!
3.1.3 使用公网网盘(这里的官方文档有误 百度网盘现在可以个人创建应用)
- 启动 AutoDL 实例
- 在实例页面点快捷工具 → AutoPanel
- 进入公网网盘
- 第一次进去会让你设置一个独立密码
- 选择添加授权 → 百度网盘
- 授权成功后,在 AutoPanel 里浏览你的百度网盘文件
- 找到你的 Pytorch-UNet-master.zip
- 点下载
在实例页面点快捷工具 → AutoPanel
进入公网网盘(这里我已经添加过了)
后续步骤参考官方文档即可:
优点:
- 支持实例和阿里云盘、夸克网盘、百度网盘、对象存储OSS等直接进行数据传输(实例上传到网盘,网盘下载到实例),方便下载数据到不同实例、备份实例重要数据、迁移实例。阿里云盘在海外的传输速度依然很快,如果您在海外使用AutoDL非常推荐~
- 相比本地和实例之间传输,速度快且稳定。
- 和其他人共享数据集。
缺点:
- 需要额外配置授权算一个缺点 :)
数据安全:AutoDL通过您设置的独立密码对个人信息进行加密,加密后的个人信息只有通过您的密码才能解密,包括AutoDL也无法解密。详细实现方法请看文档最下方。
AutoDL中公网网盘的实现可看作三方网盘客户端(叫做AutoPanel),和官方客户端的不同有:该工具为Server/Brower架构(类比JupyterLab理解,Server可以不在本地电脑,但可以在本地浏览器使用)。架构如下:
从图中可以看出:与官方客户端不同,AutoPanel的Server启动在哪台主机,那么就由该主机和网盘发生上传下载交互,和浏览器所在主机无关。因此您可以更灵活的将AutoPanel的Server启动在本地电脑、AutoDL的实例(已默认启动)、或其他您自己的服务器当中,然后通过Server提供的访问地址在浏览器完成操作。
使用方法
Step.1:打开AutoPanel
租用实例开机后,在快捷工具一列找到「AutoPanel」入口,点击进入后打开「公网网盘」。
Step.2:授权
第一步需要设置独立访问密码,该密码非常重要(更复杂更安全),您接下来授权的网盘个人账户信息均通过该密码进行加密。如忘记密码则需重新初始化。
通过您设置的独立密码加密后的个人信息只有通过您的密码才能解密,包括AutoDL也无法解密。
阿里云盘
阿里云盘在2024年7月左右对三方应用进行了限制,需要购买三方权益包才能获得良好的上传下载速度,具体请参考文档,请根据自己的需求使用阿里云盘。
选择阿里云盘,然后使用阿里云盘的APP扫码授权登录。
夸克网盘
夸克网盘需要购买会员才能获得良好的上传下载速度,请自行在夸克网盘中购买。
浏览器登录夸克网盘网页版本,按F12打开浏览器“调试”,选中“Network”,随意在左侧选择请求,找到携带 Cookie 参数复制填写对应位置。
百度网盘
百度网盘由于规则调整,不再支持个人认证及个人创建应用功能,需要企业认证才可开通应用,因此不再推荐使用百度网盘。
注意:百度网盘是可以的(登录百度网盘开发平台)
- 地址:百度网盘开放平台 https://pan.baidu.com/union/
- 流程:登录 → 申请接入 → 选个人→ 实名 / 绑手机 → 创建应用,拿到AppKey/Secret
- 结论:个人开发者可以创建应用,审核一般 1–3 天
登录百度网盘后,创建应用(如果您没有进行过百度的认证可能创建失败,需先完成认证),创建完成后获取AppKey和SecretKey。以下应用名称推荐填写AutoDL,以免不必要的麻烦。
在AutoPanel点击添加授权,输入AppKey和SecretKey后,点击获取Access Token将打开百度网盘的网页,将其返回的Token粘贴过来即可完成授权。
OSS对象存储
支持MinIO、阿里云OSS、腾讯云OSS和兼容S3协议的OSS。
如果您使用阿里云OSS,那么Address、Bucket、Region参数举例: Address:oss-cn-beijing.aliyuncs.com (注意地址中不要包含桶的信息) Bucket:test-bucket Region:cn-beijing
如果您使用腾讯COS,那么Address、Bucket、Region参数举例: Address:cos.ap-beijing.myqcloud.com Bucket: test-bucket region:ap-beijing
如果您使用MinIO,那么Address、Bucket参数举例: Address: http://116.172.92.17:9000 Bucket: test-bucket
Step.3:文件浏览/上传/下载
如果是超过10GB以上的大文件在上传时可能需要花几十秒到几分钟不等的时间计算文件Hash值,计算完成后才会开始上传。另外计算Hash值的效率与cpu/内存相关,如果使用了无卡模式,该过程会更慢。请耐心等待~
选中网盘后可以浏览网盘中的文件,点击下载可以下载至本地(实例中)。固定下载到实例/root/autodl-tmp下,下载完成后可以自行移动。
点击上传按钮则可以上传本地(实例中)的文件至网盘。
同时可存在多个上传和下载文件任务,他们将排队进行上传下载,在右侧「传输任务」中可查看。
3.2 如何安装库
pip install即可
4. 实用工具介绍
4.1 tmux
tmux使用链接
(后续我将会持续更新~)
