随着人工智能和深度学习技术的飞速发展,对高性能计算资源,尤其是图形处理单元(GPU)的需求急剧增加。企业和研究机构需要大量的GPU算力来支撑复杂的AI模型训练和数据分析任务,而传统的硬件资源配置方式往往昂贵且不够灵活。在这种市场需求背景下,GPU云服务应运而生,成为解决以上问题的有力工具。
在GPU云市场中,如GpuMall等智算云平台的出现为用户提供了便捷的GPU资源接入环境。GpuMall平台的一大亮点在于其“实例启动时拉起任务”的功能,显著提高了GPU云主机的效率和便捷性。
在?GpuMall?平台使用该功能可以在实例启动的同时自动帮您拉起进程或者任务,该功能主要适用于以下场景:
1.实例开机即启动您需要的进程。
2.推理任务,比如您需要扩容某个功能节点,只需要创建实例即可自动拉起您的推理任务,来接收请求。
3.特定的Web项目,比如?Stable Diffusion web UI。
4.Job任务制项目,开启实例后及运行,然后配合平台的定时关机功能来实现任务结束即关机。
5.特定的训练场景或某些监控任务。
该功能必须在创建实例的时候指定要运行的命令,下面演示以下几种对于该功能的用法
[if !supportLists]l?[endif]实例启动时拉起一个官方镜像中已存在的项目
[if !supportLists]l?[endif]实例启动时拉起一个训练项目
[if !supportLists]l?[endif]实例启动时拉起一个推理项目
[if !supportLists]l?[endif]实例启动时拉起一个脚本来同时拉起多个项目
[if !supportLists]l?[endif]实例启动时拉起一个Web 项目,拉起后直接公网访问
一、实例启动时拉起一个官方镜像中已存在的项目
进入?GpuMall控制台去创建实例,选择实例镜像,展开高级配置,填写入口命令,该入口命令即为实例启动同时会执行的任务,我这里选择的为官方镜像。
python -m http.server 8080
选择完成后点击右下角的【创建实例】
1.登录实例
可以通过控制台中对应实例的?JupyterLab?点击进去,打开终端查看?
或者通过?SSH登录实例方式进入实例
2. 验证进程是否拉起?通过?ps aux | grep [进程名称]?来获取是否拉起进程
注意:验证无误后,该实例的每次启动都会拉起?python -m http.server 8080?这个任务,如果?python -m http.server 8080?任务执行失败,也不会影响实例正常启动。
二、实例启动时拉起一个训练项目
提示:默认情况下使用官方镜像是没有您需要训练的项目,正确的做法应该按照如下流程:
1.使用官方镜像创建一台实例。
2.进入实例准备训练代码。
3.实例关机-》实例管理-》更多-》备份镜像。
4.使用备份镜像去创建实例-》高级配置-》入口命令-》指定实例启动时需要拉起的训练任务。
5.创建实例-》进入实例验证是否在训练。
三、实例启动时拉起一个推理项目
提示:默认情况下使用官方镜像是没有您的推理项目,正确的做法应该按照如下流程:
1.使用官方镜像创建一台实例。
2.进入实例准备您的推理项目和数据,如果在没有网盘的数据中心则需要把数据存在系统盘。
3.实例关机-》实例管理-》更多-》备份镜像。
4.使用备份镜像去创建实例-》高级配置-》入口命令-》指定实例启动时需要拉起的推理任务。
5.创建实例-》进入实例验证推理任务是否已拉起。
四、实例启动时拉起一个脚本来同时拉起多个项目
提示:默认情况下使用官方镜像是没有您要拉起的脚本,正确的做法应该按照如下流程:
1.使用官方镜像创建一台实例。
2.进入实例准备您需要拉起的脚本,以及脚本内容中需要拉起的任务,脚本中如果有多个任务需要拉起,则最后一个任务前的所有任务需要通过nohup 来后台运行。
3.实例关机-》实例管理-》更多-》备份镜像。
4.使用备份镜像去创建实例-》高级配置-》入口命令-》指定实例启动时需要拉起的脚本。
5.创建实例-》进入实例验证是否已拉起脚本并且脚本中的任务是否拉起。
五、实例启动时拉起一个Web 项目进行
提示:默认情况下使用官方镜像是没有您要拉起的Web 项目,正确的做法应该按照如下流程:
1.使用官方镜像创建一台实例。
2.进入实例准备您需要拉起的Web 项目,手动测试 Web 项目是否可以正常启动。
实例关机-》实例管理-》更多-》备份镜像。
3.使用备份镜像去创建实例-》高级配置-》入口命令-》指定实例启动时需要拉起的 Web 项目。
4.创建实例-》进入实例验证是否已拉起您指定的 Web项目。
总结而言,GpuMall作为一种新一代的算力交易平台,其提供的GPU云服务彻底转变了GPU资源的使用和管理方式。随着AI云的不断进步,预计未来这种服务模式将在许多对算力有高要求的领域得到更广泛的应用,助力各行各业实现技术突破和商业成功。