概览
Stable Diffusion 亚马逊云科技插件解决方案帮助客户将现有的 Stable Diffusion 模型训练、微调和推理工作负载从本地服务器迁移到使用插件和 Amazon CloudFormation 模板的 Amazon SageMaker 上,利用云中的弹性资源,加速模型迭代,并避免了在单机部署相关的性能瓶颈。
优势
安装便捷
本解决方案使用 CloudFormation 一键部署亚马逊云科技中间件,搭配社区原生 Stable Diffusion WebUI 插件安装形式一键安装,即可赋能用户快速使用 Amazon SageMaker 云上资源,进行推理、训练和调优工作。
社区原生
该方案以插件形式实现,用户无需改变现有 Web 用户界面的使用习惯。此外,该方案的代码是开源的,采用非侵入式设计,有助于用户快速跟上社区相关功能的迭代,例如备受欢迎的 Dreambooth、ControlNet 和 LoRa 等插件。
可扩展性强
本解决方案将 WebUI 界面与后端分离,WebUI 可以在支持的终端启动而没有 GPU 的限制;原有训练,推理等任务通过插件所提供的功能迁移到 Amazon SageMaker,为用户提供弹性计算资源、降低成本、提高灵活性和可扩展性。
技术详情
下图显示了您可以使用该解决方案实施指南和随附的 Amazon CloudFormation 模板自动部署的架构。
- 在 WebUI 控制台中的用户将使用分配的 API token 触发对 API Gateway 的请求,同时进行身份验证。(注:WebUI 的角度不需要 Amazon 凭证。)
- API Gateway 将根据 URL 前缀将请求路由到不同功能的 Amazon Lambda 函数,以实现相应任务(例如,模型上传、checkpoint 合并)、模型训练和模型推理。同时,Amazon Lambda 函数将操作元数据记录到 Amazon DynamoDB 中(例如,推断参数、模型名称),以便进行后续查询和关联。
- 在训练过程中,Amazon Step Functions 将被调用来安排训练过程,其中包括使用 Amazon SageMaker 进行训练和使用 Amazon SNS 进行训练状态通知。在推理过程中,Amazon Lambda 函数将调用 Amazon SageMaker 来实现异步推断。训练数据、模型和 checkpoint 将以不同的前缀分隔存储在 Amazon S3 存储桶中。
关于此部署
版本
1.1.0
发布时间
2023 年 8 月
作者
亚马逊云科技
预计部署时间
25 分钟
AIGC是什么_AI自动内容生成解决方案 – AWS云服务 (amazon.com)
AIGC 创新实践在线大会 (amazoncloud.cn)
原创文章,作者:奋斗,如若转载,请注明出处:https://blog.ytso.com/297107.html