数字资产盘活机器人解决方案

数字资产盘活机器人是一个将机器学习应用于业务场景的解决方案,客户可以使用此解决方案中的机器人,对其上传至 Amazon Web Services(亚马逊云科技)云上的数字资产(例如,照片、PDF文档、视频等非结构化数据)进行知识标记。标记知识将有助于客户实现业务流程自动化。此解决方案利用 Amazon Simple Storage Service (Amazon S3)和Amazon Elastic Compute Cloud (Amazon EC2)的竞价型实例,使客户可以安全的、低成本的使用批处理机器人来标记数字资产。机器人将所识别出的信息存储在客户私有的Amazon S3 存储桶中来保证数据安全性,机器人将运行在EC2竞价型实例中来节省计算成本。此解决方案是一个开源框架,构建者可以通过创建自己的模型或机器人为本解决方案框架做出贡献。

亚马逊云科技解决方案概述

数字资产盘活机器人解决方案提供两个部分功能:模型离线的训练和机器人的使用。
模型离线的训练是指,在 Amazon SageMaker 上用开源数据集进行基于容器的机器学习模型训练,训练好的模型会被自动上传到 Amazon ECR 中。
机器人的使用是指,当用户发出任务请求后,机器人会自动生成任务列表并执行任务。机器人任务均运行在 Amazon Batch 控制的弹性计算平台上,计算资源为按需使用,执行完成后自行释放,并可以根据您的任务规模自动扩展,同时底层的计算实例为竞价型实例,可以更进一步节省运行的成本。

Architecture of Spot Tagging Bot

等待盘活的数字资产首先需要存储在Amazon S3上,之后您只需要向Amazon API Gateway发出REST请求,指定要处理的S3文件和要应用的机器人类型即可。具体流程如下:

  • Amazon API Gateway 将请求转发到 Amazon Lambda
  • Amazon Lambda 函数递归取出S3中所有待处理的文件路径,并生成待处理文件列表。
  • Amazon Lambda 函数将待处理文件列表存入 Amazon Elasticsearch Service (Amazon ES)。
  • Amazon Lambda 函数启动 Amazon SageMaker 的推理终端节点。
  • Amazon Lambda 函数通过 Amazon Step Functions 启动一个或者多个 Amazon Batch 任务。
  • Amazon Batch 执行相应资产盘活任务,从 S3 桶中读取源文件,并调用 Sagemaker终端节点进行推理。推理结果会写入 Elasticsearch 索引,同时将识别结果写入您指定的S3路径。
本解决方案内建三个机器人,分别是:车型分类机器人,情感分析机器人,场景文字识别机器人。
  1. 车型分类机器人的构建基于图像分类方法,将输入车辆图像进行分类,识别出汽车生产厂商、汽车型号等信息。该机器人基于AutoML技术,利用AutoGluon在ResNet50基础上生成新的对汽车类别进行分类的图像分类模型。
  2. 情感分析机器人的构建基于自然语言处理方法,通过调优预训练的中文BERT模型,将输入中文文本分类为正面/负面评论。
  3. 场景文字识别机器人可以用来识别图片中的印刷体中文文本信息。该机器人使用两个模型来完成身份证识别任务,分别是CTPN和CRNN。图片经过CTPN后可以取出文字位置的坐标信息,之后,包含文字的每个子图被送入CRNN模型去识别图片中文字的内容,并将结果合并返回。
https://s3.cn-north-1.amazonaws.com.cn/aws-dam-prod/china/Solutions/Spot_tagging_bot/spot_tag_bot_deployment_guide_cn.pdf

原创文章,作者:奋斗,如若转载,请注明出处:https://blog.ytso.com/96036.html

(0)
上一篇 2021年8月18日 20:09
下一篇 2021年8月18日

相关推荐

发表回复

登录后才能评论