cube studio 是tme开源的云原生机器学习平台,目前包含特征平台,支持在/离线特征;数据源管理,支持结构数据和媒体标注数据管理;在线开发,在线的vscode/jupyter代码开发;在线镜像调试,支持免dockerfile,增量构建;任务流编排,在线拖拉拽;开放的模板框架,支持tf/pytorch/spark/ray/horovod/kaldi等分布式训练任务;task的单节点debug,分布式任务的批量优先级调度,聚合日志;任务运行资源监控,报警;定时调度,支持补录,忽略,重试,依赖,并发限制,定时任务算力的智能修正;nni,katib,ray的超参搜索;多集群多资源组,算力统筹,联邦调度;tf/pytorch/onnx模型的推理服务,serverless流量管控,tensorrt gpu推理加速,依据gpu利用率/qps等指标的 hpa能力,虚拟化gpu,虚拟显存等服务化能力。
目前开源到github:https://github.com/tencentmusic/cube-studio
cube开源一站式云原生机器学习平台-加速分布式任务的运行效率_51CTO博客_cube开放平台
cube开源一站式云原生机器学习平台-推理服务的工程化加速_51CTO博客_cube开放平台
cube开源一站式云原生机器学习平台-加速模型工程化落地_51CTO博客_cube开放平台
cube开源一站式云原生机器学习平台-架构(四)
cube开源一站式云原生机器学习平台-架构(五)
cube-studio开源一站式云原生机器学习平台
原创文章,作者:奋斗,如若转载,请注明出处:https://blog.ytso.com/309056.html