【集群创建失败】DWS.6000/46%左右失败/RdsDownloadPackageTask失败

现象

1.DWS.6000

2.46%左右失败

分析

1.登录dwscontroller后台rms库查看发现 在task  RdsDownloadPackageTask 失败

登录数据库: https://bbs.huaweicloud.com/forum/thread-173822-1-1.html

select task.job_id,
task.task_name,
task.begin_time,
task.listener_num,
task.retry_num,
task.execution_status
from rds_instance ins left join
taskmgr_task task
on ins.jobId=task.job_id
left JOIN
taskmgr_job  job on
task.job_id=job.job_id
where ins.`name` like ‘%集群名称%’
order by task.job_id,task.begin_time;

2.登录实例节点发现 vi /home/Ruby/log/downloadPackage.log 下载 包超时报错

登录节点:https://bbs.huaweicloud.com/forum/thread-173823-1-1.html

3.使用swift做为包存储

4.在实例节点上ping swift域名(域名从CDK参数obs.endpoint配置信息获取),无法ping通,看修复1

判定,到swift服务器的网络不通

5.在实例节点上 curl {obs.endpoint} 反馈为empty则端口通,没有返回则端口不通,看修复2

恢复方案

1.在实例节点上ping swift域名(域名从CDK参数obs.endpoint配置信息获取),无法ping通

检查swiftadpter是否配置:

没有配置裸金属网关没有配置swiftadpter 网段,参考案例:

http://3ms.huawei.com/km/blogs/details/9582806?l=zh-cn

关键命令:

cps template-ext-params-show –service baremetal-gateway neutron-hypervbm-agent001
cps template-ext-params-update –service baremetal-gateway neutron-hypervbm-agent001 –parameter neutron_hypervbm_ovs.DEFAULT.innet_service_cidr=原IP列表基础上新增缺失IP

2.在实例节点上 curl {obs.endpoint} 反馈为empty则端口通,没有返回则端口不通

检查一层,二层交换机是否配置正确

历史积累场景:管理交换机 没有放通dmz ecmp的vlan

原创文章,作者:奋斗,如若转载,请注明出处:https://blog.ytso.com/tech/bigdata/316786.html

(0)
上一篇 2天前
下一篇 2天前

相关推荐

发表回复

登录后才能评论