现象:
1.DWS.6000
2.46%左右失败
分析
1.登录dwscontroller后台rms库查看发现 在task RdsDownloadPackageTask 失败
登录数据库: https://bbs.huaweicloud.com/forum/thread-173822-1-1.html
select task.job_id,
task.task_name,
task.begin_time,
task.listener_num,
task.retry_num,
task.execution_status
from rds_instance ins left join
taskmgr_task task
on ins.jobId=task.job_id
left JOIN
taskmgr_job job on
task.job_id=job.job_id
where ins.`name` like ‘%集群名称%’
order by task.job_id,task.begin_time;
2.登录实例节点发现 vi /home/Ruby/log/downloadPackage.log 下载 包超时报错
登录节点:https://bbs.huaweicloud.com/forum/thread-173823-1-1.html
3.使用swift做为包存储
4.在实例节点上ping swift域名(域名从CDK参数obs.endpoint配置信息获取),无法ping通,看修复1
判定,到swift服务器的网络不通
5.在实例节点上 curl {obs.endpoint} 反馈为empty则端口通,没有返回则端口不通,看修复2
恢复方案:
1.在实例节点上ping swift域名(域名从CDK参数obs.endpoint配置信息获取),无法ping通
检查swiftadpter是否配置:
没有配置裸金属网关没有配置swiftadpter 网段,参考案例:
http://3ms.huawei.com/km/blogs/details/9582806?l=zh-cn
关键命令:
cps template-ext-params-show –service baremetal-gateway neutron-hypervbm-agent001
cps template-ext-params-update –service baremetal-gateway neutron-hypervbm-agent001 –parameter neutron_hypervbm_ovs.DEFAULT.innet_service_cidr=原IP列表基础上新增缺失IP
2.在实例节点上 curl {obs.endpoint} 反馈为empty则端口通,没有返回则端口不通
检查一层,二层交换机是否配置正确
历史积累场景:管理交换机 没有放通dmz ecmp的vlan
原创文章,作者:奋斗,如若转载,请注明出处:https://blog.ytso.com/tech/bigdata/316786.html