业务偶现报错:could not begin transaction on datanodes
问题分析:
此类报错是由于cn将语句下发给dn时建连失败,一般是网络问题导致
对现场进行常规巡检,发现部分节点的网卡多队列配置失效,将网卡多队列重新配置后报错消失
网络问题排查思路:
- 使用gs_check -i CheckNetSpeed测试网络情况,低于600MB/s时说明网速不合格
- 进行日常巡检,查看网络相关的检查项是否合格
- 如果是泰山服务器,根据加固指南排查lro参数、smmu参数、网卡驱动补丁等
- 使用gsar进行测试分析
原创文章,作者:奋斗,如若转载,请注明出处:https://blog.ytso.com/tech/bigdata/316490.html