S01009

错误代码

S01009

报错信息

<WARN> Liveness checking: data node {nodeDesc} has gone offline. RefId:S01009

错误原因

该错误出现于控制节点日志,表示对应节点在预期时间间隔内没有向控制节点发送心跳,或控制节点没有处理心跳。此时控制节点会标记该节点为 offline 状态。

副本数不足或有进行中的恢复任务时可能导致节点处于 offline 状态,此时控制节点视数据节点为不在线,会删除维护的该数据节点的副本信息。

具体而言,可能的错误原因为:

  • 节点宕机
  • 网络问题

解决办法

  1. 排查对应节点的日志,确认节点是否宕机
  2. 如果节点未宕机,查看监控确定网络状态,并查看控制节点日志,是否有节点状态转为 offline 后是否立刻转回 online 状态的记录。