我已经设置了一个包含基于磁盘的表的集群,其中包含2个数据节点、1个管理节点和2个sql节点。
群集工作正常...所以我只是想测试它的高可用性,所以我在linux提示符下使用KILL命令手动杀死了一个datanode,并连接到sql节点并将一些记录插入到一个表中。
然后我尝试启动datanode,我用下面的命令杀死了它
bin/ndbd,不使用任何--initial
当我在managmnt节点上看到日志时,它显示以下错误,数据节点未启动:
/Node 3:强制节点关闭完成。在启动阶段5期间发生。由错误2355引起:“无法还原架构(资源配置错误)。永久错误,需要外部操作”。
但是当我使用--initial时,它会启动,然后它意味着从头开始(复制所有数据文件会很耗时,如果我们有100G怎么办?)
但是我希望数据节点从它停止(终止)的点开始复制记录。
我该怎么做呢?
发布于 2014-03-25 00:04:28
要避免这种情况,请安全地停止节点,而不是终止进程。例如,要停止节点3运行:
ndb_mgm -e '3 stop'
但是,为了恢复,如果该节点组(您只有一个组)中的节点仍在运行以从中恢复数据,则不会丢失数据。
首先启动节点组中的其他节点。
/bin/ndbd
检查它们是否已“启动”(否则将丢失数据)
ndb_mgm -e show
在损坏的节点上,使用其他节点的数据对其进行初始化
node 3> /bin/ndbd --initial
https://stackoverflow.com/questions/20007671
复制