Mongodb

Question

mongodb分片集群，在moveChunk的时候，报错，无论是自动均衡，还是手工迁移chunk都报这个错

Data transfer error: ExceededTimeLimit: Failed to delete orphaned 。。。。

有哪位大神知道如何设置参数？

Sergey Kalinichenko · Answer

在MongoDB分片集群中，moveChunk操作用于在分片之间迁移数据块（chunks），以实现数据均衡。如果在执行moveChunk时遇到错误信息ExceededTimeLimit: Failed to delete orphaned...，这通常意味着某个操作超时了，具体来说是尝试删除孤儿文档（即那些不再属于任何有效chunk的数据）的操作超过了设定的时间限制。

以下是一些可能的解决方案和参数调整建议：

增加操作时间限制：你可以通过设置maxTimeMS来增加操作的时间限制。不过，在moveChunk上下文中，直接设置这个参数可能不适用，因为它是针对单个操作的。对于后台清理任务或类似的维护工作，可以考虑增加这些操作的时间限制。
检查网络延迟和性能：确保各分片之间的网络连接良好，减少因网络问题导致的操作超时。高延迟可能会导致数据传输花费更多时间，从而触发超时。
优化硬件资源：确保MongoDB实例所在的服务器有足够的CPU、内存和磁盘I/O资源。硬件资源不足可能导致数据迁移过程变慢，进而引发超时。
调整平衡器设置：有时，减慢或暂停其他数据库活动可以给数据迁移腾出更多资源。可以通过暂时禁用自动均衡来集中资源完成手动迁移。
分析日志文件：查看MongoDB的日志文件，获取关于超时更详细的信息。日志可能提供线索指出是哪些特定的操作或条件导致了超时。
更新MongoDB版本：如果你使用的是较旧版本的MongoDB，考虑升级到最新稳定版。新版本可能包含对类似问题的修复或改进。
联系支持：如果上述方法无法解决问题，考虑联系MongoDB官方支持获取进一步帮助。

请注意，修改系统参数或进行重大配置更改前，务必确保已经备份了重要数据，并测试变更是否达到预期效果。