Docker群集服务的间歇性连接错误

问题描述:

我在群集模式下的Ubuntu 16.04上使用Docker 1.13。我在端口80上发布了一个服务(三个副本)。尝试连接到服务时,我看到间歇性连接失败。最初服务运行正常,但一旦我们对服务运行一些负载测试,这些间歇性问题就变得非常普遍。错误率可能高达50-75%的请求失败,我的理论是在负载测试后,群集变得非常不稳定。Docker群集服务的间歇性连接错误

的设置由3个管理中心节点和3个工作节点。我在三个工作节点前面有一个负载均衡器,为了排除故障的目的,我正在使用淘汰过程,现在我正在尝试使用本地主机(不通过负载均衡器)访问该服务的工作节点上。在这一点上,我尝试了一切可以放弃的事情,归因于Docker Routing Mesh问题。

我使用的覆盖网络有明确的子网不与其他基础设施项目重叠。 Azure中的虚拟机位于单独的虚拟网络中。

我已验证了服务实例和使用命令须藤搬运工服务PS 我已登录到每个单独的工作节点运行并验证了容器/服务实例正在运行,并且健康使用命令须藤搬运工PS

如果您需要任何其他细节或建议,请让我知道。

谢谢!

我曾与内部部署的设置,在1.12.x也存在这个问题同样的问题。关于这个,有几个github issues。你应该削减社会一些松懈的时刻,他们正在做一个了不起的工作,群体是非常新的,非常容易设置。

我做了什么:

移到Kubernetesflanneld的覆盖网络,我的测试结果是目前看好。

+0

感谢您的回应!是的,毫无疑问,社区正在做一项了不起的工作。我只是想在没有解决方案的情况下得到确认,以便我们能够计划我们的计划,我们可以做些什么,或者迁移到Kubernetes,或者我可以做一些调整。 – isingh

+0

没问题,在找出各种相关的github问题后,我确实没有调试过这个问题,但是如果确实如此,请确保您为r日志文件创建了一个问题,以便社区可以修复它。 –