阿里云国际-马尼拉机房-公网出口某个连接/状态阈值异常偏低-大家注意踩坑

听说这里有各大云厂商的客服,那就吐槽一下. 事情的起因是 23 日凌晨有同事反应, 从阿里云国际马尼拉机房访问 GCLB 的 https api 经常出现请求失败. 后来查了一下,网路延迟,traceroute 都正常. 然后搞了并发测试脚本, 120 并发, 3000 次请求, 在开始的 3 秒钟...
阿里云国际-马尼拉机房-公网出口某个连接/状态阈值异常偏低-大家注意踩坑
阿里云国际-马尼拉机房-公网出口某个连接/状态阈值异常偏低-大家注意踩坑

听说这里有各大云厂商的客服,那就吐槽一下.

事情的起因是 23 日凌晨有同事反应, 从阿里云国际马尼拉机房访问 GCLB 的 https api 经常出现请求失败.

后来查了一下,网路延迟,traceroute 都正常.

然后搞了并发测试脚本, 120 并发, 3000 次请求, 在开始的 3 秒钟一切正常,之后就开始连续的 tls handshake timeout .

这是 gclb 出问题了,不能吧.

然后在 AWS 新加坡机房 新建机器, 跑同一个测试脚本,连续 10 轮,未复现.

然后在 LightNode 马尼拉机房 新建机器, 跑同一个测试脚本,连续 10 轮,未复现.

开始是怀疑 GCLB 做了策略调整, 后来在 腾讯云新加坡机房新建节点,部署测试 https api, 结果挺有意思:

阿里云国际马尼拉机房=> 腾讯云新加坡 == tls handshake timeout

AWS 新加坡机房 => 腾讯云新加坡 == 一切正常

LightNode 马尼拉机房=> 腾讯云新加坡 == 一切正常

对比样本太少? 好的,测一下苹果的 hotspot 测试页: https://captive.apple.com/hotspot-detect.html 结果一样:

阿里云国际马尼拉机房=> 苹果的 hotspot == tls handshake timeout

AWS 新加坡机房 => 苹果的 hotspot == 一切正常

LightNode 马尼拉机房=> 苹果的 hotspot == 一切正常

阿里的客服或工程师,麻烦帮忙排查一下, 或者同学们要注意避坑了.

来源: V2EX - 技术查看原文