Nginx动态路由的新姿势：使用Go取代lua

[Envoy] -> [Nginx] -(2)--> [Service endpoint]"],[20,"\n","36:0"],[20," \\"],[20,"\n","36:0"],[20," (1) \\ (redis proto)"],[20,"\n","36:0"],[20," \\"],[20,"\n","36:0"],[20," -> [Go router]"],[20,"\n","36:0"],[20,"\n\n这个调用从公网进入，触发一个Envoy 节点，然后到一个Nginx节点.Nginx 节点(1) 询问路由器将请求送至何处。然后Nginx节点（2）将请求送至指定的服务端点。 \n\n\n"],[20,"\n","text-indent:\"1\""],[20,"实现"],[20,"\n","32:1"],[20,"我们在Go中建立了一个库来管理由Sidecar或Hashicorp的Memberlist库支持的一致性哈希。我们称之为Ringman库。然后，我们将该库强制接入Redeo库支持的Redis协议请求的服务中。\n \n这种方案只需要两个Redis命令：GET和SELECT。我们选择实现一些用于调试的的命令，其中包括INFO，可以用您想要的任何服务器状态进行回复。在两个必需的命令中，我们可以放心地忽略SELECT，这是用由于选择Redis DB以用于任何后续调用。我们只接受它，什么也不做。GET让所有的工作都很容易实现。以下是通过Redis和Redeo为Ringman端点提供服务的完整功能。 Nginx会传递它接收到的URL，然后从哈希环中返回端点。\n \n\n\n\nsrv.HandleFunc(\"get\", func(out *redeo.Responder, req *redeo.Request) error {"],[20,"\n","36:0"],[20,"\tif len(req.Args) != 1 {"],[20,"\n","36:0"],[20,"\t\treturn req.WrongNumberOfArgs()"],[20,"\n","36:0"],[20,"\t}"],[20,"\n","36:0"],[20,"\tnode, err := ringman.GetNode(req.Args[0])"],[20,"\n","36:0"],[20,"\tif err != nil {"],[20,"\n","36:0"],[20,"\t\tlog.Errorf(\"Error fetching key '%s': %s\", req.Args[0], err)"],[20,"\n","36:0"],[20,"\t\treturn err"],[20,"\n","36:0"],[20,"\t}"],[20,"\n\n","36:0"],[20,"\tout.WriteString(node)"],[20,"\n","36:0"],[20,"\treturn nil"],[20,"\n","36:0"],[20,"})"],[20,"\n","36:0"],[20,"\n这是Nginx使用以下配置调用：\n\n# NGiNX configuration for Go router proxy."],[20,"\n","36:0"],[20,"# Relies on the ngx_http_redis, nginx-eval modules,"],[20,"\n","36:0"],[20,"# and http_stub_status modules."],[20,"\n\n","36:0"],[20,"error_log /dev/stderr;"],[20,"\n","36:0"],[20,"pid /tmp/nginx.pid;"],[20,"\n","36:0"],[20,"daemon off;"],[20,"\n\n","36:0"],[20,"worker_processes 1;"],[20,"\n\n","36:0"],[20,"events {"],[20,"\n","36:0"],[20," worker_connections 1024;"],[20,"\n","36:0"],[20,"}"],[20,"\n\n","36:0"],[20,"http {"],[20,"\n","36:0"],[20," access_log /dev/stdout;"],[20,"\n\n","36:0"],[20," include mime.types;"],[20,"\n","36:0"],[20," default_type application/octet-stream;"],[20,"\n\n","36:0"],[20," sendfile off;"],[20,"\n","36:0"],[20," keepalive_timeout 65;"],[20,"\n\n","36:0"],[20," upstream redis_servers {"],[20,"\n","36:0"],[20," keepalive 10;"],[20,"\n\n","36:0"],[20," # Local (on-box) instance of our Go router"],[20,"\n","36:0"],[20," server services.nitro.us:10109;"],[20,"\n","36:0"],[20," }"],[20,"\n\n","36:0"],[20," server {"],[20,"\n","36:0"],[20," listen 8010;"],[20,"\n","36:0"],[20," server_name localhost;"],[20,"\n\n","36:0"],[20," resolver 127.0.0.1;"],[20,"\n\n","36:0"],[20," # Grab the filename/path and then rewrite to /proxy. Can't do the"],[20,"\n","36:0"],[20," # eval in this block because it can't handle a regex path."],[20,"\n","36:0"],[20," location ~* /documents/(.*) {"],[20,"\n","36:0"],[20," set $key $1;"],[20,"\n\n","36:0"],[20," rewrite ^ /proxy;"],[20,"\n","36:0"],[20," }"],[20,"\n\n","36:0"],[20," # Take the $key we set, do the Redis lookup and then set"],[20,"\n","36:0"],[20," # $target_host as the return value. Finally, proxy_pass"],[20,"\n","36:0"],[20," # to the URL formed from the pieces."],[20,"\n","36:0"],[20," location /proxy {"],[20,"\n","36:0"],[20," eval $target_host {"],[20,"\n","36:0"],[20," set $redis_key $key;"],[20,"\n","36:0"],[20," redis_pass redis_servers;"],[20,"\n","36:0"],[20," }"],[20,"\n\n","36:0"],[20," #add_header \"X-Debug-Proxy\" \"$uri -- $key -- $target_host\";"],[20,"\n\n","36:0"],[20," proxy_pass \"http://$target_host/documents/$key?$args\";"],[20,"\n","36:0"],[20," }"],[20,"\n\n","36:0"],[20," # Used to health check the service and to report basic statistics"],[20,"\n","36:0"],[20," # on the current load of the proxy service."],[20,"\n","36:0"],[20," location ~ ^/(status|health)$ {"],[20,"\n","36:0"],[20," stub_status on;"],[20,"\n","36:0"],[20," access_log off;"],[20,"\n","36:0"],[20," allow 10.0.0.0/8; # Allow anyone on private network"],[20,"\n","36:0"],[20," allow 172.16.0.0/12; # Allow anyone on Docker bridge network"],[20,"\n","36:0"],[20," allow 127.0.0.0/8; # Allow localhost"],[20,"\n","36:0"],[20," deny all;"],[20,"\n","36:0"],[20," }"],[20,"\n\n","36:0"],[20," error_page 500 502 503 504 /50x.html;"],[20,"\n","36:0"],[20," location = /50x.html {"],[20,"\n","36:0"],[20," root html;"],[20,"\n","36:0"],[20," }"],[20,"\n","36:0"],[20," }"],[20,"\n","36:0"],[20,"}"],[20,"\n","36:0"],[20,"我们调用Nginx和容器里的路由，让他们在同样的host上运行，这样我们就可以在其中实现较低成本的调用。\n \n以下是我们建立的Nginx:\n./configure --add-module=plugins/nginx-eval-module \\"],[20,"\n","36:0"],[20," --add-module=plugins/ngx_http_redis \\"],[20,"\n","36:0"],[20," --with-cpu-opt=generic \\"],[20,"\n","36:0"],[20," --with-http_stub_status_module \\"],[20,"\n","36:0"],[20," --with-cc-opt=\"-static -static-libgcc\" \\"],[20,"\n","36:0"],[20," --with-ld-opt=\"-static\" \\"],[20,"\n","36:0"],[20," --with-cpu-opt=generic"],[20,"\n","36:0"],[20," "],[20,"\n","36:0"],[20,"make -j8"],[20,"\n","36:0"],[20,"\n"],[20,"\n","text-indent:\"1\""],[20,"性能"],[20,"\n","32:1"],[20,"我们在自有环境中进行了细致的性能测试，我们看到，通过Redis协议从Nginx到Go路由器的平均响应时间大约为0.2-0.3ms。由于来自上游服务的响应时间的中值大约为70毫秒，所以这是可以忽略的延迟。\n一个更复杂的Nginx配置大概能够做更复杂的错误处理。服务一年后的可靠性非常好，性能一直很稳定。\n\n\n结束语"],[20,"\n","32:1"],[20,"\n如果您有类似需求，则可以复用大部分组件。只需按照上面的链接到实际的源代码。如果您有兴趣直接向Ringman添加对K8或Mesos的支持，我们会非常欢迎。\n \n这个解决方案听起来有点黑客，不过它最终成为我们基础设施的重要补充。希望它能帮助别人解决类似的问题。"]]" style="font-family: -webkit-standard;">

导语：在Nitro 中，我们需要一款专业的负载均衡器。经过一番研究之后，Mihai Todor和我使用Go构建了基于Nginx、Redis 协议的路由器解决方案，其中nginx负责所有繁重工作，路由器本身并不承载流量。这个解决方案过去一年在生产环境中运行顺畅。以下是我们所做的工作以及我们为什么那样做。

为什么

我们正在构建的新服务将位于负载均衡池之后，负责执行代价很高的计算任务，正因如此，我们需要做本地缓存。为了缓存优化，我们想尝试将相同资源的请求发送到同一主机上（如果这台主机是可用的)。

解决这个问题有很多现有方案，以下是一个不完全的清单列表：

利用cookie维护黏性session
利用Header
基于源IP的黏性
HTTP重定向到正确实例

这个服务在每个页面加载时将会被触发多次，因此出于性能的考虑， HTTP重定向方式并不可行。如果所有的入站请求都通过同样的负载均衡器，那么剩下的几种解决方案都可以正常工作。另一方面，如果你的前端是一个负载均衡器池，你需要能够在它们之间共享状态或实现复杂的路由逻辑。我们对当前需要在负载均衡器之间共享状态变更的设计并没有兴趣，因此我们为这个服务选择了更复杂的路由逻辑。

我们的架构

了解一下我们的设计架构也许能够帮你更好的理解我们的意图。

我们拥有一组前端负载均衡器，这些服务的实例被部署在Mesos, 以便根据服务规模和资源可用性进行进出控制。将主机和端口号列表放入负载均衡器中不是问题，这已经成为我们平台的核心。

因为一切都在Mesos上运行，并且我们拥一种简单的方式定义和部署服务，所以添加任何新服务都很简单。

在Mesos之上，我们在每处都运行着基于gossip的Sidecar来管理服务发现。我们的前端负载均衡器是由Lyft的Envoy组成 , 它背后由Sidecar的Envoy集成支持。这能满足大部分服务的需求。 Envoy主机运行在专用实例上，但所有的服务都根据需要，在主机之间迁移，由Mesos和Sigualarity调度器执行。

仍在考虑中的Mesos服务节点将拥有基于磁盘的本地缓存。

设计

看着这个问题我们下了决定，我们着实想要一种一致性哈稀环。我们可以让节点根据需要控制进出，只有那些节点所服务的请求才会被重新路由。剩下的所有节点将继续服务于任何公开的会话。我们可以很简单地通过Sidecar数据来支持一致性哈稀环 (你可以用Mesos 或k8s代替) 。 Sidecar健康检查节点，我们可以靠这些健康检查节点判断它们在Sidecar中是否工作正常。

然后，我们需要某种一致性哈稀方法将流量导入到正确的节点中。它需要接收每一个请求，识别问题资源，然后将请求传递给其他已经准备处理该资源的服务实例。

当然，资源识别可以简单的通过URL处理，并且任何负载均衡器能够将他们分开来处理简单的路由。所以我们只需要将他们与一致性哈稀关联起来，对此我们已经有一种解决方案。

你可以在nginx用lua那样做，也可在HAproxy中用lua 。在Nitro里，我们没有一个人是Lua 专家，并且显然没有库能够实现我们的需要。理想情况下，路由逻辑将在Go中实现， Go在我们的技术栈中是一门关键语言并且得到了很好的支持。

Nginx有着丰富的生态环境，跳脱常规的思路还引发了一些很有趣的nginx插件。这些插件中首选插件Valery Kholodko的nginx-eval-module。这个插件允许你从nginx到一个端点生成一个调用，并且将返回的结果评估为nginx的变量。在其他可能的作用中，这个插件的意义在于它允许您动态地决定哪个端点应该接收代理传递。这就是我们想要做的。你从Ngnix到某个地方生成一个调用，获取一个结果后，你可以根据返回的结果值生成路由决策。你可以使用HTTP服务实现该请求的接收方。该服务仅返回目标服务器端点的主机名和端口号的字符串。这个服务始终保持一致性哈希，并且告知Nginx 每个请求流量路由的位置，但是生成一个单独的HTTP请求，仍然有些笨重。整个预期的回复内容将会是字符串10.10.10.5:23453。通过HTTP，我们会在两个方向传递头部信息，这将大大超出响应正文的大小。

于是我开始研究Nginx支持的其他协议，发现memcache协议和redis协议它都支持。其中，对Go服务最友好的支持是Redis协议。所以那就是我们改进的方向。Nginx 中有两个Redis模块，有一个适合通过nginx-eval-module 使用。实现Redis Go语言最好的库是Redeo。Rodeo实现了一个极其简单的处理机制，非常类似于go标准库中的http包。任何redis协议命令将会包含一个handler函数，并且它的写法非常简单。相比Nginx插件，它能够处理更新版本的redis协议。于是，我摒弃了我的C技能，并补充了Nginx插件以使用最新的Redis协议编码。

于是，我们最新的解决方案是：

这个调用从公网进入，触发一个Envoy 节点，然后到一个Nginx节点.Nginx 节点(1) 询问路由器将请求送至何处。然后Nginx节点（2）将请求送至指定的服务端点。

实现

我们在Go中建立了一个库来管理由Sidecar或Hashicorp的Memberlist库支持的一致性哈希。我们称之为Ringman库。然后，我们将该库强制接入Redeo库支持的Redis协议请求的服务中。

这种方案只需要两个Redis命令：GET和SELECT。我们选择实现一些用于调试的的命令，其中包括INFO，可以用您想要的任何服务器状态进行回复。在两个必需的命令中，我们可以放心地忽略SELECT，这是用由于选择Redis DB以用于任何后续调用。我们只接受它，什么也不做。GET让所有的工作都很容易实现。以下是通过Redis和Redeo为Ringman端点提供服务的完整功能。 Nginx会传递它接收到的URL，然后从哈希环中返回端点。

这是Nginx使用以下配置调用：

我们调用Nginx和容器里的路由，让他们在同样的host上运行，这样我们就可以在其中实现较低成本的调用。

以下是我们建立的Nginx:

性能

我们在自有环境中进行了细致的性能测试，我们看到，通过Redis协议从Nginx到Go路由器的平均响应时间大约为0.2-0.3ms。由于来自上游服务的响应时间的中值大约为70毫秒，所以这是可以忽略的延迟。

一个更复杂的Nginx配置大概能够做更复杂的错误处理。服务运行了一年多可靠性非常好，性能一直很稳定。

结束语

如果您有类似需求，则可以复用大部分组件。只需按照上面的链接到实际的源代码。如果您有兴趣直接向Ringman添加对K8或Mesos的支持，我们会非常欢迎。

这个解决方案听起来有点黑客，不过它最终成为我们基础设施的重要补充。希望它能帮助别人解决类似的问题。

本文作者Karl Mathias，由王贺翻译。转载译文请注明出处，技术原创及架构实践文章，欢迎通过公众号菜单「联系我们」进行投稿。

相关阅读：

Service Mesh利器：NGINX将支持gRPC

快报 | Nginx在Web服务器市场份额达到33.3％，而Apache则低于50％

活动预告：

6 月 1 ~ 2 日，GIAC 全球互联网架构大会将于深圳举行。GIAC 是高可用架构技术社区推出的面向架构师、技术负责人及高端技术从业人员的技术架构大会。今年的 GIAC 已经有腾讯、阿里巴巴、百度、今日头条、科大讯飞、新浪微博、小米、美图、Oracle、链家、唯品会、京东、饿了么、美团点评、罗辑思维、ofo、旷视、LinkedIn、Pivotal等公司专家出席。

本期 GIAC 大会上，部分精彩的议题如下：

参加 GIAC，盘点2018最新技术。点击“阅读原文”了解大会更多详情

今天看啥 - 高品质阅读平台
本文地址：http://www.jintiankansha.me/t/NxE567kDTf