首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

浅析HTTP代理原理-吴会森

最近由于行内系统向往访问需要通过代理访问,通过在网上查找资料,个人感觉这个写的比较不错,分享给大家。

本文主要介绍代理的事例,分析一个真实的案例来帮助理解HTTP代理的原理。

HTTP代理的原理

下面分析一个 http://iflow.uczzd.cn/iflow/api/v1/client_event?app=uc-iflow...经过代理服务器的HTTP请求。 iflow.uczzd.cn的公网IP是140.205.136.82(各地测试到的IP有可能不同),我的局域网IP是192.168.100.115,代理服务器的IP是192.168.16.35。

再简单说一下HTTP请求的流程: 192.168.100.115向140.205.136.82发送HTTP请求,其中192.168.16.35是代理服务器。

一、 监控请求

通过网络监控获取到的HTTP请求如下:

网络监控HTTP请求

可以看到在网络监控中,有两个HTTP请求,一个是向代理服务器发送的HTTP,另一个是代理服务器想目标服务器发送的HTTP请求。这两个请求的请求体是一样的,如下图:

客户端向代理服务器发送的HTTP报文:

发向Proxy服务器

代理服务器想目标服务器发送的HTTP报文:

发向目标服务器

二、 推测处理流程

可以看到,两张图片的HTTP报文是相同的(也有可能Header不同),我们可以推测出客户端和代理服务器的处理流程,如下:

客户端的处理流程:

客户端的处理流程

代理服务器的处理流程:

代理服务器的处理流程

三、 验证推测的处理流程

在推测出客户端和代理服务器的处理逻辑后,我们需要验证我们的推测是否正确。

我们可以构造一个TCP请求,客户端连接到代理服务器,发送HTTP报文,报文的内容是客户端直接发送到服务器的内容。

例如:直接访问 http://www.cnblogs.com/tgwang/的HTTP报文是:

GET http://www.cnblogs.com/tgwang/ HTTP/1.1Host: www.cnblogs.com Connection: closeAccept: text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,*/*;q=0.8Upgrade-Insecure-Requests: 1 User-Agent: Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/47.0.2526.111 Safari/537.36Referer: http://www.cnblogs.com/Accept-Encoding: gzip, deflate, sdchAccept-Language: zh-CN,zh;q=0.8 Cookie: *** If-Modified-Since: Sat, 30 Jan 2016 02:48:23 GMT

我们构造一个TCP请求,连接代理服务器,报文的内容也是发送上面的报文,看代理服务器能否正常请求博客园的数据,如果可以正常请求,说明我们对于客户端和代理服务器推测是正确的,如果没有请求博客园数据,而是返回代理服务器的相关信息,表示推测错误。

下面我使用python向代理服务器127.0.0.1:8888发送一个TCP请求,为了在代理服务器中能找到此请求,我在Header中增加了一个Token,使用UUID标识(见红框)。

Python发送HTTP请求

运行程序,发送TCP请求,报文如下:

proxy请求报文

查看代理服务器的信息,可知,HTTP请求正常发送到博客园,并且正常响应,如下图:

代理服务器监控

到此推测验证完成,符合预期结果。

  • 发表于:
  • 原文链接http://kuaibao.qq.com/s/20171218B06W1P00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券