前往小程序,Get更优阅读体验!
立即前往
发布
社区首页 >专栏 >【计网】【计网】从零开始学习http协议 ---理解http重定向和请求方法

【计网】【计网】从零开始学习http协议 ---理解http重定向和请求方法

作者头像
叫我龙翔
发布2024-10-10 15:50:28
发布2024-10-10 15:50:28
14400
代码可运行
举报
运行总次数:0
代码可运行

去光荣地受伤,

去勇敢地痊愈自己。

--- 简嫃 《水问》---


1 知识回顾

前面两篇文章中我们学习并实现了http协议下的请求与应答:

  • http请求包括四个部分:请求行 , 报头 , 空行 , 请求正文。请求行中的URL是客户端想要获取的资源,这是对于服务器来说最重要的部分,服务器后续通过URL在网络根目录中搜索对应的资源,然后通过应答报文返回。
  • http应答包括四个部分:状态行 , 报头 , 空行 , 应答正文。应答正文中包含从服务器返回的实际内容,如HTML页面、图片或其他数据。
  • 请求与应答中的报头都是用于传输请求和应答的一些基础信息,以键值对的形式储存。

http协议作为通信协议,必然要支持序列化与反序列化。我们需要做的是服务器的操作,只需要进行请求的反序列化和应答的序列化就可以了,请求的序列化和应答的反序列化是浏览器(客户端)需要考虑的。要做到序列化和反序列化需要按照请求和应答的结构,从字符串中读取分离出来,具体操作可以参考之前的文章:

  1. 【计网】从零开始学习http协议 — http的请求与应答
  2. 【计网】从零开始学习http协议 — 通过http实现客户端交互

实现了http协议中服务器的序列化和反序列化,接下来就可以加入一些资源来供客户端获取。 对于状态行的http版本与http状态码,我们也有了初步的了解:

  1. http版本:浏览器和服务端需要互相告诉各自的版本号,进而做到对应的处理!因为http协议会不断更新,不能保证对方是否更新协议!
  2. http状态码:状态码是服务器做出应答时根据数据处理的情况返回给浏览器。每个状态码对应一种情况!

2 认识网络重定向

状态码中3XX是代表重定向的:

状态码

含义

301

Moved Permanently 永久重定向

302

Found 临时重定向

307

Temporary Redirect 临时重定向资源到新位置

308

Permanent Redirect 永久重定向资源到新位置

其中大部分使用301 302,307 308很少使用!我们介绍一下临时重定向和永久重定向。

首先,网络中的重定向和文件的重定向概念上比较类似。一般来说,我们访问对应的网址会直接找到对应的服务器进程。当这个服务器让课客户端重新进行请求另一个服务器时,此时就是重定向!

举个例子:学校南门口有一家非常好吃的饺子馆,小明经常去那里吃饭。后来因为道路施工问题,饺子馆搬到看学校北门口,并为了让老客户可以找到新地址,在原来门店贴上新地址。小明这天去了,看到了这个告示,就知道应该去北门口找到这家饺子馆,这就是重定向!以后小明在想去饺子馆应该去老地址还是新地址呢? 这就需要分两种情况:

  1. 如果饺子馆是临时搬到北门口,那么小明一个去原南门口的饺子馆看看,再来决定是否去北门口。
  2. 如果饺子馆是永久搬到北门口,那么下面不用犹豫,直接就去北门口就可以!

这里的两种情况就是临时重定向和永久重定向的区别:临时重定向只修改一次,下次客户端依然访问原网址。永久重定向会永久修改,下次客户端直接访问新地址!

实际应用中,也有实际的例子:

甲公司使用www.hello.com网址使用了很多年,积攒了很多用户。后来甲公司将公司网址改成了www.world.com 那么下一次老用户访问原网址时,对老客户进行重定向访问到新网址,并修改老客户中浏览器中的对应网址信息。这就是永久重定向!

永久重定向是给搜索引擎看的!每个搜索引擎都会抓取全国各个网站的网址信息,然后建立起键值对。每次搜索时就可以通过关键词搜索到对应的网站。这个抓取是不断进行的。当一个网站的网址永久更改时,在原网址设置重定向到新网址,客户端每次进到原网址都要进行一次重定向,每次都进行重定向就太麻烦了!所以浏览器发现永久重定向之后就会修改内部信息,下次就会直接访问到新网址!

我们可以在服务器中测试一下重定向! 我们在页面中加入一个测试重定向的链接,这个链接会请求/redir资源,这个资源实际上并不存在,只是用来进行是否进行重定向的判断依据!

这样点入链接之后,就会再次发送请求/redir这个资源,我们可以在处理时进行一个硬处理,当客户端访问这个资源时进行一个特殊处理:

代码语言:javascript
代码运行次数:0
复制
	if (hreq.Path() == "wwwroot/redir")
    {
        // 进行重定向
        LOG(DEBUG, "进行重定向!!!\n");
        std::string redir_path = "https://www.qq.com"; // 重定向的新地址
        resp.AddCode(302, _code_to_desc[302]);
        resp.AddHeader("Location", redir_path);
        // resp.AddBody(content);
    }
    else
    {
		//...
	}

这样进行序列化返回给浏览器之后,浏览器会自动识别,然后就跳转到新的网址中了!!!

非常好玩,这个现象就是重定向!!!

3 http请求方法

3.1 http常见请求方法

在http请求中有请求行,请求行中有一个参数:请求方法_method。这个请求方法到底是干什么用的呢?

http中有以下请求方法:

请求方法

方法说明

适配HTTP版本

GET

请求指定的资源。一般用于信息查询,不应产生副作用。

HTTP/1.0

POST

向指定的资源提交数据进行处理请求(例如提交表单或上传文件)。

HTTP/1.0

PUT

向指定资源位置上传其最新内容。

HTTP/1.0

DELETE

请求服务器删除Request-URI所标识的资源。

HTTP/1.0

HEAD

类似于GET请求,但响应体不会返回,用于获取报头信息。

HTTP/1.0

OPTIONS

用于描述目标资源的通信选项。

HTTP/1.1

TRACE

回显服务器收到的请求,主要用于测试或诊断。

HTTP/1.1

CONNECT

用于将连接改为管道方式的代理服务器。

HTTP/1.1

PATCH

对资源进行部分修改。

HTTP/1.1

其中最常见的就是GET方法和POST方法。 平时使用浏览器一般都是获取资源,就是进行GET。有时也会进行登录注册,这时会向服务器发送资源,就是进行POST!那么浏览器是如何进行呢? 我们可以在服务器中加入打印客户端请求方法,这样我们可以看到:

可以看到只要是获取资源都是使用的GET方法!

3.2 postman工具进行请求

那我们可以进行GET方法了,怎么进行POST方法呢?可以使用postman这个工具:

Postman提供了一个直观的界面来构建HTTP请求,包括设置请求头、请求体、认证等。 Postman允许用户发送各种HTTP请求(如GET, POST, PUT, DELETE等)到API端点,并检查响应。它支持测试脚本,可以自动验证响应数据。

我们通过postman快速创建http请求,使用POST方法发送。

这样服务器就得到了POST方法的请求。

GET方法不光可以获取数据,也可以向服务器发送数据。POST方法也可以向服务器推送数据! 我们可以在postman中加入两个键值对:

这样我们再次请求时,就会发现我们可以通过url向服务器进行传参了!

我们在使用POST方法试一试,POST方法需要再请求的正文中加入参数:

这样服务器会得到一个请求,这个请求正文中包含了传入的参数!

总结:

  • GET方法一般用来获取静态资源,也可以通过URL向服务器传递参数。
  • POST方法可以通过http请求的正文来进行参数的传递。
  • URL传参,参数的体量一定不大;正文传参,参数的体量可以很大!

3.3 处理GET和POST参数

但是在用户的实际使用中,用户不可能像POSTMAN一样可以手动选择请求方法,那么实际应用中,是通过前端的form表单完成GET和POST请求!

代码语言:javascript
代码运行次数:0
复制
    <div>
        <!-- 默认就是GET -->
        <form action="/login" method="POST">
            用户名: <input type="text" name="username" value="."><br>
            密码: <input type="password" name="userpasswd" value=""><br>
            <input type="submit" value="提交">
        </form>
    </div>

这里最后使用POST方法,因为使用GET方法,会将参数加入到URL中,这样其他人可以就能够看到用户和密码了,这样可不行!

那么服务器如何处理参数呢?这个action="/login" 又是什么含义呢?

当使用POST方法时,参数是写在正文中的,那么直接直接按照规则进行解析就可以了!

如果使用GET方法,参数是加在URL中的。如果不做处理,会影响我们后续的很多操作,所以需要对URL进行处理!将真正的URL提取出来,并在正文中储存参数!

代码语言:javascript
代码运行次数:0
复制
    // 解析参数 --- 忽略大小写进行比较
    if (strcasecmp(_method.c_str(), "GET") == 0)
    {
        //寻找 ?
        auto pos = _url.find(arg_sep);
        //包含?说明带参数
        if(pos != std::string::npos) 
        {
            _req_body_text = _url.substr(pos + arg_sep.size());
            _url.resize(pos);
        }
    }

这样不管是使用的什么方法传递的参数,我们都可以通过正文中获取参数了!

接下来我们来看action="/login",这个资源我们并不存在啊?这个action需要怎么处理呢?

我们在httpserver中加入一系列的服务名称与服务函数的哈希对应。

代码语言:javascript
代码运行次数:0
复制
using func_t = std::function<HttpResponse(HttpRequest)>;

std::unordered_map<std::string , func_t> server_list;
    void InsertService(const std::string servicename , func_t f)
    {
    	//加入网络根目录!
        std::string s = prefixpath + servicename;
        _server_list[s] = f;
    }

那么对于"/login"我们可以插入一个:

代码语言:javascript
代码运行次数:0
复制
hserver.InsertService("/login" , login);

那么服务器可以在处理请求之后,进行特殊处理。识别出来action是"/login"时,就可以去执行func_t函数,然后可以返回对应的应答!

代码语言:javascript
代码运行次数:0
复制
        if (hreq.Path() == "wwwroot/redir")
        {
            // 进行重定向
            LOG(DEBUG, "进行重定向!!!\n");
			//...
        }
        else if (!hreq.GetRequestBody().empty())
        {
            if (IsServiceExists(hreq.Path()))
            {
                resp = _server_list[hreq.Path()](hreq);
            }
        }

这样就实现了对action的处理!!!所以http不光可以处理静态资源,也可以处理函数!

我们就可以设计一个处理login的方法:

代码语言:javascript
代码运行次数:0
复制
HttpResponse Login(HttpRequest &req)
{
    HttpResponse resp;
    std::cout << "外部已经拿到了参数了: " << std::endl;
    req.GetRequestBody();
    std::cout << "####################### " << std::endl;
    resp.AddCode(200, "OK");
    resp.AddBody("<html><h1>result done!</h1></html>");

    // username=helloworld&userpasswd=123456
	//可以进行很多种的操作!
    // 1. pipe
    // 2. dup2
    // 3. fork();
    // 4. 其他进程执行 -> exec* -> python, PHP, 甚至是Java!

    return resp;
}

这样我们能处理不同的action了:

通过这种方式,我们可以通过回调函数func_t进行可以进行很多操作了:

  1. pipe创建管道
  2. dup2进行重定向
  3. fork创建子进程
  4. exec*系列进行进程替换

因为C++语言处理业务并不擅长,但是c++处理底层十分快速!所以我们可以通过管道或者新的进程将数据交给python或者java这样的web语言来处理,然后在将数据返回给服务器,服务器处理好之后将http应答交给客户端! 这样服务器中各种语言的关系我们也就大概了解了!!!

我们可以来看一个浏览器的实例:

其中的https://cn.bing.com/search?q=helloworld,我们可以大致了解其中的原理:

  1. /s应该就是search服务,告诉服务器去执行搜索服务,这个服务不确定是什么语言进行的!
  2. 参数q=helloworld,是使用GET方法传给服务器的!也就是我们要搜索的内容!

通过F12查看页面信息我们也能找到对应的form表单:

这里的action就是/search

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2024-10-09,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 1 知识回顾
  • 2 认识网络重定向
  • 3 http请求方法
    • 3.1 http常见请求方法
    • 3.2 postman工具进行请求
    • 3.3 处理GET和POST参数
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档