利用Telnet进行HTTP访问过程的协议分析

2019年4月8日 0条评论 1.92k次阅读 3人点赞 eumenides

本文详细介绍了一次Telnet进行HTTP访问的过程，并对该过程进行协议上的分析以及wireshark抓包分析。文章只是自己记录实验过程所作，内部若有问题还请各
路大神在评论区加以指正，如有问题也欢迎大家交流讨论。

涉及到的知识点有：

1.Telnet协议
2.三次握手流程
3.TCP协议字段详解
4.HTTP报文分片传输与重组
5.TCP的seq和ack变化过程
6.4次挥手的现实情况--简化版的3次挥手

今天才知道可以利用telnet进行http连接并发送请求，特此记录。

1.telnet协议

首先输入telnet 主机地址端口号，在本例中为telnet www.baidu.com 80

看到回显第一行就是正在尝试IP地址，该地址就是百度服务器地址。
进一步剖析内部原理如下：

telnet是一个应用层协议，基于TCP/
IP协议栈，在其与服务器沟通时，首先与服务器建立TCP连接，经历3次握手后发送HTTP请求，并通过TCP将回显发送回本地shell。

TCP协议为传输层协议，发送至服务器需要经过网络层和数据链路层。而经过网络层时需要知道目的地址，此时需要先通过DNS协议获取到百度的IP。

2.三次握手分析

所以在我们输入telnet www.baidu.com 80这条指令时，网络数据包如下图所示

这是3次握手的数据包，首先看第一个包。

1.本地IP为115.25.46.77，目的地址为220.181.112.244，协议为TCP

2.长度74(
包括以太网长度14，IP长度20，TCP长度40，TCP中加入了5个可选项，有MSS和Timestamps等)

3.源端口为40862，目的端口为80(刚才设置的)

4.seq=0,这是一个SYN请求，发送的seq是一种验证机制，需要对方发送seq+1的ack进行确认

5.窗口大小29200，指发送方请求的发送窗口为29200字节

6.载荷长度0，由于是请求报文，内部不携带数据，所以载荷长度为0

7.
最大分片大小1460字节，由于MTU限制每一个以太网帧的最大包长为1500字节，IP和TCP各占20字节，所以最大MSS为1460字节。需要强调的是，MTU并不
是数据链路的物理限制，而是一种逻辑限制，为的是能够得到迅速的响应。举个例子：如果线路速率是9600 b/s，而一个字节有8
bit，加上一个起始比特和一个停止比特，那么线路的速率就是960 B/s（字节/秒）。以这个速率传输一个1024字节的分组需要1066
ms。如果该链路同时运行着一个交互式程序和一个数据传输程序，那么通常来说必须等待一半时间（533ms）才能把交互式应用程序分组传输出去。假设交互的数据可以在数据
传输之前被发送，即将服务进行排队，交互型数据优先的算法，这种算法是不完善的，它不应该影响已经进入串行驱动程序的队列。因此MTU被设置为1500以平衡快速响应和最
大吞吐量之间的矛盾。

8.
SACK_perm是选择确认选项，为的是如果TCP收到乱序数据，发送重复ACK给对端，对端收到重复ACK后，会推测是哪个包产生的错误，在进行重传。如果乱序数据比
较零散，这种机制效率会很低，所以使用SACK选项可以告知发送方收到了哪些数据，发送方即可重传缺失部分，大大提高数据重传速度。

9.TSval和TSecr为时间戳选项，后者为响应时间。

10.WS为窗口扩大因子，只能在连接建立阶段确定。新的窗口值=
首部中定义的窗口值乘以2的（窗口扩大因子）的次方。
以上便是第一个包携带的信息，之后看第二个包。

1.
这个包与刚才第一个包IP地址和端口相反，包长也是74，标志位有SYN和ACK，只有ACK标志位为1时，ACK值才有效。

2.服务器接收到本机的SYN请求，返回ACK=1，并且发送一个seq为0给本机

3.窗口大小为8192字节。并设置其他MSS，SACK_PERM和WS参数。
第二个包对第一个包做出响应，返回seq=0，ack=1，这是第二次握手过程。第三个包如下：

1.与第一个包的IP地址和端口相同，也是本机发往服务器的数据包。

2.没有SYN标志位，只有ACK标识位，并返回seq=1，ack=1，最后建立连接。

3.
注意此时TCP包长仅为54字节，此包长属于最小TCP包长，没有任何可选项。因为刚才的两次握手已经将参数设置好。
此时经历三次握手，本地与服务器之间已经建立一条TCP连接。于是第二行回显为：connected to www.a.shifen.com.
接下来利用左侧ctrl+]来进入回显模式，再按一次回车进入输入模式，输入GET / HTTP/1.1,回车

再按一次回车便可得到回显

3.HTTP请求分片与重组

此时便收到了HTTP响应报文，来看一下wireshark包的情况

这是紧跟着三次握手的4个数据包，我们来分析一下
1.第一个包是带PSH标志位的TCP包，seq=1，ack=1，len=
16，这个报文和第三个报文组合起来是一个完整的HTTP请求，但只有第三个包是HTTP协议。
原以为HTTP请求并不一定需要全部按照HTTP协议发送，只需要有一个报文进行HTTP发送，剩下的报文按照HTTP报文中IP的分片标识重组便可得到完整HTTP请求
。
IP协议利用三个部分来确保分片重组：

a.标识位:
每一个不同的报文标识位都不相同，但若是一个报文的某一个片，其标识位都相同。例如标识位为2的数据包为分
片报文，不管分成多少片，它们的标识位都是2.

b.分片标志位(DF):
如果分片标志位为0，则说明该报文是某一个报文的片段，若标志位为1，则报文不分片，标识位不起作用

c.片内偏移:片内偏移值应该是前一个报文的长度+1。
但后来分析该数据包的时候发现，两个数据包的IP头部DF标志位都是1，说明不分片，那么他们两个应该是属于不同的报文，而且他们的标识位不同，第二个HTTP协议的报文
标识位是第一个TCP报文+1.
我就很纳闷这一点，上网搜索才知道，原来该分段并不是由网络层来进行的，而是应用层进行的，底层并不知道分段细节，因此底层会将其视为两个独立的数据报文进行传输。那么T
CP segment of a reassembled PDU是什么意思呢？字面意思是要重组的协议数据单元（PDU：Protocol Data
Unit）的TCP段，这里的分段是指：上层协议HTTP的应答由多个分段组成，每个分段都是TCP协议的。TCP本身没有分段的概念，它的sequence
number和acknowledge number 是使TCP是基于流的协议的支撑，TCP segment of a reassembled
PDU的出现是因为Wireshark分析了其上层的HTTP协议而给出的摘要，如果配置Wireshark不支持HTTP协议解析，则没有该提示，所有的报文都将成为独
立的报文进行传输，由应用层进行解释重组。(参考网址：https://www.cnblogs.com/yinghao1991/p/7532889.html)
。由于TCP是基于流的，利用seq和ack进行重组，所以应用层可以利用这一点对报文进行分段重组。

2.
HTTP报文共18字节，其中每一个字母和字符都需要一个字节，一个空格也是一个字节。看看我们的请求，GET / HTTP/1.1
数下来也就14个字节，还有4个字节在哪里呢？其实HTTP请求报文最后还有两个隐藏的字节，就是\r\n
\r\n是原来早先打字机时代的产物，一个是换行，一个是将指针挪到最左侧，现代已将这两个功能合并为回车键。所以我们进
行回车时其实发送的是两个字符\r\n,也就是0x0d和0x0a。而HTTP请求以两个\r\n作为结束，所以总共是18个字节。

3.
PSH位说明：PSH位是TCP头部的一个标志位，表明该报文直接被上传至进程，而不用延时等待下一个报文的到来。TCP为了减轻网络负担，并不是对每一个请求都发送一个
响应的。TCP收到第一个数据报文后，先将报文放入接收报文缓冲区，然后会等待一个短暂的延迟，若有另一个报文到达，则将两个报文同时发送给进程，然后立即回传一个ack
，ack为seq+两个报文的长度.
而有了PSH位，当设置了PSH位的报文到达时，将直接发送给进程进行处理，并立即回传ack报文。这也就是我们看到第二个数据包的由来，该数据包的ACK是17，正好是
1+16.

4.
然后第二个HTTP请求报文到达，服务器处理回传ACK报文，并将收到的两个TCP报文进行整合，对其做出响应。

之后的过程就是响应包的发送过程。

1.首先服务器向本地发送了2213字节的数据，此时服务器向本机发送的seq是1，ACK是19.
本机收到该数据后进行回传ACK报文，ACK=seq+len=1+2213=2214.

2.
虽然第一个包长为2267，但其数据载荷长度为2213，有54字节的头部长度，第二个包长为54，说明其不带有任何数据。

3.
观察本地传送窗口大小的增长，据观察，本地传送报文中窗口大小增长速度是一定的，每次增长2944，但有一个例外是第3146个报文，它仅增长了2816。这与TCP中w
indow size value相关，每次window size
value值都会增长23，而前文说过的WS是128，因此每一次窗口大小增长23*128.然而在第3146个报文时，window size value
只增长了22，所以仅增长2816。但是为何该值在该报文处出现下降却无法从数据包中得到答案，我猜想应该是本地的资源不足或是某些网络间的波动导致的。

4.在所有数据传输完成后，服务器返回了一个200
OK的响应。这里也是和请求一样，只有一个HTTP协议，剩下的都是TCP报文。说明HTTP发送报文时，先将报文载荷全部发送过去，最后再发送一个结束的标志，说明HT
TP报文的传输结束，然后接收端将该结束标志之前的所有TCP报文组合，得到完整的HTTP报文。

5.在接收到200
OK报文后，本机发送ACK响应告诉服务器报文已成功接收，下面的Continuation是我人为再次在Telnet端发送回车指令造成的，正好56字节。服务器接收到
该请求马上发送ACK响应，表明收到该请求。该ACK响应为60字节，但结尾字节都是00，毫无意义，目前并未知道为何会产生这种情况。

6.服务器解析刚才收到的HTTP请求，但是发现无法解析该请求，因此发送400状态码，并关闭连接。

7.关闭连接时有一个很重要的点，就是原本应该是4次挥手，为何只有3个报文？

4.4次挥手的简化

4次挥手的介绍

上图是一个完整的4次挥手的过程

1.第一次挥手：客户端
发送一个[FIN+ACK]，表示自己没有数据要发送了，想断开连接，并进入FIN_WAIT_1状态（不能再发送数据到服务端，但能够发送控制信息ACK到服务端）。

2.第二次挥手：服务端收到FIN后，知道不会再有数据从客户端传来，发送ACK进行确认，确认序号为收到序号+
1（与SYN相同，一个FIN占用一个序号），服务端进入CLOSE_WAIT状态。

3.
第三次挥手：服务端发送FIN给对方，表示自己没有数据要发送了，服务端进入LAST_ACK状态，然后直接断开TCP会话的连接，释放相应的资源。

4.
第四次挥手：客户端收到了服务端对FIN的ACK后，进入FIN_WAIT2状态（等待服务端完成资源释放的一系列工作：然后释放你为创建这个连接所分配的资源，并通知我
你关闭了）;
客户端收到了服务端的FIN信令后，进入TIMED_WAIT状态，并发送ACK确认消息。客户端在TIMED_WAIT状态下，等待2MSL一段时间，没有数据到来的，
就认为对面已经收到了自己发送的ACK并正确关闭了进入CLOSE状态，自己也断开了到服务端的TCP连接，释放所有资源。当服务端收到客户端的ACK回应后，会进入CL
OSE状态，并关闭本端的会话接口，释放相应资源。
上网查了很长时间，寻找合理的解释，想知道4次挥手中的2,
3次挥手是否能合并。然而所有的答案都说挥手是四次，并没有给出我要的答案。但是事实如此，就是当前网络设计时，为了加速释放资源，简化流程，第2次挥手和第3次挥手是可
以进行合并的。

就如本文中流量包所示，第1次挥手数据包到达时，服务器知道了客户端不会再发送请求，而本身也并没有数据正在发送，所以直接对于第一次挥手数据包应答FIN和ACK，然后
客户端收到后直接返回ack即可。那么4次挥手就简化成了3次挥手。

还有一点值得注意的就是FIN占用一个seq。可以从ack的变化中得到答案。

最开始客户端发送结束请求FIN和ACK报文，seq=15417，ack=21,
然后服务器收到请求，也回传FIN和ACK报文，此时的seq=
21，而ack变成了15418，并没有数据传送，但是seq加了1。照这样说客户端下次返回的ack应该是22才对，事实确实如此。

通过本次实验，深刻理解了HTTP报文传输的流程，再次加深对于TCP序列号以及3次握手和4次挥手过程的的理解。
路漫漫其修远兮，吾将上下而求索。

本作品采用知识共享署名-相同方式共享 4.0 国际许可协议进行许可

发表评论取消回复

要发表评论，您必须先登录。

个人学习记录