TCP(传输控制协议)简介
TCP是TCP/IP协议栈中的传输层协议,TCP称为面向字节流连接的和可靠的传输层协议。它给IP协议提供了面向连接的和可靠的服务。TCP与UDP不同,它允许发送和接收字节流形式的数据。为了使服务器和客户端以不同的速度产生和消费数据,TCP提供了发送和接收两个缓冲区。TCP提供全双工服务,数据同时能双向流动。每一方都有发送和接收两个缓冲区,可以双向发送数据。TCP在字节上加上一个递进的确认序列号来告诉接收者发送者期望收到的下一个字节,如果在规定时间内,没有收到关于这个包的确认响应,重新发送此包,这保证了TCP是一种可靠的传输层协议。TCP服务的可靠性
TCP通过下列方式来提供可靠性:1、数据被分割成TCP最适合发送的数据块,也就是最大报文段长度。当一个连接建立时,连接的双方都要通告各自的MSS(最大报文段长度)。
2、当TCP发出一个报文段后,它启动一个定时器,等待目的端确认收到这个报文段。如果不能及时收到一个确认将重发这个报文段。
3、当TCP收到发自TCP连接另一端的数据,它将发送一个确认,这个确认不是立即发送,通常将推迟几分之一秒,以便将ACK与需要沿该方向发送的数据一起发送。绝大多数实现采用的时延为200ms。
4、TCP将保持它首部和数据的检验和。这是一个端到端的检验和,目的是检测数据在传输过程中的任何变化。如果收到段的检验和有差错,TCP将丢弃这个报文段和不确认收到此报文段(希望发送端超时并重发)。
5、既然TCP报文段作为IP数据报来传输,因此TCP报文段的到达也可能会失序。TCP将对收到的数据进行重新排序,将数据以正确顺序交给应用层。
6、既然IP数据报会发生重复,TCP接收端必须丢弃重复的数据。
7、TCP还能提供流量控制。TCP连接的每一方都有固定大小的缓冲空间。TCP的接收端只允许另一端发送接收端缓冲区所能接纳的数据。这将防止较快主机致使较慢主机的缓冲区溢出。
TCP报文
TCP头部选项是一个可变长的信息,这部分最多包含40字节,因为TCP头部最长60字节,(其中还包含前面20字节的固定部分)。
16位源端口号:每个TCP报文都包含源端口号,用于寻找发端应用进程。这个值加上IP首部中的源端IP地址唯一确定一个TCP源地址。
16位目的端口号:每个TCP报文都包含目的端口号,用于寻找收端应用进程。这个值加上IP首部中的目的端IP地址唯一确定一个TCP目的地址。
32位序号:序号用来标识从TCP发端向TCP收端发送的数据字节流,它表示在这个报文段中的第一个数据字节。如果将字节流看作在两个应用程序间的单向流动,则TCP用序号对每个字节进行计数。序号是32bit的无符号数,序号到达最大后又从0开始。这个域包含惟一能标识TCP数据段数据的数字,它能让TCP接收方确认什么时候发生了通信流部分丢失。序号值按数据包中的数据大小增加。
32位确认序号:当建立一个新的连接时,SYN标记变1。序号字段包含由这个主机选择的该连接的初始序事情ISN。该主机要发送数据的第一个字节序号为这个ISN加1,因为SYN标志消耗了一个序号。
4位首部长度:首部长度给出首部中32bit字的数目。需要这个值是因为任选字段的长度是可变的。这个字段占4bit,因此TCP最多有60字节的首部。然而,没有任选字段,正常的长度是20字节。
保留:未使用。
URG(紧急):表明应该检查紧急指针域。如果设置它,紧急指针域告诉接收方应该从数据包的哪一部分开始读取字节。
ACK(确认):与确认号域相关。确认号是另一TCP端的下一个序号。
PSH(推动):忽略缓冲,直接把数据传送到高层。它用于对时间要求严格和单击应用程序中。如果接收到带有推动标识的数据包时,没有必要把数据保存到缓冲区,而直接到它传送给应用层协议。
RST(重置):关闭连接。它用来关闭整个连接,同时它也用来拒绝连接(不管什么原因)。
SYN(同步):使序号同步(握手进程)。用在握手进程中,表明发送方通知TCP另一端其序号。
FIN(结束):传送结束。它用来表明主机已完成传送,FIN标识本身并不能明确关闭连接。但是,如果两端都发送有FIN标识的TCP数据包,并且以适当的ACK回应,就会关闭连接。
16位窗口大小:TCP流量控制由连接的每一端通过声明的窗口大小来提供。窗口大小为字节数,起始于确认序号字段指明的值,这个值是接收端正期望接收的字节。窗口大小是一个16bit字段,因而窗口大小最大为65535字节。窗口大小为0表明发送方应该停止传送—接收方的TCP缓冲区已满。
16位校验和:检验和覆盖了整个的TCP报文段:TCP首部和TCP数据。这是一个强制性的字段,一定是由发端计算和存储,并由收端进行验证。它和UDP检验和的计算一样,需要一个伪首部。
16位紧急指针:只有当URG标志置1时紧急指针才有效。紧急指针是一个正的偏移量,和序号字段中的值相加表示紧急数据最后一个字节的序号。TCP紧急方式是发送端向另一端发送紧急数据的一种方式。
选项:最常见的可选字段是最长报文大小,又称为MSS(Maximum Segment Size)。每个连接方通常都在通信的第一个报文段(为建立连接而设置SYN标志的那个段)中指明这个选项。它指明本端所能接收的最大长度的报文段。
字段 | 含义 |
---|---|
URG (urgent) | 紧急指针是否有效。为1,表示某一位需要被优先处理 |
ACK (acknowledgement) | 确认号是否有效,一般置为1。 |
PSH (push ) | 提示接收端应用程序立即从TCP缓冲区把数据读走。 |
RST (restart) | 对方要求重新建立连接,复位。 |
SYN (synchronized) | 请求建立连接,并在其序列号的字段进行序列号的初始值设定。建立连接,设置为1 |
FIN (finally) | 希望断开连接。 |
TCP连接的建立(三次握手)
TCP是一个面向连接的协议,无论哪一方发送数据之前,都必须先在双方之间建立一条连接,这种连接是通过三次握手建立起来的。三次握手过程如下:
第一次握手:建立连接时,客户端A发送syn包(syn=x)到服务器B,并进入SYN_SENT状态,等待服务器B确认;SYN:同步序列编号(Synchronize Sequence Numbers)。
第二次握手:服务器B收到syn包,必须确认客户A的SYN(ack=x+1),同时自己也发送一个SYN包(syn=y),即SYN+ACK包,此时服务器进入SYN_RECV状态;
第三次握手:客户端A收到服务B的SYN+ACK包,向服务器B发送确认包ACK(ack=y+1),此包发送完毕,客户端A和服务器B进入ESTABLISHED(TCP连接成功)状态,完成三次握手。
synchronized sent 同步已发送
synchronized received 同步收到
established 已建立的
当握手进程没有成功完成最终的确认时就会发生半开放连接。半开放连接的过程如下:
主机A向主机B发送第1个数据包,也就是SYN数据包。
主机B发送ACK SYN数据包作为回应。
这时主机A应该发送第3个数据包,即ACK数据包来结束握手,但实际却没有发送第3个数据包,使得主机B一直发送ACK SYN数据包。
通常TCP连接的建立都是一方主动打开,而另一方则是被动打开,但两个应用程序同时彼此执行主动打开的情况是可能的,尽管发生的可能性极小。每一方必须发送一个SYN,且这些SYN必须传递给对方。这需要每一方使用一个对方熟知的端口作为本地端口,这被称为同时打开。 例如,主机A中的一个应用程序使用本地端口7000,并与本机B的端口8000执行主动打开。主机B的应用程序则使用本地端口8000,并与主机A的端口7000执行主动打开。它们仅建立一条连接而不两条连接,而且每一端既是客户机又是服务器。
TCP连接的终止(四次挥手)
第一次握手:
客户端A进程发出连接释放报文,并且停止发送数据。释放数据报文首部,FIN=1,其序列号为seq=u(u是前面已经传送过来的数据的最后一个字节的序号加1),此时客户端A进入FIN-WAIT-1(终止等待1)状态。
TCP规定,FIN报文段即使不携带数据,但是也要消耗一个序号。
第二次握手:
服务器B收到连接释放报文,发出确认报文,ACK=1,ack=u+1,并且带上自己的序列号seq=v,此时服务端就进入了CLOSE-WAIT(关闭等待)状态。TCP服务器通知高层的应用进程,客户端向服务器的方向就释放了,这时候处于半关闭状态,即客户端已经没有数据要发送了,但是服务器若发送数据,客户端依然要接受。这个状态还要持续一段时间,也就是整个CLOSE-WAIT状态持续的时间。
客户端A收到服务器的确认请求后,此时,客户端A就进入FIN-WAIT-2(终止等待2)状态,等待服务器B发送连接释放报文(在这之前还需要接受服务器B发送的最后的数据,这就是半关闭状态)。
第三次握手:
服务器B将最后的数据发送完毕后,就向客户端A发送连接释放报文,FIN=1,ack=u+1,由于在半关闭状态,服务器B很可能又发送了一些数据,假定此时的序列号为seq=w,此时,服务器B就进入了LAST-ACK(最后确认)状态,等待客户端A的确认。
第四次握手:
客户端A收到服务器的连接释放报文后,必须发出确认,ACK=1,ack=w+1,而自己的序列号是seq=u+1,此时,客户端A就进入了TIME-WAIT(时间等待)状态。
此时TCP连接并没有释放,需要经过2∗∗MSL(最长报文段寿命)的时间后,当客户端A撤销相应的TCB(线程控制块(Thread Control Block,TCB))后,才进入CLOSED状态。
因为在发送给服务器B最后一次报文,可能因为某些原因丢失了,服务器B没有收到回复,将不断重复发送FIN报文。所以客户端A不能立即关闭,它必须确认服务器B接收到了该ACK。
服务器只要收到了客户端发出的确认,立即进入CLOSED状态。同样,撤销TCB后,就结束了这次的TCP连接。
简说
1. 主机A(TCP客户端)发送一个FIN,用来关闭从主机A到主机B的传送 。
2. 当主机B(服务器)收到这个FIN,它发回一个ACK,确认序号为收到的序号加1 。
3. 主机B关闭它的连接,它的TCP端发送一个FIN 。
4. 主机A必须发回一个确认,并将确认序号设置为收到序号加1。
TCP提供了连续的一端在结束它的发送后还能接受来自另一端数据的能力。这就是半关闭。半关闭的过程如下:
主机A(TCP客户端)发送一个FIN。
当主机B(服务器)收到这个FIN,它发回一个ACK,确认序号为收到的序号加1 。
此时,主机B仍可发送数据,主机A仍然可以对数据发送ACK应答。
正常关闭是发送第一个FIN执行主动关闭,两方其实都可以主动关闭,同时发送FIN,这种情况就叫做同时关闭。
TCP正常的终止方式也称为有序释放。但也可以发送一个复位报文而不是FIN来结束连接,这称为异常释放,这有两个优点:1.应用程序丢弃待发数据,并立刻发送复位报文;2.复位报文的接收方会区分是异常释放还是正常关闭。复位报文还有一个用处:当连接请求到达时,目的端口没有监听进程,TCP就发送复位报文。
滑动窗口
为了实现流量控制,TCP使用一种滑动窗口协议。用这种方法,双方主机为每个连接使用一个窗口。窗口区间是缓冲区的一部分包含了一台主机在等待另一台主机的确认期间所能发送的字节数据。该窗口之所以称为滑动窗口,是因为它能随着数据和确认的发送和接收在整个缓冲区内滑动。
TCP的滑动窗口是面向字节的。滑动窗口的使用使传输效率更高,同时也能控制数据流量,使接收端不被数据所淹没。
滑动窗口流量控制基本原理
发送窗口:在任意时刻,发送方都维持一组连续的允许发送的帧的序号,称为发送窗口。
接收窗口:发送窗口用来对发送方进行流量控制,而发送窗口的大小 W 代表在还没有收到对方确认信息的情况下发送方最多还可以发送多少个数据帧。
在接收端设置接收窗口是为了控制可以接受哪些数据帧而不可以接收哪些帧。在接收方只有当收到的数据帧的序号落入接收窗口内才允许将该数据帧收下。若接收到的数据帧落在了接收窗口之外,则一律将其丢弃。
在发送端,每收到一个帧,发送窗口就向前滑动一个帧的位置,当发送窗口内没有可以发送的帧(即窗口内全部是已发送,但未接收到确认的帧),发送方就会停止发送,直到收到接收方发送的确认帧使窗口移动,窗口内有可以发送的帧,之后才开始继续发送。
状态转换图
为了记录TCP不同时期发生的所有不同事件,TCP软件实现为一个有限状态机,是指在有限个状态之间变化的机器。为了说明这个概念,我们使用状态转换图。
TCP有限状态机的状态转换过程如下:
拥塞控制
拥塞控制是网络或者接收方的负载过重。当网络发送的数据过多时就会发生网络过载,会使数据包丢失;当数据字节数大于接收方窗口大小时,接收方就会过载。
TCP提供4种拥塞控制机制来确保有效的利用带宽,并快速修复阻塞和错误,它们是:慢速启动,避免阻塞,快速重发,快速修复。
Wireshark抓的包