TCP连接状态详解以及故障排查

更新时间:2024-02-03 07:44:01 阅读量: 教育文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

我们通过了解TCP各个状态,可以排除和定位网络或系统故障时大有帮助。(总结网络上的内容)

1、TCP状态 linux查看tcp的状态命令:

1)、netstat -nat 查看TCP各个状态的数量 2)、lsof -i:port 可以检测到打开套接字的状况 3)、 sar -n SOCK 查看tcp创建的连接数

4)、tcpdump -iany tcp port 9000 对tcp端口为9000的进行抓包

LISTENING:侦听来自远方的TCP端口的连接请求.

首先服务端需要打开一个socket进行监听,状态为LISTEN。

有提供某种服务才会处于LISTENING状态,TCP状态变化就是某个端口的状态变化,提供一个服务就打开一个端口,例如:提供www服务默认开的是80端口,提供ftp服务默认的端口为21,当提供的服务没有被连接时就处于LISTENING状态。FTP服务启动后首先处于侦听(LISTENING)状态。处于侦听LISTENING状态时,该端口是开放的,等待连接,但还没有被连接。就像你房子的门已经敞开的,但还没有人进来。

看LISTENING状态最主要的是看本机开了哪些端口,这些端口都是哪个程序开的,关闭不必要的端口是保证安全的一个非常重要的方面,服务端口都对应一个服务(应用程序),停止该服务就关闭了该端口,例如要关闭21端口只要停止IIS服务中的FTP服务即可。关于这方面的知识请参阅其它文章。

如果你不幸中了服务端口的木马,木马也开个端口处于LISTENING状态。

SYN-SENT:客户端SYN_SENT状态:

再发送连接请求后等待匹配的连接请求:客户端通过应用程序调用connect进行

active open.于是客户端tcp发送一个SYN以请求建立一个连接.之后状态置为SYN_SENT. /*The socket is actively attempting to establish a connection. 在发送连接请求后等待匹配的连接请求 */

当请求连接时客户端首先要发送同步信号给要访问的机器,此时状态为SYN_SENT,如果连接成功了就变为ESTABLISHED,正常情况下SYN_SENT状态非常短暂。例如要访问网站http://www.http://m.wodefanwen.com/,如果是正常连接的话,用TCPView观察IEXPLORE.EXE(IE)建立的连接会发现很快从SYN_SENT变为ESTABLISHED,表示连接成功。SYN_SENT状态快的也许看不到。

如果发现有很多SYN_SENT出现,那一般有这么几种情况,一是你要访问的网站不存在或线路不好,二是用扫描软件扫描一个网段的机器,也会出出现很多SYN_SENT,另外就是可能中了病毒了,例如中了\冲击波\,病毒发作时会扫描其它机器,这样会有很多SYN_SENT出现。

SYN-RECEIVED:服务器端状态SYN_RCVD

再收到和发送一个连接请求后等待对方对连接请求的确认

当服务器收到客户端发送的同步信号时,将标志位ACK和SYN置1发送给客户端,此时服务器端处于SYN_RCVD状态,如果连接成功了就变为ESTABLISHED,正常情况下SYN_RCVD状态非常短暂。

如果发现有很多SYN_RCVD状态,那你的机器有可能被SYN Flood的DoS(拒绝服务攻击)攻击了。

SYN Flood的攻击原理是:

在进行三次握手时,攻击软件向被攻击的服务器发送SYN连接请求(握手的第一步),但是这个地址是伪造的,如攻击软件随机伪造了51.133.163.104、65.158.99.152等等地址。服务器在收到连接请求时将标志位ACK和SYN置1发送给客户端(握手的第二步),但是这些客户端的IP地址都是伪造的,服务器根本找不到客户机,也就是说握手的第三步不可能完成。

这种情况下服务器端一般会重试(再次发送SYN+ACK给客户端)并等待一段时间后丢弃这个未完成的连接,这段时间的长度我们称为SYN Timeout,一般来说这个时间是分钟的数量级(大约为30秒-2分钟);一个用户出现异常导致服务器的一个线程等待1分钟并不是什么很大的问题,但如果有一个恶意的攻击者大量模拟这种情况,服务器端将为了维护一个非常大的半连接列表而消耗非常多的资源----数以万计的半连接,即使是简单的保存并遍历也会消耗非常多的CPU时间和内存,何况还要不断对这个列表中的IP进行SYN+ACK的重试。此时从正常客户的角度看来,服务器失去响应,这种情况我们称做:服务器端受到了SYN Flood攻击(SYN洪水攻击)

ESTABLISHED:代表一个打开的连接。

ESTABLISHED状态是表示两台机器正在传输数据,观察这个状态最主要的就是看哪个程序正在处于ESTABLISHED状态。 服务器出现很多ESTABLISHED

状态: netstat -nat |grep 9502或者使

用lsof -i:9502可以检测到。

当客户端未主动close的时候就断开连接:即客户端发送的FIN丢失或未发送。

这时候若客户端断开的时候发送了FIN包,则服务端将会处于CLOSE_WAIT状态;

这时候若客户端断开的时候未发送FIN包,则服务端处还是显示ESTABLISHED状态;

结果客户端重新连接服务器。

而新连接上来的客户端(也就是刚才断掉的重新连上来了)在服务端肯定是ESTABLISHED; 如果客户端重复的上演这种情况,那么服务端将会出现大量的假的ESTABLISHED连接和CLOSE_WAIT连接。

最终结果就是新的其他客户端无法连接上来,但是利用netstat还是能看到一条连接已经建立,并显示ESTABLISHED,但始终无法进入程序代码。

FIN-WAIT-1:等待远程TCP连接中断请求,或先前的连接中断请求的确认

主动关闭(active close)端应用程序调用close,于是其TCP发出FIN请求主动关闭连接,之后进入FIN_WAIT1状态./* The socket is closed, and the connection is shutting down. 等待远程TCP的连接中断请求,或先前的连接中断请求的确认 */ 如果服务器出现shutdown再重启,使用netstat -nat查看,就会看到很多

FIN-WAIT-1的状态。就是因为服务器当前有很多客户端连接,直接关闭服务器后,无法接收到客户端的ACK。

FIN-WAIT-2:从远程TCP等待连接中断请求

主动关闭端接到ACK后,就进入了FIN-WAIT-2 ./* Connection is closed, and

the socket is waiting for a shutdown from the remote end. 从远程TCP等待连接中断请求 */

这就是著名的半关闭的状态了,这是在关闭连接时,客户端和服务器两次握手之后的状态。在这个状态下,应用程序还有接受数据的能力,但是已经无法发送数据,但是也有一种可能是,客户端一直处于FIN_WAIT_2状态,而服务器则一直处于WAIT_CLOSE状态,而直到应用层来决定关闭这个状态。

CLOSE-WAIT:等待从本地用户发来的连接中断请求

被动关闭(passive close)端TCP接到FIN后,就发出ACK以回应FIN请求(它的接收也作为文件结束符传递给上层应用程序),并进入CLOSE_WAIT. /* The

remote end has shut down, waiting for the socket to close. 等待从本地用户发来的连接中断请求 */

CLOSING:等待远程TCP对连接中断的确认

比较少见./* Both sockets are shut down but we still don't have all our data sent. 等待远程TCP对连接中断的确认 */

LAST-ACK:等待原来的发向远程TCP的连接中断请求的确认

被动关闭端一段时间后,接收到文件结束符的应用程序将调用CLOSE关闭连接。这导致它的TCP也发送一个 FIN,等待对方的ACK.就进入了LAST-ACK . /* The remote end has shut down, and the socket is closed. Waiting for acknowledgement. 等待原来发向远程TCP的连接中断请求的确认 */

使用并发压力测试的时候,突然断开压力测试客户端,服务器会看到很多LAST-ACK。

TIME-WAIT:等待足够的时间以确保远程TCP接收到连接中断请求的确认

在主动关闭端接收到FIN后,TCP就发送ACK包,并进入TIME-WAIT状态。/* The socket is waiting after close to handle

packets still in the network.等待足够的时间以确保远程TCP接收到连接中断请求的确认 */

TIME_WAIT等待状态,这个状态又叫做2MSL状态,说的是在TIME_WAIT2发送了最后一个ACK数据报以后,要进入TIME_WAIT状态,这个状态是防止最后一次握手的数据报没有传送到对方那里而准备的(注意这不是四次握手,这是第四次握手的保险状态)。这个状态在很大程度上保证了双方都可以正常结束,但是,问题也来了。

由于插口的2MSL状态(插口是IP和端口对的意思,socket),使得应用程序在2MSL时间内是无法再次使用同一个插口的,对于客户程序还好一些,但是对于服务程序,例如httpd,它总是要使用同一个端口来进行服务,而在2MSL时间内,启动httpd就会出现错误(插口被使用)。为了避免这个错误,服务器给出了一个平静时间的概念,这是说在2MSL时间内,虽然可以重新启动服务器,但是这个服务器还是要平静的等待2MSL时间的过去才能进行下一次连接。

CLOSED:没有任何连接状态

被动关闭端在接受到ACK包后,就进入了closed的状态。连接结束./* The socket is not being used. 没有任何连接状态

2、TCP状态迁移路线图 client/server两条路线讲述TCP状态迁移路线图:

这是一个看起来比较复杂的状态迁移图,因为它包含了两个部分---服务器的状态迁移和客户端的状态迁移,如果从某一个角度出发来看这个图,就会清晰许多,这里面的服务器和客户端都不是绝对的,发送数据的就是客户端,接受数据的就是服务器。

客户端应用程序的状态迁移图

客户端的状态可以用如下的流程来表示:

CLOSED->SYN_SENT->ESTABLISHED->FIN_WAIT_1->FIN_WAIT_2->TIME_WAIT->CLOSED

_ 101 ENETUNREACH_ Network is unreachable

网络不可达。Socket试图操作一个不可达的网络。这意味着local的软件知道没有路由到达远程的host。

_ 100 ENETDOWN__ Network is down

_ 99 EADDRNOTAVAIL Cannot assign requested address _ 98 EADDRINUSE_ Address already in use

_ 97 EAFNOSUPPORT Address family not supported by protocol _ 96 EPFNOSUPPORT Protocol family not supported _ 95 EOPNOTSUPP_ Operation not supported _ 94 ESOCKTNOSUPPORT Socket type not supported

Socket类型不支持。指定的socket类型在其address family中不支持。如可选选中选项SOCK_RAW,但实现并不支持SOCK_RAW sockets。

_ 93 EPROTONOSUPPORT Protocol not supported

不支持的协议。系统中没有安装标识的协议,或者是没有实现。如函数需要SOCK_DGRAM socket,但是标识了stream protocol.。

_ 92 ENOPROTOOPT_ Protocol not available

该错误不是一个 Socket 连接相关的错误。errno 给出该值可能由于,通过 getsockopt 系统调用来获得一个套接字的当前选项状态时,如果发现了系统不支持的选项参数就会引发该错误。

_ 91 EPROTOTYPE_ Protocol wrong type for socket

协议类型错误。标识了协议的Socket函数在不支持的socket上进行操作。如ARPA Internet UDP协议不能被标识为SOCK_STREAM socket类型。

_ 90 EMSGSIZE__ +Message too long 消息体太长。

发送到socket上的一个数据包大小比内部的消息缓冲区大,或者超过别的网络限制,或是用来接收数据包的缓冲区比数据包本身小。

_ 89 EDESTADDRREQ Destination address required 需要提供目的地址。

在一个socket上的操作需要提供地址。如往一个ADDR_ANY 地址上进行sendto操作会返回这个错误。

_ 88 ENOTSOCK__ Socket operation on non-socket 在非socket上执行socket操作。

_ 87 EUSERS___ Too many users _ 86 ESTRPIPE__ Streams pipe error

_ 85 ERESTART__ Interrupted system call should be restarted _ 84 EILSEQ___ Invalid or incomplete multibyte or wide character _ 83 ELIBEXEC__ Cannot exec a shared library directly _ 82 ELIBMAX___ Attempting to link in too many shared libraries _ 81 ELIBSCN___ .lib section in a.out corrupted _ 80 ELIBBAD___ Accessing a corrupted shared library _ 79 ELIBACC___ Can not access a needed shared library _ 78 EREMCHG___ Remote address changed _ 77 EBADFD___ File descriptor in bad state _ 76 ENOTUNIQ__ Name not unique on network _ 75 EOVERFLOW__ Value too large for defined data type _ 74 EBADMSG__ +Bad message _ 73 EDOTDOT___ RFS specific error _ 72 EMULTIHOP__ Multihop attempted _ 71 EPROTO___ Protocol error

_ 70 ECOMM____ Communication error on send _ 69 ESRMNT___ Srmount error _ 68 EADV____ Advertise error

_ 67 ENOLINK___ Link has been severed _ 66 EREMOTE___ Object is remote _ 65 ENOPKG___ Package not installed

_ 64 ENONET___ Machine is not on the network _ 63 ENOSR____ Out of streams resources _ 62 ETIME____ Timer expired _ 61 ENODATA___ No data available _ 60 ENOSTR___ Device not a stream _ 59 EBFONT___ Bad font file format _ 57 EBADSLT___ Invalid slot

_ 56 EBADRQC___ Invalid request code _ 55 ENOANO___ No anode _ 54 EXFULL___ Exchange full

_ 53 EBADR____ Invalid request descriptor _ 52 EBADE____ Invalid exchange _ 51 EL2HLT___ Level 2 halted

_ 50 ENOCSI___ No CSI structure available _ 49 EUNATCH___ Protocol driver not attached _ 48 ELNRNG___ Link number out of range _ 47 EL3RST___ Level 3 reset _ 46 EL3HLT___ Level 3 halted

_ 45 EL2NSYNC__ Level 2 not synchronized _ 44 ECHRNG___ Channel number out of range _ 43 EIDRM____ Identifier removed

_ 42 ENOMSG___ No message of desired type _ 40 ELOOP____ Too many levels of symbolic links _ 39 ENOTEMPTY_ +Directory not empty _ 38 ENOSYS___ +Function not implemented _ 37 ENOLCK___ +No locks available _ 36 ENAMETOOLONG +File name too long _ 35 EDEADLK__ +Resource deadlock avoided _ 34 ERANGE___ +Numerical result out of range _ 33 EDOM____ +Numerical argument out of domain _ 32 EPIPE___ +Broken pipe

接收端关闭(缓冲中没有多余的数据),但是发送端还在write:

1、Socket 关闭,但是socket号并没有置-1。继续在此socket上进行send和recv,就会返回这种错误。这个错误会引发SIGPIPE信号,系统会将产生此EPIPE错误的进程杀死。所以,一般在网络程序中,首先屏蔽此消息,以免发生不及时设置socket进程被杀死的情况。 2、write(..) on a socket that has been closed at the other end will cause a SIGPIPE.

3、错误被描述为“broken pipe”,即“管道破裂”,这种情况一般发生在客户进程不理会(或未及时处理)Socket 错误,继续向服务 TCP 写入更多数据时,内核将向客户进程发送

SIGPIPE 信号,该信号默认会使进程终止(此时该前台进程未进行 core dump)。结合上边的 ECONNRESET 错误可知,向一个 FIN_WAIT2 状态的服务 TCP(已 ACK 响应 FIN 分节)写入数据不成问题,但是写一个已接收了 RST 的 Socket 则是一个错误。

_ 31 EMLINK___ +Too many links _ 30 EROFS___ +Read-only file system _ 29 ESPIPE___ +Illegal seek

_ 28 ENOSPC___ +No space left on device _ 27 EFBIG___ +File too large _ 26 ETXTBSY___ Text file busy

_ 25 ENOTTY___ +Inappropriate ioctl for device _ 24 EMFILE___ +Too many open files

打开了太多的socket。对进程或者线程而言,每种实现方法都有一个最大的可用socket数目处理,或者是全局的,或者是局部的。

_ 23 ENFILE___ +Too many open files in system _ 22 EINVAL___ +Invalid argument

无效参数。提供的参数非法。有时也会与socket的当前状态相关,如一个socket并没有进入listening状态,此时调用accept,就会产生EINVAL错误。

_ 21 EISDIR___ +Is a directory _ 20 ENOTDIR__ +Not a directory _ 19 ENODEV___ +No such device _ 18 EXDEV___ +Invalid cross-device link _ 17 EEXIST___ +File exists

_ 16 EBUSY___ +Device or resource busy _ 15 ENOTBLK___ Block device required _ 14 EFAULT___ +Bad address地址错误 _ 13 EACCES___ +Permission denied

_ 12 ENOMEM___ +Cannot allocate memory _ 11 EAGAIN___ +Resource temporarily unavailable

在读数据的时候,没有数据在底层缓冲的时候会遇到,一般的处理是循环进行读操作,异步模式还会等待读事件的发生再读

1、Send返回值小于要发送的数据数目,会返回EAGAIN和EINTR。

2、recv 返回值小于请求的长度时说明缓冲区已经没有可读数据,但再读不一定会触发EAGAIN,有可能返回0表示TCP连接已被关闭。

3、当socket是非阻塞时,如返回此错误,表示写缓冲队列已满,可以做延时后再重试. 4、在Linux进行非阻塞的socket接收数据时经常出现Resource temporarily unavailable,errno代码为11(EAGAIN),表明在非阻塞模式下调用了阻塞操作,在该操作没有完成就返回这个错误,这个错误不会破坏socket的同步,不用管它,下次循环接着recv就可以。对非阻塞socket而言,EAGAIN不是一种错误。

_ 10 ECHILD___ +No child processes __ 9 EBADF___ +Bad file descriptor __ 8 ENOEXEC__ +Exec format error __ 7 E2BIG___ +Argument list too long __ 6 ENXIO___ +No such device or address __ 5 EIO____ +Input/output error

__ 4 EINTR___ +Interrupted system call

阻塞的操作被取消阻塞的调用打断。如设置了发送接收超时,就会遇到这种错误。 只能针对阻塞模式的socket。读,写阻塞的socket时,-1返回,错误号为INTR。另外,如果出现EINTR即errno为4,错误描述Interrupted system call,操作也应该继续。如果recv的返回值为0,那表明连接已经断开,接收操作也应该结束。

__ 3 ESRCH___ +No such process __ 2 ENOENT___ +No such file or directory __ 1 EPERM___ +Operation not permitted

本文来源:https://www.bwwdw.com/article/3vtw.html

Top