socket俗称套接字,应用程序的进程和进程的之间的沟通是通过套接字来进行的。
在python中,socket模块来创建套节字。
在同一台机器上,不同进程之间,通过进程号进行区分,但在不同的机器上,会存在相同的进程号,比如cenos7的PID为1的进程为systemd,在另外一个机器的centos7也是同样的,所以在网络环境下PID并不能唯一标识一个进程,比如主机A也有PID为1的进程,主机B也有PID为1的进程,但此问题,tcp/ip协议族已经帮我们解决了,网络层的ip地址可以唯一的确定一台主机,传输层的协议和端口可以唯一确定这台主机上的进程。这样利用三元组(ip+协议+端口)可以与其进程进行交互。
python socket编程思路
tcp服务端
1 | 创建socket [socket.socket(socket.AF_INET,socket.SOCK_STREAM)] |
tcp客户端
1 | 创建socket |
socket功能列表
socket(family,type[,protocal]) 使用给定的地址族、套接字类型、协议编号(默认为0)来创建套接字。
socket类型 | 描述 |
---|---|
socket.AF_UNIX | 只能够用于单一的Unix系统进程间通信 |
socket.AF_INET | 服务器之间网络通信 |
socket.AF_INET6 | IPv6 |
socket.SOCK_STREAM | 流式socket , for TCP |
socket.SOCK_DGRAM | 数据报式socket , for UDP |
socket.SOCK_RAW | 原始套接字,普通的套接字无法处理ICMP、IGMP等网络报文,而SOCK_RAW可以;其次,SOCK_RAW也可以处理特殊的IPv4报文;此外,利用原始套接字,可以通过IP_HDRINCL套接字选项由用户构造IP头 |
socket.SOCK_SEQPACKET | 可靠的连续数据包服务 |
创建TCP Socket: | s=socket.socket(socket.AF_INET,socket.SOCK_STREAM) |
创建UDP Socket: | s=socket.socket(socket.AF_INET,socket.SOCK_DGRAM) |
socket函数
服务端函数
socket函数 | 描述 |
---|---|
s.bind() | 将套接字绑定到地址, 在AF_INET下,以元组(host,port)的形式表示地址 |
s.listen(backlog) | 开始监听TCP传入连接。backlog指定在拒绝连接之前,操作系统可以挂起的最大连接数量。该值至少为1,大部分应用程序设为5就可以了。 |
s.accept() | 接受TCP连接并返回(conn,address),中conn是新的套接字对象,可以用来接收和发送数据。address是连接客户端的地址。 accept默认是阻塞,当有connect过来时才会打开 |
客户端socket函数
socket函数 | 描述 |
---|---|
s.connect(address) | 连接到address处的套接字。一般address的格式为元组(hostname,port),如果连接出错,返回socket.error错误。 |
s.connect_ex(adddress) | 功能与connect(address)相同,但是成功返回0,失败返回errno的值。 |
公共socket函数
socket函数 | 描述 |
---|---|
s.recv(bufsize[,flag]) | 接受TCP套接字的数据。数据以字符串形式返回,bufsize指定要接收的最大数据量。flag提供有关消息的其他信息,通常可以忽略。 |
s.send(string[,flag]) | 发送TCP数据。将string中的数据发送到连接的套接字。返回值是要发送的字节数量,该数量可能小于string的字节大小。 |
s.sendall(string[,flag]) | 完整发送TCP数据。将string中的数据发送到连接的套接字,但在返回之前会尝试发送所有数据。成 功返回None,失败则抛出异常。 |
s.recvfrom(bufsize[.flag]) | 接受UDP套接字的数据。与recv()类似,但返回值是(data,address)。其中data是包含接收数据的字符串,address是发送数据的套接字地址。 |
s.sendto(string[,flag],address) | 发送UDP数据。将数据发送到套接字,address是形式为(ipaddr,port)的元组,指定远程地址。返回值是发送的字节数。 |
s.close() | 关闭套接字。 |
s.getpeername() | 返回连接套接字的远程地址。返回值通常是元组(ipaddr,port)。 |
s.getsockname() | 返回套接字自己的地址。通常是一个元组(ipaddr,port) |
s.setsockopt(level,optname,value) | 设置给定套接字选项的值。 |
s.getsockopt(level,optname[.buflen]) | 返回套接字选项的值。 |
s.settimeout(timeout) | 设置套接字操作的超时期,timeout是一个浮点数,单位是秒值为None表示没有超时期。一般,超时期应该在刚创建套接字时设置,因为它们可能用于连接的操作(如connect()) |
s.fileno() | 返回套接字的文件描述符。 |
s.setblocking(flag) | 如果flag为0,则将套接字设为非阻塞模式,否则将套接字设为阻塞模式(默认值)。非阻塞模式下,如果调用recv()没有发现任何数据,或send()调用无法立即发送数据,那么将引起socket.error异常。 |
s.makefile() | 创建一个与该套接字相关连的文件 |
简单例子
server端
1、使用一个死循环while True:将会使server端一直处于监听状态。
2、children,addr=s.accept 将创建一个新的socket,这样原先的socket继续侦听,而新的socket将接收client端的数据,addr返回的是客户端的ip。那么问题来了,当客户端发送数据关联时是与哪个socket进行连接呢,首先我们需要知道的是客户端发送的数据有两种,一种是请求建立连接的,一种是已经建立好连接后的数据传输,就如上所说tcp/ip有接收缓存和发送缓存,当收到建立连接的请求时,则传给正在监听端口的socket调用accept,当收到连接好连接后的数据传输时,将输据放入接收缓冲区,这样当服务器需要读取数据时调用accept建立的新socket,的recv函数从接收缓冲区读取。
3、将socket.accept写在循环里面client新的连接一次将重新创建一个新的socket。
client端
1,s.recv(1024)一次最大接收1024字节
2, 当收到连接好连接后的数据传输时,将输据放入接收缓冲区,这样当服务器需要读取数据时调用accept建立的新socket,的recv函数从接收缓冲区读取。
输出
server端
client端
socket.recv()
tcp/ip socket在内核中都有一个接收缓冲区和发送缓冲区,当socket接收到数据时,并不是马上调用socket.recv(),而是将数据拷贝到socket中的接收缓冲区中,调用socket.recv()后就是将接收缓冲区的数据,移动到应用层的buff中,并返回。当接收窗口满了后发生的操作是,收端通知发端,停止发送。
socket.send()
socket.send()是将应用层的buff拷贝到tcp-socket的发送缓冲区中
UDP
server端
client
输出
server端
client端
socket实现tcp简单聊天
server端
需要注意的是这里的socket.accept()是写在while循怀外的,因为写在死循怀里,脚本一直在执行,client调用一次accept后就进入阻塞状态了,而client端用的还是旧的connect所以,如果写在循怀里,就是执行client后建立一个连接后只能进行一次对话,因为server端的accept又重新回到阻塞状态了,重新执行client生成一个新的connec又可以一次对话。
client端
结果
server端
client端
优化点:
1,目前程序没有多线程,IO复用,还是半双工状态,一次只能一个用户说话,一个发时,另一个只能收,server在说话,client就不能说。
参考链接
1 | http://www.oschina.net/question/12_76126?sort=default&p=1 |