弄懂HTTP、Socket、TCP这几个概念

  • Socket本身不是属于计算机网络中的协议,更像是一个API
  • Socket是用于连接应用层和传输层,Socket可以使我们自己的应用跳过应用层,直接和TCP打交道,就可以实现自己的应用层协议
  • HTTP和TCP才是属于计算机网络中的协议
  • HTTP是属于应用层中的协议

网络传输的流程是自上而下的

Client和Server实现通信

Socket流程图

Client与Server流程图

Socket 类型

套接字格式:
socket(family,type[,protocal]) 使用给定的地址族、套接字类型、协议编号(默认为0)来创建套接字。

socket类型描述
socket.AF_UNIX只能够用于单一的Unix系统进程间通信
socket.AF_INET服务器之间网络通信
socket.AF_INET6IPv6
socket.SOCK_STREAM流式socket , for TCP
socket.SOCK_DGRAM数据报式socket , for UDP
socket.SOCK_RAW原始套接字,普通的套接字无法处理ICMP、IGMP等网络报文,而SOCK_RAW可以;其次,SOCK_RAW也可以处理特殊的IPv4报文;此外,利用原始套接字,可以通过IP_HDRINCL套接字选项由用户构造IP头。
socket.SOCK_SEQPACKET可靠的连续数据包服务
创建TCP Socket:s=socket.socket(socket.AF_INET,socket.SOCK_STREAM)
创建UDP Socket:s=socket.socket(socket.AF_INET,socket.SOCK_DGRAM)

Socket 函数

注意点:

  1. TCP发送数据时,已建立好TCP连接,所以不需要指定地址。UDP是面向无连接的,每次发送要指定是发给谁。
  2. 服务端与客户端不能直接发送列表,元组,字典。需要字符串化repr(data)。
socket函数描述
服务端socket函数
socket.bind(address)将套接字绑定到地址, 在AF_INET下,以元组(host,port)的形式表示地址.
socket.listen(backlog)开始监听TCP传入连接。backlog指定在拒绝连接之前,操作系统可以挂起的最大连接数量。该值至少为1,大部分应用程序设为5就可以了。
socket.accept()接受TCP连接并返回(conn,address),其中conn是新的套接字对象,可以用来接收和发送数据。address是连接客户端的地址。
客户端socket函数
socket.connect(address)连接到address处的套接字。一般address的格式为元组(hostname,port),如果连接出错,返回socket.error错误。
socket.connect_ex(adddress)功能与connect(address)相同,但是成功返回0,失败返回errno的值。
公共socket函数
socket.recv(bufsize[,flag])接受TCP套接字的数据。数据以字符串形式返回,bufsize指定要接收的最大数据量。flag提供有关消息的其他信息,通常可以忽略。
socket.send(string[,flag])发送TCP数据。将string中的数据发送到连接的套接字。返回值是要发送的字节数量,该数量可能小于string的字节大小。
socket.sendall(string[,flag])完整发送TCP数据。将string中的数据发送到连接的套接字,但在返回之前会尝试发送所有数据。成功返回None,失败则抛出异常。
socket.recvfrom(bufsize[.flag])接受UDP套接字的数据。与recv()类似,但返回值是(data,address)。其中data是包含接收数据的字符串,address是发送数据的套接字地址。
socket.sendto(string[,flag],address)发送UDP数据。将数据发送到套接字,address是形式为(ipaddr,port)的元组,指定远程地址。返回值是发送的字节数。
socket.close()关闭套接字
socket.getpeername()返回连接套接字的远程地址。返回值通常是元组(ipaddr,port)。
socket.getsockname()返回套接字自己的地址。通常是一个元组(ipaddr,port)
socket.setsockopt(level,optname,value)设置给定套接字选项的值。
socket.getsockopt(level,optname[.buflen])返回套接字选项的值。
socket.settimeout(timeout)设置套接字操作的超时期,timeout是一个浮点数,单位是秒。值为None表示没有超时期。一般,超时期应该在刚创建套接字时设置,因为它们可能用于连接的操作(如connect())
socket.gettimeout()返回当前超时期的值,单位是秒,如果没有设置超时期,则返回None。
socket.fileno()返回套接字的文件描述符。
socket.setblocking(flag)如果flag为0,则将套接字设为非阻塞模式,否则将套接字设为阻塞模式(默认值)。非阻塞模式下,如果调用recv()没有发现任何数据,或send()调用无法立即发送数据,那么将引起socket.error异常。
socket.makefile()创建一个与该套接字相关连的文件

Socket编程思路

TCP服务端:

  1. 创建套接字,绑定套接字到本地IP与端口 socket.socket(socket.AF_INET,socket.SOCK_STREAM) , s.bind()
  2. 开始监听连接 #s.listen()
  3. 进入循环,不断接受客户端的连接请求 #s.accept()
  4. 然后接收传来的数据,并发送给对方数据 #s.recv() , s.sendall()
  5. 传输完毕后,关闭套接字 #s.close()

TCP客户端:

  1. 创建套接字,连接远端地址
    # socket.socket(socket.AF_INET,socket.SOCK_STREAM) , s.connect()
  2. 连接后发送数据和接收数据 # s.sendall(), s.recv()
  3. 传输完毕后,关闭套接字 #s.close()

server与client之间通信的案例

server端

import socket

# 定义socket类型,网络通信,TCP
server = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
# 套接字绑定的IP与端口
server.bind(('0.0.0.0', 8000))
# 开始TCP监听
server.listen(1)
# 接受TCP连接,并返回新的套接字与IP地址
sock, addr = server.accept()

# 获取从客户端发送的数据
# 一次获取1k的数据
data = sock.recv(1024)
print(data.decode('utf8'))

# 返回给客户端数据
sock.send("hello {}".format(data.decode('utf8')).encode('utf8'))

# 关闭连接
server.close()
sock.close()

client端

import socket

# #定义socket类型,网络通信,TCP
client = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
# #要连接的IP与端口
client.connect(('127.0.0.1', 8000))
# 向服务端发送数据
client.send('baihuixin'.encode('utf8'))
# 把接收的数据定义为变量
data = client.recv(1024)
print(data.decode('utf8'))
# 关闭连接
client.close()

server输出的结果:baihuixin
client输出的结果:hello baihuixin

Socket实现聊天和多用户链接

在上面的案例中进行升级,实现一个server可以与多个client进行聊天

server端

import socket
import threading

# 定义socket类型,网络通信,TCP
server = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
# 套接字绑定的IP与端口
server.bind(('0.0.0.0', 8000))
# 开始TCP监听
server.listen(1)
# 接受TCP连接,并返回新的套接字与IP地址

def hand_sock(sock, addr):
    while True:
        # 获取从客户端发送的数据
        # 一次获取1k的数据
        data = sock.recv(1024)
        print(data.decode('utf8'))
        # 在终端输入要返回的消息
        re_data = input()
        # 返回给客户端数据
        sock.send(re_data.encode('utf8'))

while True:
    sock, addr = server.accept()
    # 使用多线程来接收多个用户的消息
    client_thread = threading.Thread(target=hand_sock, args=(sock, addr))
    client_thread.start()

client端

import socket

# #定义socket类型,网络通信,TCP
client = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
# #要连接的IP与端口
client.connect(('127.0.0.1', 8000))
while True:
    # 在终端输入要传输的数据
    re_data = input()
    # 向服务端发送数据
    client.send(re_data.encode('utf8'))
    # 把接收的数据定义为变量
    data = client.recv(1024)
    print(data.decode('utf8'))

Socket模拟HTTP请求

使用Socket模拟请求百度


import socket
# 使用urlparse解析url
from urllib.parse import urlparse

def get_url(url):
    """
    通过socket请求html
    """

    url = urlparse(url) # 解析url
    host = url.netloc # 获得域名
    path = url.path # 获得路径
    if path:
        path = '/'

    # 建立socket连接
    client = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
    client.connect((host, 80))

    client.send('GET {} HTTP/1.1\r\nHost:{}\r\nConnection:close\r\n\r\n'.format(path, host).encode('utf8'))

    # 解决如果一次返回的结果大于要接收数据的大小的问题
    data = b''
    while True:
        d = client.recv(1024)
        if d:
            data += d
        else:
            break

    # 转换格式
    data = data.decode('utf8')
    print(data)

    # 关闭连接
    client.close()

if __name__ == "__main__":
    get_url("https://www.baidu.com/")
Logo

CSDN联合极客时间,共同打造面向开发者的精品内容学习社区,助力成长!

更多推荐