Python中国社区  »  Python

用Python3来实现一个简单的Web服务器

孜然sun1487212641000 • 3 月前 • 169 次点击  

写在开始之前

什么是Web服务器?

Web服务器,顾名思义就是提供 Web 服务的服务器,我们这里要做的,确切的说应该是服务器程序

为什么要写Web服务器?

Just for fun
享受动手的乐趣

看懂本文章需要哪些基础?

    • 可以看懂python3的基本语法

正式开始

import socket

# 服务端口
try:
    HttpPort = int(input('Please input the server port, default port is 9420:'))
except Exception as e:
    HttpPort = 9420

# 地址信息
HttpHost = ('localhost', HttpPort)
# 返回的头部信息
HttpResponseHeader = '''HTTP/1.1 200 OK
Content-Type: text/html

'''

HttpResponseBody = ''
# 新的socket
ListenSocket = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
# ListenSocket绑定与监听
ListenSocket.bind(HttpHost)
ListenSocket.listen(100)

# 报头与报文分隔符
LineSeparator = '\r\n\r\n'

print('The server is running on port %d' % HttpPort)
print('The url is http://localhost:%d' % HttpPort)

while True:
    HttpResponseBody = 'Hi : )'
    Client, Address = ListenSocket.accept()
    Request = Client.recv(1024).decode(encoding='utf-8')
    Client.sendall((HttpResponseHeader + HttpResponseBody).encode(encoding='utf-8'))
    Client.close()

这,什么都没说,上来就上代码,是不是不太合适啊?我们先来试验一下效果,然后再来理解这段代码是如何工作的。

我们将以上代码保存为文件web_server.py,并在终端中运行python web_server.py
然后输入服务器端口号,然后打开复制下面的URL并粘贴到浏览器中进行访问,可以看一下效果


大家会注意到最上面的impoet socket,也就是说,我们这里需要使用socket包来完成我们的服务器程序。

首先建立一个socket,绑定到我们机器的一个端口,在这里我将默认端口设置为9420,然后开始监听该端口。
接下来是一个循环,每次都接受一个socket链接,然后将客户端的信息保存起来,Client就是对应客户端的绑定,之后我们向该客户端发送一些数据并断掉关闭链接,然后接受下一个客户端请求。

不是说web服务器吗?说了半天也没见提到web,倒一直在讲socket,那socket又是什么呢?

我们可以把socket理解为TCP/IP协议族的上层实现,也就是说,有了标准,但是标准只是标准,标准是用来指导和规定的,还是需要具体的实现,这里socket就是这种标准的实现,我们这篇文章所说的web服务器主要是HTTP,不再说HTTPS,web socket以及其他。

HTTP是基于TCP协议的,只是对TCP加了一部分属性并进行了进一步抽象和封装,也就是说我们使用HTTP进行数据传输的时候,TCP也是正在连接着的,在连接的过程中我们需要用到socket。

HTTP 请求与响应,都是头部加主题的形式,头部与主题是由一个空行隔开,这里也是我们分割的依据。
感兴趣的朋友可以参考一下MDN文档,首先浏览器向服务器发送一个请求,然后服务器会收到请求,然后返回给浏览器一段文本,浏览器就会解析该文本然后给我们展现出来。

我们的HttpResponse就是需要返回给客户端的头信息,如果没有这些,浏览器也就不会解析,也就相当于这是一个无效的回应。

虽然说是简单的服务器,但是这实在是太简单了,除了一个Hi就不再有别的东西了,那你可以试着更改一下浏览器中的url,你会发现,服务器只会返回来一个Hi,所以让我们来看一下下一节吧。

小修小补

嗯,之前实现的除了Hi 之外,别的功能都没有实现,我们仅仅实现了get,接下来,我们实现获取用户请求的参数,获取用户的请求头,用户的请求方法以及post表单的获取
依然,直接上代码。

import socket


# 服务端口
try:
    HttpPort = int(input('Please input the server port, default port is 9420:'))
except Exception as e:
    HttpPort = 9420

# 地址信息
HttpHost = ('localhost', HttpPort)

# 返回的头部信息
HttpResponseHeader = '''HTTP/1.1 200 OK
Content-Type: text/html

'''

HttpResponseBody = ''
# 新的socket
ListenSocket = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
# ListenSocket绑定与监听
ListenSocket.bind(HttpHost)
ListenSocket.listen(100)
# 报头与报文分隔符
LineSeparator = '\r\n\r\n'

print('The server is running on port %d' % HttpPort)
print('The url is http://localhost:%d' % HttpPort)


# 获取请求报头
def get_headers(request):
    # 分隔符切割
    headers_arr = request.split('\r\n')
    # 第一行是请求方法方法 请求路径 HTTP协议版本
    headers = {}
    for item__ in headers_arr[1:]:
        item_ = item__.split(': ')
        headers[item_[0]] = item_[1]
    return headers


# 获取POST表单参数
def get_post_args(request_body):
    post_args_arr = request_body.split('&')
    post_args = {}
    for item__ in post_args_arr:
        item_ = item__.split('=')
        post_args[item_[0]] = item_[1]
    return post_args


while True:
    # 监听链接
    Client, Address = ListenSocket.accept()
    # 接收用户传输的数据
    Request = Client.recv(1024).decode(encoding='utf-8')
    # 将用户请求切割为报头 主体
    RequestText = Request.split(LineSeparator)
    # 报头
    RequestHeader = RequestText[0]
    # 主体
    RequestBody = RequestText[1]
    # 请求方法
    RequestMethod = RequestHeader.split(' ')[0]
    # 请求的路径
    RequestUrl = RequestHeader.split(' ')[1]
    # 头部信息
    RequestHeaders = get_headers(RequestHeader)
    # 返回主体
    HttpResponseBody = ''

    print(Request)

    # GET方法的处理
    if RequestMethod == 'GET':
        HttpResponseBody += '<html>'
        HttpResponseBody += 'Your method is GET and your request url is ' + RequestUrl + '<br>'
        HttpResponseBody += 'Following are you headers :<br>********************************************<br>'

        for item in RequestHeaders.items():
            HttpResponseBody += ('<list>' + item[0] + ' => ' + item[1] + '</list><br>')

        HttpResponseBody += '<br><br>The next is post test <br>'

        HttpResponseBody += '''
        <form action="/" method="post">
        <p>Text1: <input type="text" name="Text1" /></p>
        <p>Text2: <input type="text" name="Text2" /></p>
        <input type="submit" value="Submit" />
        </form>
        '''
        HttpResponseBody += '</html>'

    # POST方法的处理
    elif RequestMethod == 'POST':
        HttpResponseBody += '<html>'
        HttpResponseBody += 'Your method is POST and your request url is ' + RequestUrl + '<br>'
        HttpResponseBody += 'Following are your headers :<br>********************************************<br>'

        for item in RequestHeaders.items():
            HttpResponseBody += ('<list>' + item[0] + ' => ' + item[1] + '</list><br>')

        HttpResponseBody += 'Following is your form :<br>********************************************<br>'

        PostArgs = get_post_args(RequestBody)

        for item in PostArgs.items():
            HttpResponseBody += ('<list>' + item[0] + ' => ' + item[1] + '</list><br>')

        HttpResponseBody += '<br><br>The next is get test <br>'

        HttpResponseBody += '<a href="http://' + RequestHeaders['Host'] + '/">get test</a>'
        HttpResponseBody += '</html>'

    # 暂时未支持的其他方法
    else:
        HttpResponseBody += '<html>'
        HttpResponseBody += 'So sorry this method is not support :('
        HttpResponseBody += '</html>'

    Client.sendall((HttpResponseHeader + HttpResponseBody).encode(encoding='utf-8'))
    Client.close()

直接从30行增加到120行,代码量有点多,不要担心,我们一起来看一下。

我们这里与上一节相比,增加了来两个函数,一个是来获取用户的请求头,另一个是来获取用户所提交的表单。

请求头格式如下:

GET / HTTP/1.1
Accept: text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8
Accept-Encoding: gzip, deflate
Accept-Language: zh-CN,zh;q=0.8,zh-TW;q=0.7,zh-HK;q=0.5,en-US;q=0.3,en;q=0.2
Cache-Control: max-age=0
Connection: keep-alive
Host: localhost:9420
Referer: http://localhost:9420/
Upgrade-Insecure-Requests: 1
User-Agent: Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:59.0) Gecko/20100101 Firefox/59.0

我们根据此格式进行分割并作为响应给浏览器

POST 请求方法提交的不限于文本,我们这里只实现了简单的表单提交,POST提交的表单是在请求的Body中的,我们进行分割,并根据其格式来解析出来,并作为相应返回给浏览器,GET请求

POST请求并获取POST表单参数

我们实现的GET返回下面会有一个POST测试,POST提交之后,返回的新网页下面有一个GET测试,这一节不算很难,大家可以打开浏览器,chrome 或者 firefox 用f12打开开发者窗口,来观察一下传输的信息,来看看下一小节。

再进一步

我们的服务器相应的网页都是写在服务器代码中的,换一个网页还得修改服务器代码,太不方便啦,于情于理,这么做都不合适,所以这次我们试试将html文件发送给用户,并实现图片的传输。

import socket

# 服务端口
try:
    HttpPort = int(input('Please input the server port, default port is 9420:'))
except Exception as e:
    HttpPort = 9420

# 地址信息
HttpHost = ('localhost', HttpPort)

# 返回的头部信息
HttpHtmlResponseHeader = '''HTTP/1.1 200 OK
Content-Type: text/html

'''

HttpImageResponseHeader = '''HTTP/1.1 200 OK
Content-Type: image/jpg

'''

HttpResponseBody = ''
HttpResponse = ''.encode(encoding='utf-8')

# 新的socket
ListenSocket = socket.socket(socket.AF_INET, socket.SOCK_STREAM)

# ListenSocket绑定与监听
ListenSocket.bind(HttpHost)
ListenSocket.listen(100)

# 报头与报文分隔符
LineSeparator = '\r\n\r\n'

print('The server is running on port %d' % HttpPort)

print('The url is http://localhost:%d' % HttpPort)


# 获取请求报头
def get_headers(request):
    # 分隔符切割
    headers_arr = request.split('\r\n')
    # 第一行是请求方法方法 请求路径 HTTP协议版本
    headers = {}
    for item__ in headers_arr[1:]:
        item_ = item__.split(': ')
        headers[item_[0]] = item_[1]
    return headers


# 获取POST表单参数
def get_post_args(request_body):
    post_args_arr = request_body.split('&')
    post_args = {}
    for item__ in post_args_arr:
        item_ = item__.split('=')
        post_args[item_[0]] = item_[1]
    return post_args


while True:
    # 监听链接
    Client, Address = ListenSocket.accept()
    # 接收用户传输的数据
    Request = Client.recv(1024).decode(encoding='utf-8')
    # 将用户请求切割为报头 主体
    RequestText = Request.split(LineSeparator)
    # 报头
    RequestHeader = RequestText[0]
    # 主体
    RequestBody = RequestText[1]
    # 请求方法
    RequestMethod = RequestHeader.split(' ')[0]
    # 请求的路径
    RequestUrl = RequestHeader.split(' ')[1]
    # 头部信息
    RequestHeaders = get_headers(RequestHeader)
    # 返回主体
    HttpResponseBody = ''
    HttpResponse = ''.encode(encoding='utf-8')

    # GET方法的处理
    if RequestMethod == 'GET':

        # 目录
        if RequestUrl[-1] == '/':
            # 如果该Url最后一个字符是/,就将该目录下的index.html返回
            RequestUrl += 'index.html'
        print(RequestUrl)

        # 网页
        if RequestUrl.split('.')[-1] == 'html':
            try:
                # 读取本地文件
                res = open('.' + RequestUrl, 'rb')
                StaticHtml = res.read()
                HttpResponse += HttpHtmlResponseHeader.encode(encoding='utf-8')
                HttpResponse += (HttpResponseBody.encode(encoding='utf-8') + StaticHtml)
                res.close()
            except Exception:
                HttpResponse += HttpHtmlResponseHeader.encode(encoding='utf-8')
                HttpResponse += '<html><br>ERROR !<br></html>'.encode(encoding='utf-8')
        # 图片
        elif RequestUrl.split('.')[-1] == 'jpg':
            try:
                res = open('.' + RequestUrl, 'rb')
                ImageFile = res.read()
                HttpResponse += HttpImageResponseHeader.encode(encoding='utf-8')
                HttpResponse += (HttpResponseBody.encode(encoding='utf-8') + ImageFile)
                res.close()
            except Exception:
                HttpResponse += HttpImageResponseHeader.encode(encoding='utf-8')
                HttpResponse += ''.encode(encoding='utf-8')

        HttpResponse += '<br><br>The next is post test <br>'.encode(encoding='utf-8')

        HttpResponse += '''
        <form action="/" method="post">
        <p>Text1: <input type="text" name="Text1" /></p>
        <p>Text2: <input type="text" name="Text2" /></p>
        <input type="submit" value="Submit" />
        </form>
        '''.encode(encoding='utf-8')

    # POST方法的处理
    elif RequestMethod == 'POST':
        HttpResponseBody += '<html>'
        HttpResponseBody += 'Your method is POST and your request url is ' + RequestUrl + '<br>'
        HttpResponseBody += 'Following are your headers :<br>********************************************<br>'

        for item in RequestHeaders.items():
            HttpResponseBody += ('<list>' + item[0] + ' => ' + item[1] + '</list><br>')

        HttpResponseBody += 'Following is your form :<br>********************************************<br>'

        PostArgs = get_post_args(RequestBody)

        for item in PostArgs.items():
            HttpResponseBody += ('<list>' + item[0] + ' => ' + item[1] + '</list><br>')

        HttpResponseBody += '<br><br>The next is get test <br>'

        HttpResponseBody += '<a href="http://' + RequestHeaders['Host'] + '/">get test</a>'
        HttpResponseBody += '</html>'

        HttpResponse += (HttpHtmlResponseHeader + HttpResponseBody).encode(encoding='utf-8')
    # 暂时未支持的其他方法
    else:

        HttpResponse = (HttpHtmlResponseHeader + 'So sorry this method is not support :(').encode(encoding='utf-8')

    Client.sendall(HttpResponse)
    Client.close()

我们首先在该程序下新建一个文件夹pages,与index.html
在pages中新建一个index.html文件与pic.jpg图片

<html>
<a href="/pages/">Pages</a>
</html>

访问首页时会定义到index.html

然后该index.html 中 跳转到pages中,加载/pages/index.html

<html>
Show me the image<br>
<img src="pic.jpg"/>
</html>

/pages/index.html里有图像的引用,然后浏览器会继续请求图像,服务器读取图像并响应,到这里我们完成了静态网页的读取和图像的展示,至此我们先告一段落。

下一步?

我们实现了接受浏览器的请求并可以回应浏览器文本与图像,获取POST表单,但是依然是比较简单的,需要添加的功能还有很多,比如支持文件上传,支持多用户请求等等。

接下来,向着这个方向前进吧。




今天看啥 - 高品质阅读平台
本文地址:http://www.jintiankansha.me/t/m9sZ5mNzH5
Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/11805
 
169 次点击  
分享到微博