写在开始之前
什么是Web服务器?
Web服务器,顾名思义就是提供 Web 服务的服务器,我们这里要做的,确切的说应该是服务器程序
为什么要写Web服务器?
Just for fun
享受动手的乐趣
看懂本文章需要哪些基础?
正式开始
import socket
# 服务端口
try:
HttpPort = int(input('Please input the server port, default port is 9420:'))
except Exception as e:
HttpPort = 9420
# 地址信息
HttpHost = ('localhost', HttpPort)
# 返回的头部信息
HttpResponseHeader = '''HTTP/1.1 200 OK
Content-Type: text/html
'''
HttpResponseBody = ''
# 新的socket
ListenSocket = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
# ListenSocket绑定与监听
ListenSocket.bind(HttpHost)
ListenSocket.listen(100)
# 报头与报文分隔符
LineSeparator = '\r\n\r\n'
print('The server is running on port %d' % HttpPort)
print('The url is http://localhost:%d' % HttpPort)
while True:
HttpResponseBody = 'Hi : )'
Client, Address = ListenSocket.accept()
Request = Client.recv(1024).decode(encoding='utf-8')
Client.sendall((HttpResponseHeader + HttpResponseBody).encode(encoding='utf-8'))
Client.close()
这,什么都没说,上来就上代码,是不是不太合适啊?我们先来试验一下效果,然后再来理解这段代码是如何工作的。
我们将以上代码保存为文件web_server.py
,并在终端中运行python web_server.py
然后输入服务器端口号,然后打开复制下面的URL并粘贴到浏览器中进行访问,可以看一下效果
大家会注意到最上面的impoet socket
,也就是说,我们这里需要使用socket包来完成我们的服务器程序。
首先建立一个socket,绑定到我们机器的一个端口,在这里我将默认端口设置为9420,然后开始监听该端口。
接下来是一个循环,每次都接受一个socket链接,然后将客户端的信息保存起来,Client就是对应客户端的绑定,之后我们向该客户端发送一些数据并断掉关闭链接,然后接受下一个客户端请求。
不是说web服务器吗?说了半天也没见提到web,倒一直在讲socket,那socket又是什么呢?
我们可以把socket理解为TCP/IP协议族的上层实现,也就是说,有了标准,但是标准只是标准,标准是用来指导和规定的,还是需要具体的实现,这里socket就是这种标准的实现,我们这篇文章所说的web服务器主要是HTTP,不再说HTTPS,web socket以及其他。
HTTP是基于TCP协议的,只是对TCP加了一部分属性并进行了进一步抽象和封装,也就是说我们使用HTTP进行数据传输的时候,TCP也是正在连接着的,在连接的过程中我们需要用到socket。
HTTP 请求与响应,都是头部加主题的形式,头部与主题是由一个空行隔开,这里也是我们分割的依据。
感兴趣的朋友可以参考一下MDN文档,首先浏览器向服务器发送一个请求,然后服务器会收到请求,然后返回给浏览器一段文本,浏览器就会解析该文本然后给我们展现出来。
我们的HttpResponse就是需要返回给客户端的头信息,如果没有这些,浏览器也就不会解析,也就相当于这是一个无效的回应。
虽然说是简单的服务器,但是这实在是太简单了,除了一个Hi
就不再有别的东西了,那你可以试着更改一下浏览器中的url,你会发现,服务器只会返回来一个Hi,所以让我们来看一下下一节吧。
小修小补
嗯,之前实现的除了Hi
之外,别的功能都没有实现,我们仅仅实现了get,接下来,我们实现获取用户请求的参数,获取用户的请求头,用户的请求方法以及post表单的获取
依然,直接上代码。
import socket
# 服务端口
try:
HttpPort = int(input('Please input the server port, default port is 9420:'))
except Exception as e:
HttpPort = 9420
# 地址信息
HttpHost = ('localhost', HttpPort)
# 返回的头部信息
HttpResponseHeader = '''HTTP/1.1 200 OK
Content-Type: text/html
'''
HttpResponseBody = ''
# 新的socket
ListenSocket = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
# ListenSocket绑定与监听
ListenSocket.bind(HttpHost)
ListenSocket.listen(100)
# 报头与报文分隔符
LineSeparator = '\r\n\r\n'
print('The server is running on port %d' % HttpPort)
print('The url is http://localhost:%d' % HttpPort)
# 获取请求报头
def get_headers(request):
# 分隔符切割
headers_arr = request.split('\r\n')
# 第一行是请求方法方法 请求路径 HTTP协议版本
headers = {}
for item__ in headers_arr[1:]:
item_ = item__.split(': ')
headers[item_[0]] = item_[1]
return headers
# 获取POST表单参数
def get_post_args(request_body):
post_args_arr = request_body.split('&')
post_args = {}
for item__ in post_args_arr:
item_ = item__.split('=')
post_args[item_[0]] = item_[1]
return post_args
while True:
# 监听链接
Client, Address = ListenSocket.accept()
# 接收用户传输的数据
Request = Client.recv(1024).decode(encoding='utf-8')
# 将用户请求切割为报头 主体
RequestText = Request.split(LineSeparator)
# 报头
RequestHeader = RequestText[0]
# 主体
RequestBody = RequestText[1]
# 请求方法
RequestMethod = RequestHeader.split(' ')[0]
# 请求的路径
RequestUrl = RequestHeader.split(' ')[1]
# 头部信息
RequestHeaders = get_headers(RequestHeader)
# 返回主体
HttpResponseBody = ''
print(Request)
# GET方法的处理
if RequestMethod == 'GET':
HttpResponseBody += '<html>'
HttpResponseBody += 'Your method is GET and your request url is ' + RequestUrl + '<br>'
HttpResponseBody += 'Following are you headers :<br>********************************************<br>'
for item in RequestHeaders.items():
HttpResponseBody += ('<list>' + item[0] + ' => ' + item[1] + '</list><br>')
HttpResponseBody += '<br><br>The next is post test <br>'
HttpResponseBody += '''
<form action="/" method="post">
<p>Text1: <input type="text" name="Text1" /></p>
<p>Text2: <input type="text" name="Text2" /></p>
<input type="submit" value="Submit" />
</form>
'''
HttpResponseBody += '</html>'
# POST方法的处理
elif RequestMethod == 'POST':
HttpResponseBody += '<html>'
HttpResponseBody += 'Your method is POST and your request url is ' + RequestUrl + '<br>'
HttpResponseBody += 'Following are your headers :<br>********************************************<br>'
for item in RequestHeaders.items():
HttpResponseBody += ('<list>' + item[0] + ' => ' + item[1] + '</list><br>')
HttpResponseBody += 'Following is your form :<br>********************************************<br>'
PostArgs = get_post_args(RequestBody)
for item in PostArgs.items():
HttpResponseBody += ('<list>' + item[0] + ' => ' + item[1] + '</list><br>')
HttpResponseBody += '<br><br>The next is get test <br>'
HttpResponseBody += '<a href="http://' + RequestHeaders['Host'] + '/">get test</a>'
HttpResponseBody += '</html>'
# 暂时未支持的其他方法
else:
HttpResponseBody += '<html>'
HttpResponseBody += 'So sorry this method is not support :('
HttpResponseBody += '</html>'
Client.sendall((HttpResponseHeader + HttpResponseBody).encode(encoding='utf-8'))
Client.close()
直接从30行增加到120行,代码量有点多,不要担心,我们一起来看一下。
我们这里与上一节相比,增加了来两个函数,一个是来获取用户的请求头,另一个是来获取用户所提交的表单。
请求头格式如下:
GET / HTTP/1.1
Accept: text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8
Accept-Encoding: gzip, deflate
Accept-Language: zh-CN,zh;q=0.8,zh-TW;q=0.7,zh-HK;q=0.5,en-US;q=0.3,en;q=0.2
Cache-Control: max-age=0
Connection: keep-alive
Host: localhost:9420
Referer: http://localhost:9420/
Upgrade-Insecure-Requests: 1
User-Agent: Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:59.0) Gecko/20100101 Firefox/59.0
我们根据此格式进行分割并作为响应给浏览器
POST 请求方法提交的不限于文本,我们这里只实现了简单的表单提交,POST提交的表单是在请求的Body中的,我们进行分割,并根据其格式来解析出来,并作为相应返回给浏览器,GET请求
POST请求并获取POST表单参数
我们实现的GET返回下面会有一个POST测试,POST提交之后,返回的新网页下面有一个GET测试,这一节不算很难,大家可以打开浏览器,chrome 或者 firefox 用f12打开开发者窗口,来观察一下传输的信息,来看看下一小节。
再进一步
我们的服务器相应的网页都是写在服务器代码中的,换一个网页还得修改服务器代码,太不方便啦,于情于理,这么做都不合适,所以这次我们试试将html文件发送给用户,并实现图片的传输。
import socket
# 服务端口
try:
HttpPort = int(input('Please input the server port, default port is 9420:'))
except Exception as e:
HttpPort = 9420
# 地址信息
HttpHost = ('localhost', HttpPort)
# 返回的头部信息
HttpHtmlResponseHeader = '''HTTP/1.1 200 OK
Content-Type: text/html
'''
HttpImageResponseHeader = '''HTTP/1.1 200 OK
Content-Type: image/jpg
'''
HttpResponseBody = ''
HttpResponse = ''.encode(encoding='utf-8')
# 新的socket
ListenSocket = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
# ListenSocket绑定与监听
ListenSocket.bind(HttpHost)
ListenSocket.listen(100)
# 报头与报文分隔符
LineSeparator = '\r\n\r\n'
print('The server is running on port %d' % HttpPort)
print('The url is http://localhost:%d' % HttpPort)
# 获取请求报头
def get_headers(request):
# 分隔符切割
headers_arr = request.split('\r\n')
# 第一行是请求方法方法 请求路径 HTTP协议版本
headers = {}
for item__ in headers_arr[1:]:
item_ = item__.split(': ')
headers[item_[0]] = item_[1]
return headers
# 获取POST表单参数
def get_post_args(request_body):
post_args_arr = request_body.split('&')
post_args = {}
for item__ in post_args_arr:
item_ = item__.split('=')
post_args[item_[0]] = item_[1]
return post_args
while True:
# 监听链接
Client, Address = ListenSocket.accept()
# 接收用户传输的数据
Request = Client.recv(1024).decode(encoding='utf-8')
# 将用户请求切割为报头 主体
RequestText = Request.split(LineSeparator)
# 报头
RequestHeader = RequestText[0]
# 主体
RequestBody = RequestText[1]
# 请求方法
RequestMethod = RequestHeader.split(' ')[0]
# 请求的路径
RequestUrl = RequestHeader.split(' ')[1]
# 头部信息
RequestHeaders = get_headers(RequestHeader)
# 返回主体
HttpResponseBody = ''
HttpResponse = ''.encode(encoding='utf-8')
# GET方法的处理
if RequestMethod == 'GET':
# 目录
if RequestUrl[-1] == '/':
# 如果该Url最后一个字符是/,就将该目录下的index.html返回
RequestUrl += 'index.html'
print(RequestUrl)
# 网页
if RequestUrl.split('.')[-1] == 'html':
try:
# 读取本地文件
res = open('.' + RequestUrl, 'rb')
StaticHtml = res.read()
HttpResponse += HttpHtmlResponseHeader.encode(encoding='utf-8')
HttpResponse += (HttpResponseBody.encode(encoding='utf-8') + StaticHtml)
res.close()
except Exception:
HttpResponse += HttpHtmlResponseHeader.encode(encoding='utf-8')
HttpResponse += '<html><br>ERROR !<br></html>'.encode(encoding='utf-8')
# 图片
elif RequestUrl.split('.')[-1] == 'jpg':
try:
res = open('.' + RequestUrl, 'rb')
ImageFile = res.read()
HttpResponse += HttpImageResponseHeader.encode(encoding='utf-8')
HttpResponse += (HttpResponseBody.encode(encoding='utf-8') + ImageFile)
res.close()
except Exception:
HttpResponse += HttpImageResponseHeader.encode(encoding='utf-8')
HttpResponse += ''.encode(encoding='utf-8')
HttpResponse += '<br><br>The next is post test <br>'.encode(encoding='utf-8')
HttpResponse += '''
<form action="/" method="post">
<p>Text1: <input type="text" name="Text1" /></p>
<p>Text2: <input type="text" name="Text2" /></p>
<input type="submit" value="Submit" />
</form>
'''.encode(encoding='utf-8')
# POST方法的处理
elif RequestMethod == 'POST':
HttpResponseBody += '<html>'
HttpResponseBody += 'Your method is POST and your request url is ' + RequestUrl + '<br>'
HttpResponseBody += 'Following are your headers :<br>********************************************<br>'
for item in RequestHeaders.items():
HttpResponseBody += ('<list>' + item[0] + ' => ' + item[1] + '</list><br>')
HttpResponseBody += 'Following is your form :<br>********************************************<br>'
PostArgs = get_post_args(RequestBody)
for item in PostArgs.items():
HttpResponseBody += ('<list>' + item[0] + ' => ' + item[1] + '</list><br>')
HttpResponseBody += '<br><br>The next is get test <br>'
HttpResponseBody += '<a href="http://' + RequestHeaders['Host'] + '/">get test</a>'
HttpResponseBody += '</html>'
HttpResponse += (HttpHtmlResponseHeader + HttpResponseBody).encode(encoding='utf-8')
# 暂时未支持的其他方法
else:
HttpResponse = (HttpHtmlResponseHeader + 'So sorry this method is not support :(').encode(encoding='utf-8')
Client.sendall(HttpResponse)
Client.close()
我们首先在该程序下新建一个文件夹pages,与index.html
在pages中新建一个index.html文件与pic.jpg图片
<html>
<a href="/pages/">Pages</a>
</html>
访问首页时会定义到index.html
然后该index.html 中 跳转到pages中,加载/pages/index.html
<html>
Show me the image<br>
<img src="pic.jpg"/>
</html>
/pages/index.html里有图像的引用,然后浏览器会继续请求图像,服务器读取图像并响应,到这里我们完成了静态网页的读取和图像的展示,至此我们先告一段落。
下一步?
我们实现了接受浏览器的请求并可以回应浏览器文本与图像,获取POST表单,但是依然是比较简单的,需要添加的功能还有很多,比如支持文件上传,支持多用户请求等等。
接下来,向着这个方向前进吧。