社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  Python

Python中栈、队列和优先级队列的实现

GoT阳仔 • 6 年前 • 104 次点击  
阅读 17

Python中栈、队列和优先级队列的实现

关于我
编程界的一名小小程序猿,目前在一个创业团队任team lead,技术栈涉及Android、Python、Java和Go,这个也是我们团队的主要技术栈。 联系:hylinux1024@gmail.com

栈、队列和优先级队列都是非常基础的数据结构。Python作为一种“编码高效”的语言,对这些基础的数据结构都有比较好的实现。在业务需求开发过程中,不应该重复造轮子,今天就来看看些数据结构都有哪些实现。

0x00 栈(Stack)

栈是一种LIFO(后进先出)的数据结构,有入栈(push)、出栈(pop)两种操作,且只能操作栈顶元素。

Python中有多种可以实现栈的数据结构。

1、list

listPython内置的列表数据结构,它支持栈的特性,有入栈和出栈操作。只不过用list实现栈性能不是特别好。
因为list内部是通过一个动态扩容的数组来实现的。当增减元素时就有可能会触发扩容操作。如果在list的头部增减元素,也会移动整个列表。

如要使用list来实现一个栈的话,可以使用listappend()(入栈)、pop()(出栈)方法。

>>> s = []
>>> s.append('one')
>>> s.append('two')
>>> s.append(3)
>>> s
['one', 'two', 3]
>>> s.pop()
3
>>> s.pop()
'two'
>>> s.pop()
'one'
>>> s.pop()
IndexError: pop from empty list
复制代码

2、collections.deque

deque类是一种双端队列。在Python中它就是一个双向列表,可以以常用时间在两端执行添加和删除元素的操作,非常高效,所以它既可以实现栈也可以实现队列。

如果要在Python实现一个栈,那么应该优先选择deque,而不是list

deque的入栈和出栈方法也分别是append()pop()

>>> from collections import deque
>>> s = deque()
>>> s.append('eat')
>>> s.append('sleep')
>>> s.append('code')
>>> s
deque(['eat', 'sleep', 'code'])
>>> s.pop()
'code'
>>> s.pop()
'sleep'
>>> s.pop()
'eat'
>>> s.pop()
IndexError: pop from an empty deque
复制代码

3、queue.LifoQueue

顾名思义,这个就是一个栈。不过它是线程安全的,如果要在并发的环境下使用,那么就可以选择使用LifoQueue。 它入栈和出栈操作是使用put()get(),其中get()LifoQueue为空时会阻塞。

>>> from queue import LifoQueue
>>> s = LifoQueue()
>>> s.put('eat')
>>> s.put('sleep')
>>> s.put('code')
>>> s
<queue.LifoQueue object at 0x109dcfe48>
>>> s.get()
'code'
>>> s.get()
'sleep'
>>> s.get()
'eat'
>>> s.get()
# 阻塞并一直等待直到栈不为空
复制代码

0x01 队列(Queue)

队列是一种FIFO(先进先出)的数据结构。它有入队(enqueue)、出队(dequeue)两种操作,而且也是常数时间的操作。

Python中可以使用哪些数据结构来实现一个队列呢?

1、list

list可以实现一个队列,但它的入队、出队操作就不是非常高效了。因为list是一个动态列表,在队列的头部执行出队操作时,会发生整个元素的移动。

使用list来实现一个队列时,用append()执行入队操作,使用pop(0)方法在队列头部执行出队操作。由于在list的第一个元素进行操作,所以后续的元素都会向前移动一位。因此list来实现队列是不推荐的。

>>> q = []
>>> q.append('1')
>>> q.append('2')
>>> q.append('three')

>>> q.pop(0)
'1'
>>> q.pop(0)
'2'
>>> q.pop(0)
'three'
>>> q.pop(0)
IndexError: pop from empty list
复制代码

2、collections.deque

从上文我们已经知道deque是一个双向列表,它可以在列表两端以常数时间进行添加删除操作。所以用deque来实现一个队列是非常高效的。
deque入队操作使用append()方法,出队操作使用popleft()方法。

>>> from collections import deque
>>> q = deque()
>>> q.append('eat')
>>> q.append('sleep')
>>> q.append('code')
>>> q
deque(['eat', 'sleep', 'code'])
# 使用popleft出队
>>> q.popleft()
'eat'
>>> q.popleft()
'sleep'
>>> q.popleft()
'code'
>>> q.popleft()
IndexError: pop from an empty deque
复制代码

3、queue.Queue

同样地,如果要在并发环境下使用队列,那么选择线程安全的queue.Queue
LifoQueue类似,入队和出队操作分别是put()get()方法,get()在队列为空时会一直阻塞直到有元素入队。

>>> from queue import


    
 Queue
>>> q = Queue()
>>> q.put('eat')
>>> q.put('sleep')
>>> q.put('code')
>>> q
<queue.Queue object at 0x110564780>
>>> q.get()
'eat'
>>> q.get()
'sleep'
>>> q.get()
'code'
# 队列为空不要执行等待
>>> q.get_nowait()
_queue.Empty
>>> q.put('111')
>>> q.get_nowait()
'111'
>>> q.get()
# 队列为空时,会一直阻塞直到队列不为空
复制代码

4、multiprocessing.Queue

多进程版本的队列。如果要在多进程环境下使用队列,那么应该选择multiprocessing.Queue

同样地,它的入队出队操作分别是put()get()get()方法在队列为空,会一直阻塞直到队列不为空。

>>> from multiprocessing import Queue
>>> q = Queue()
>>> q.put('eat')
>>> q.put('sleep')
>>> q.put('code')
>>> q
<multiprocessing.queues.Queue object at 0x110567ef0>
>>> q.get()
'eat'
>>> q.get()
'sleep'
>>> q.get()
'code'
>>> q.get_nowait()
_queue.Empty
>>> q.get()
# 队列为空时,会一直阻塞直到队列不为空
复制代码

0x02 优先级队列(PriorityQueue)

一个近乎排序的序列里可以使用优先级队列这种数据结构,它能高效获取最大或最小的元素。

在调度问题的场景中经常会用到优先级队列。它主要有获取最大值或最小值的操作和入队操作。

1、list

使用list可以实现一个优先级队列,但它并不高效。因为当要获取最值时需要排序,然后再获取最值。一旦有新的元素加入,再次获取最值时,又要重新排序。所以并推荐使用。

2、heapq

一般来说,优先级队列都是使用堆这种数据结构来实现。而heapq就是Python标准库中堆的实现。heapq默认情况下实现的是最小堆。

入队操作使用heappush(),出队操作使用heappop()

>>> import heapq
>>> q = []
>>> heapq.heappush(q, (2, 'code'))
>>> heapq.heappush(q, (1, 'eat'))
>>> heapq.heappush(q, (3, 'sleep'))
>>> q
[(1, 'eat'), (2, 'code'), (3, 'sleep')]
>>> while q:
	next_item = heapq.heappop(q)
	print(next_item)

	
(1, 'eat')
(2, 'code')
(3, 'sleep')
复制代码

3、queue.PriorityQueue

queue.PriorityQueue内部封装了heapq,不同的是它是线程安全的。在并发环境下应该选择使用PriorityQueue

>>> from queue import PriorityQueue
>>> q = PriorityQueue()
>>> q.put((2, 'code'))
>>> q.put((1, 'eat'))
>>> q.put((3, 'sleep'))
>>> while not q.empty():
	next_item = q.get()
	print(next_item)

(1, 'eat')
(2, 'code')
(3, 'sleep')
复制代码

0x03 总结一下

很多基础的数据结构在Python中已经实现了的,我们不应该重复造轮子,应该选择这些数据结构来实现业务需求。

collections.deque是一种双向链表,在单线程的情况下,它可以用来实现StackQueue。而heapq模块可以帮我们实现高效的优先级队列。

如果要在多并发的情况下使用StackQueuePriorityQueue的话,那么应该选用queue模块下类:

  • 实现Stackqueue.LifoQueue
  • 实现Queuequeue.Queuemultiprocessing.Queue
  • 实现PriorityQueuequeue.PriorityQueue
  • 以上这些类都有put()get()方法,且get()会在栈/队列为空时阻塞。

0x04 学习资料

  • Python Tricks: A Buffet of Awesome Python Features
    ——Dan Bader
Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/35187
 
104 次点击