我们对数据有一个相当结构化的模式,但我不知道如何有效地处理它。
现在我们已经使用了for循环遍历每一行并拆分分隔符和值对,但是…“必须有更好的方法”
下面是一个示例行:
|207=NYSE|11002=N|10=232|
关于数据的一些注记
|207=|
哈希表!
需要更多的信息,但如果你已经有了数据,你可以把它分类为这些可以索引和减少整个过程时间!
当然,最初计算条目的去向需要时间,但是。
有点像
def hash(astring, tablesize): sum = 0 for pos in range(len(astring)): sum = sum + ord(astring[pos]) return sum%tablesize
鉴于此
data = '|207=NYSE|99=|11002=N|10=232|'
那么这个
kv = dict(arg.split('=', 1) for arg in data.split('|') if arg)
也许是最简单,最有效的方法,把它变成这句格言:
{'207': 'NYSE', '99': '', '11002': 'N', '10': '232'}