Py学习  »  Ryszard Czech  »  全部回复
回复总数  2
4 年前
回复了 Ryszard Czech 创建的主题 » 用于将有限正则表达式转换为文本数组的Python包?

这很容易实现 sre_yield module :

>>> import sre_yield
>>> trend  = '(A|B|C)_STRING'
>>> strings = list(sre_yield.AllStrings(trend))
>>> print(strings)
['A_STRING', 'B_STRING', 'C_STRING']

目标 sre_产量 就是高效地生成与给定正则表达式匹配的所有值,或者高效地计算可能的匹配项。。。它通过在树上行走来实现这一点 sre_parse (与 re 模块),并根据需要构造链式/重复迭代器。根据输入字符串的不同,可能会有重复的结果——这些情况 sre_parse 没有优化。

5 年前
回复了 Ryszard Czech 创建的主题 » Python:如何使用regex拆分列中的值并保留右边?

df['Right Side Of X'] = df['Size'].str.extract(r'(\d+)$', expand=False).fillna("")

这个 (\d+)$ 表达式将在字符串末尾捕获一个或多个数字。 .fillna("") 将用空字符串填充非匹配项。