roippi的回复列表 - Py学习

社区教程 Wiki

注册登录

创作新主题

社区所有版块导航

Python

python开源 Django Python DjangoApp pycharm

DATA

docker Elasticsearch

分享

问与答闲聊招聘翻译创业分享发现分享创造求职区块链支付之战

aigc

aigc chatgpt

WEB开发

linux MongoDB Redis DATABASE NGINX 其他Web框架 web工具 zookeeper tornado NoSql Bootstrap js peewee Git bottle IE MQ Jquery

机器学习

机器学习算法

Python88.com

反馈公告社区推广

产品

短视频

印度

印度

一周十大热门主题

LeCun发布2025学年机器学习研究生课程的教学大纲和讲义

2025必看AI干货!《大模型/AIGC/GPT-4/Transformer/DL/KG/NLP/C...

从程序化生成到AIGC：3D场景生成技术如何跨越"虚假→真实"鸿沟？480+文献揭秘四大范式

NYU教授公布2025机器学习课程大纲：所有人都在追LLM，高校为何死磕基础理论？

2025必看AI干货!《大模型/AIGC/GPT-4/Transformer/DL/KG/NLP/C...

字节跳动提出Mogao模型：开启 AIGC 从“能写会画”到“边写边画”

美国版权局发布第三份人工智能报告：现有版权法框架能够应对AIGC挑战

2025必看AI干货!《大模型/AIGC/GPT-4/Transformer/DL/KG/NLP/C...

2025年GitHub平台上的十大开源MCP服务器分析

英伟达为CUDA添加原生Python支持！学Python，这几本书你一定要翻烂！(文末送书)

11 年前

回复了 roippi 创建的主题 » 用于将有限正则表达式转换为文本数组的Python包?

我会这样做来提取这些群体:

def extract_groups(trend):
    l_parens = [i for i,c in enumerate(trend) if c == '(']
    r_parens = [i for i,c in enumerate(trend) if c == ')']
    assert len(l_parens) == len(r_parens)
    return [trend[l+1:r].split('|') for l,r in zip(l_parens,r_parens)]

然后你可以使用 itertools.product :

expr = 'STRING_(A|B)_STRING_(C|D)'
from itertools import product
list(product(*extract_groups(expr)))
Out[92]: [('A', 'C'), ('A', 'D'), ('B', 'C'), ('B', 'D')]

现在的问题是把它们重新拼接到你原来的表情上。我会用 re 为此:)

#python3.3+
def _gen(it):
    yield from it

p = re.compile('\(.*?\)')

for tup in product(*extract_groups(trend)):
    gen = _gen(tup)
    print(p.sub(lambda x: next(gen),trend))

STRING_A_STRING_C
STRING_A_STRING_D
STRING_B_STRING_C
STRING_B_STRING_D

也许有一种更易读的方式 re.sub 按顺序替换iterable中的内容,但这是我脑子里想出来的。

关于移动版

Py学习 - 专注于Python技术发展的社区(原Django社区)

沪ICP备11025650号