社区教程 Wiki

注册登录

创作新主题

社区所有版块导航

Python

python开源 Django Python DjangoApp pycharm

DATA

docker Elasticsearch

问与答闲聊招聘翻译创业分享发现分享创造求职区块链支付之战

aigc

aigc chatgpt

WEB开发

linux MongoDB Redis DATABASE NGINX 其他Web框架 web工具 zookeeper tornado NoSql Bootstrap js peewee Git bottle IE MQ Jquery

机器学习

机器学习算法

Python88.com

反馈公告社区推广

产品

短视频

印度

一周十大热门主题

科技爱好者周刊#362：GitHub 工程师谈系统设计

全球95%企业AI惨败？MIT报告引硅谷恐慌！90%员工偷用ChatGPT续命

#AI落地项目合集##LLM实战项目大全#GitHub揽获62.-20250825145732

全球95%企业AI惨败？MIT报告引硅谷恐慌！90%员工偷用ChatGPT续命

上海交大团队研发HFML混合机器学习框架，定向筛选高熵钠电正极材料：从AI预测、实验验证到百公斤中试

即梦推出“智能多帧”功能，突破AI视频长镜头创作瓶颈；谷歌：Gemini每次回答消耗能量相当于微波炉...

GitHub Trending 日报【2025-08-22】

GPT-5系统提示词被泄露，ChatGPT自己也“承认”了

MIT最新报告：全球95%企业AI惨败！九成员工偷用ChatGPT续命

量化前沿速递：机器学习[20250824]

私信 • 关注

kantal

kantal 最近创建的主题

» kantal 创建的更多主题

kantal 最近回复了

6 年前

回复了 kantal 创建的主题 » 基于python中两个短序列的过滤行

如果文件不太大,可以立即读取,并使用re.findall():

    import re
    with open("infile.txt") as finp:
        data=finp.read()
    with open('outfile.txt', "w") as f:
        for item in re.findall(r">.+?[\r\n\f][AGTC]*?AATAAA[AGTC]{2,}GGAC[AGTC]*", data):
            f.write(item+"\n")

"""
+? and *?       means non-greedy process;
>.+?[\r\n\f]    matches a line starting with '>' and followed by any characters to the end of the line; 
[AGTC]*?AATAAA  matches any number of A,G,T,C characters, followed by the AATAAA pattern; 
[AGTC]{2,}      matches at least two or more characters of A,G,T,C;
GGAC            matches the GGAC pattern;
[AGTC]*         matches the empty string or any number of A,G,T,C characters.
"""

» kantal 创建的更多回复

关于移动版

Py学习 - 专注于Python技术发展的社区(原Django社区)