社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  Python

如何从特定域中排除电子邮件地址,并通过pythonical方法提取其他地址

py_noob • 5 年前 • 1444 次点击  

我有一个电子邮件地址列表,其中一些来自相关域,另一些来自垃圾邮件/无关电子邮件域。我想把这两个都记录下来,但要单独列出。我知道相关的是从哪里来的(总是同一个领域- @gmail.com 但垃圾邮件来自不同的地方,所有这些都需要被捕获)。

    # Extract all email ids from a JSON file
    import re
    import json

     with open("test.json", 'r') as fp:
         json_decode = json.loads(fp.read())

         line = str(json_decode)

         match = re.findall(r'[\w\.-]+@[\w.-]+', line)
         l = len(match)
         print(match)

         for i in match:
             domain = match.split('@')[i]


        OUTPUT: match = ['image001.png@01D36CD8.2A2219D0', 'arealjcl@countable.us', 'taylor.l.ingram@gmail.com']

前两个是垃圾邮件,第三个是合法的电子邮件,所以他们必须在不同的名单。我是不是在 @ 确定域或排除所有 @gmail.com网站 然后把它放到另一张单子上。

Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/52692
 
1444 次点击  
文章 [ 3 ]  |  最新文章 5 年前