我有一个电子邮件地址列表,其中一些来自相关域,另一些来自垃圾邮件/无关电子邮件域。我想把这两个都记录下来,但要单独列出。我知道相关的是从哪里来的(总是同一个领域-
@gmail.com
但垃圾邮件来自不同的地方,所有这些都需要被捕获)。
# Extract all email ids from a JSON file
import re
import json
with open("test.json", 'r') as fp:
json_decode = json.loads(fp.read())
line = str(json_decode)
match = re.findall(r'[\w\.-]+@[\w.-]+', line)
l = len(match)
print(match)
for i in match:
domain = match.split('@')[i]
OUTPUT: match = ['image001.png@01D36CD8.2A2219D0', 'arealjcl@countable.us', 'taylor.l.ingram@gmail.com']
前两个是垃圾邮件,第三个是合法的电子邮件,所以他们必须在不同的名单。我是不是在
@
确定域或排除所有
@gmail.com网站
然后把它放到另一张单子上。