Python 打造七夕最强表白程序

阅读文本大概需要 7.77 分钟。

一年一度的七夕又到了，朋友圈又是刷屏的节奏。但热闹总是别人的，我们好像只有吃狗粮的份。时间总是飞快流逝，很多事情早已改变，但仿佛只有你的单身状态从未改变。

单身久的我们，好像觉得一个人过也没什么的。但即使非常享受单身生活，大家也要保持“可勾搭”的待机状态，因为促进荷尔蒙分沁有益身心健康。

在这个人人都在秀的时候，做为程序员我们也要操作起来！散发你们的荷尔蒙！今天就大家奉献上七夕最强表白程序！此程序结合数据抓取 + 微信自动发消息 + 定时任务，实现一个能每天自动定时给你心爱的 ta 发送：你们相识相恋天数 + 情话 + 我爱你的图片。具体的消息如下。

每天发送的消息格式如下：

    message = """
    亲爱的{}:

    早上好，今天是你和 Koc 相恋的第 {} 天~

    今天他想对你说的话是：

    {}

    最后也是最重要的！
    """.format("你的好友名称", str(inLoveDays), love_word)

这里需要填写的第一个字段是 ta 的称呼，inLoveDays 为你们相识相恋的天数。

love_word 是每天为 ta 精心准备情话内容，当然如果你的文笔好也可以自己写。

当然最后也是最重要的！每天不尽相同的「我爱你」图片！

程序思路

本次程序运行的环境是 windows10 + Python 3.6，此次主要用到的库有 selenium、itchat、request。程序主要分为两部分第一数据的抓取，一些情话信息和图片信息。另一部就是利用 itchat 自动发送消息给你的好友。

情话信息

如果对你的文笔有信心，那你可以自己写些情话。当然大部分人的文笔跟我一样是比较差的，所以这时候我们就可以利用网上的资源，比如下面的情话网站。

http://www.binzz.com/yulu2/3588.html

在抓取这个网站的情话时，如果你利用普通的爬取思路，即利用 request 进行请求，你会发现网页获取的数据是乱码并且不完整。所以在这块为了操作方便，我利用了 selenium 的 PhantomJS 无头浏览器，来获取网站的信息。

通过 selenium + xpath 我们就可以很轻松的获取到网页情话，最后把获取到的数据保存到当前目录下的「love_word.txt」方便之后的读取。

表白图片资源

为了配合此次七夕表白程序，我专门去找了些带有「我爱你」的图片资源。通过下面的贴吧贴子，我们就可以获取到大量的这样资源。

http://tieba.baidu.com/p/3108805355

此贴并没有很强的反爬措施，所以我简单的利用 request + re 来获取到图片资源，并保存到当前目录的下「img」文件里。

在保存图片资源之前，我会先检查当前目录下是否有「img」文件夹，如果没有则会自动创建。

表白程序源码

此次表白程序主要有 5 个函数

crawl_Love_words()

此函数通过 selenium + xpath 来抓取情话网站的资源，并存入到当前目录下的「love_word.txt」文件。

def crawl_Love_words():
    print("正在抓取情话...")
    browser = webdriver.PhantomJS()
    url = "http://www.binzz.com/yulu2/3588.html"
    browser.get(url)
    html = browser.page_source
    Selector = etree.HTML(html)
    love_words_xpath_str = "//div[@id='content']/p/text()"
    love_words = Selector.xpath(love_words_xpath_str)
    for i in love_words:
        word = i.strip("\n\t\u3000\u3000").strip()
        with open(love_word_path, "a") as file:
            file.write(word + "\n")
    print("情话抓取完成")

crawl_love_image()

此函数用来爬取贴吧带有「我爱你」的图片资源，通过 request + re 来实现。代码并不复杂，在正则表达式那也简单的写了一个，用来匹配当前也所有的图片资源。

def crawl_love_image():
    print("正在抓取我爱你图片...")
    for i in range(1, 22):
        url = "http://tieba.baidu.com/p/3108805355?pn={}".format(i)
        response = requests.get(url)
        html = response.text
        pattern = re.compile(r'.*?.*?

今天看啥 - 高品质阅读平台
本文地址：http://www.jintiankansha.me/t/f7Gye1bOF3