除了以上内容,二胖还分析了其他的信息,比如宅男和美眉们的公司、学校等,由于涉及隐私不能发出来,感兴趣的童鞋可以尝试自己分析。
这些数据除了可供娱乐,还可以做很多事情,比如可以帮找女朋友。
举个简单的例子:你想要找一个长得好看、单身、身材好、腿长并且短发的女朋友该怎么办。最简单的办法就是用程序去查找:同时回答了以下问题的女性。
女生腿长是什么感觉?
身材好是一种怎样的体验?
长得好看,但没有男朋友是怎样的体验?
女生有一头短发是种怎样的体验?
当然这不一定准确,也不一定能找到某些潜水用户,但是至少比我们一个一个去找要快得多。
除此以外,大家一定要注意保护自己的隐私!用户行为都是可以被获取的,用程序可以计算出你的习惯,并对你进行简单的用户画像、分类等。就拿知乎来说,通过大家关注了哪些人、点了哪些赞、关注了哪些问题、留下的职业及学校等信息基本就可以大致判断出用户的类型,要不怎么会有个性化推荐呢。所以,在大数据时代,我们几乎是没有隐私可言的。当然,这也有利有弊,用一定的算法,我们也可以发现一些异常行为,比如知乎上的不少骗子、酒托、饭托等,都可以通过数据聚类,从而发现社会上一些不和谐的事情。
本文涉及的代码和数据就不提供给大家啦。一是为了避免大家的抓取对网站服务器造成过多压力,二是数据具有一定的隐私性。感兴趣的童鞋可以自己通过技术实现,二胖在文中也有说到实现思路。