Py学习  »  Python

给剧荒的你:Python高分日剧看剧指南

CDA数据分析师 • 4 年前 • 563 次点击  

作者:

本文转自:大鹏教你玩数据 


P.S.文末有本文所有代码及数据分享~


如果你受够了国剧的不切实际,韩剧的狗血,美剧的黄暴赌毒,日剧(里的小姐姐)也许是你最好的选择。随着今年夏天《凪的新生活》和《轮到你了》两部日剧轮番上热搜,喜欢看日剧的小伙伴也越来越多,那今天我们就用数据说话,给你整理出一份值得一补的日剧清单,看一下有哪些值得看的口碑日剧


打开某瓣电影,选择日剧分类,再选择按评价排序。这个排序里一共有500部日剧,最低评分为8.2分。那么我们就来分析这里的数据。

 


这一次我们想要分析的是有真人演员的剧作,所以类似《越狱兔》这样不包含主演相关信息的动漫,我们会对此类剧作进行删除。


各类日剧的佼佼者


在剩下的四百九十多部剧里,我们先做个类型分析。


通过扇形图的呈现,可以看出第一大类剧情类占了42.38%。日剧最擅长的也就是说故事,而抓住观众眼球的还有日剧中故事题材选取的多元性。那么接下来我们就分门别类地来看看,哪些优秀日剧值得推荐。


剧情类的TOP10榜单如下

这里按照中文名首字母排序,大量同分的日剧,只取前十名,完整榜单见文末


搜索剧情类排名第一的剧是《白色巨塔》,该剧通过大学医学院的医疗事件和外科主任在选举中的贿赂行为,揭露了医学界尔虞我诈,争权夺利的黑暗面。经典!9.6分!

虽然后来韩国,台湾以及日本自己都再翻拍过《白色巨塔》,但是2003版的《白色巨塔》俨然已经成为不可超越的里程碑之作。


其中另外一部大家比较眼熟的可能就是去年大火的《非自然死亡》了,该剧讲述了在“非自然死亡原因研究所”任职的法医三澄美琴(石原里美饰)与同事们一起探查非正常死亡者的真正死因,从而改变现实世界的故事。这部剧是让十元妹子成功转型的上乘之作。



喜剧类Top10榜单如下:


第二大类喜剧占了10.64%,最高分9.4分,分别是以下三部:

1996年首播的《绅士刑警2》

2012年首播的《胜利即是正义》


2019年播出的《孤独的美食家》第八季


其中《胜利即是正义》还有一个大家更熟悉的名字《legal high》,从开播至今都热度不减,《胜利即是正义2》也是9.3分的高分剧作。


这么多品类,哪些种类不容易踩雷呢?我们通过箱型图,更直观的看看各类别的平均表现:

通过箱形图呈现,我们可以发现平均分最高的是科幻类和动作类。接下来就来看一下这两类都有哪些代表作品:


科幻类优秀作品

动作类优秀作品


看到这些剧名,不难发现奥特曼和假面骑士就是科幻+动作类的高分代表啊!


日剧里的爱情,非常治愈和温情。这里也为大家奉上爱情类完整版TOP10榜单:


爱情类平均分在几大类里不算太高,但是请注意,爱情类最右边的那个黑色小圈圈,那是对于这一类别评分高到算作异常的一个点。



不用去查原数据,也会猜到一定就是《东京爱情故事》了。

1991年首播的《东京爱情故事》可以算作日系纯爱类电影电视剧的鼻祖之作了,它讲述的是发生在东京的(四角恋)爱情故事。相信很多人看的第一部日剧就是它,自此走上了追日剧的不归路。


喜欢家庭,犯罪,悬疑类的小伙伴不要着急,TOP10的榜单我们通通都有!


家庭剧Top10

悬疑剧top10

犯罪剧top10,由于犯罪和悬疑类榜单有些交叉,同样我们对同一部剧不同季的上榜情况稍微做了调整。


经过时间洗礼的日剧


有人说1994年是电影史上的黄金年,不少经典之作都诞生于1994年,那我们就来看看日剧史上的黄金年是哪一年吧。


整理了1990年到2019年每一年的剧作数量和平均分,我们可以发现:总体来看,优秀日剧的平均评分总是在8.6上下起伏的。中间会出现几个特别突出的黄金年份,比如1990、1996、2013等。


平均分最高的9.2分停留在了1990年,主要因为某瓣排名前500的剧集中,只有两部来自90年的神作:《世界奇妙物语》和《冷暖人间》第一部这两部剧,有一个共同特点:剧集播出时间跨度很长。


《世界奇妙物语》是一个恐怖故事合集,深夜放送,以“潜藏在日常的恐怖”为主题,每集一个故事,由齐木茂当叙述人来讲述。本篇在1990年-1992年播出,由于收视率很高,直到2017年都还以两季播的方式,放送特别篇。


《冷暖人间》总共十季,首播于1990年,本篇结束于2010年,到今年还在放送特别篇,在某瓣上的评分均为9分以上。它讲述的是日本普通家庭冈仓夫妇与五个女儿平日生活的点点滴滴,本来只有推出第一季,后来大受好评,开始陆续演出直到第十季,可见这是一部经得起时间洗礼的经典。


1990年代的剧作也许感觉有点遥远,大家不会特意去搜索,而因此错过了一些佳作。为了方便大家补番,我们把1990-1999年的高分剧作全部列出。做好事不留名,请叫我红领巾。(排名数据见文末)


经典永远是经典。2000年的每一年入围高分榜的剧作越来越多,特别是2014年以后,但这些剧作平均分都没能超过8.7


看演员选日剧


看完高分剧集TOP10,再来看看高分演员评分TOP10:



这里的排行是筛选出有5部作品以上的演员,剧荒的时候,从这20个名字中随便挑一个去搜剧看吧。


比如搜索女演员排名第五的小泉今日子,你将看到以下这些:


除了评分榜,还有数(láo)量(mó)榜。


男演员排名第一的松重丰28部,不常看日剧的小伙伴可能不熟悉松重丰的名字,但是你一定在日料店的电视屏幕上,见过这样的他。

《孤独的美食家》整整八季加上各种特别篇几乎部部在榜!所以吃货们不仅爱自己吃,还爱看别人吃,喜欢日本美食的同学不要错过。


女演员数量榜排名第一的内田有纪有14部剧。


排名第一第二的是《倒数第二次恋爱》和《续倒数第二次恋爱》,这两部也出现在了高评分演员小泉今日子的清单里。有高分和高产量两大女演员加持,那肯定必追剧作啦!


在研究演员的过程中,我发现一个特点:那些评分很高作品比较多的演员,大部分是老演员,并且很多都不是日剧里的主角,于是我决定,梳理下日剧演员合作关系。每合作一部剧,就产生一次联系,作出下面的日剧演员关系图:


图中的圆点大小代表该演员和别的演员产生合作的次数,同一颜色代表经常合作的群体。从这张图里,不熟悉日本演艺圈的朋友也能看出日本演艺界大概是如何划分阵营的,以及每个阵营里的核心人物是谁。


最浓墨重彩的那几个名字当中,并不是经常出演男一,女一的演员,往往是男二,甚至是其他男配女配,比如:光石研,杉本哲太。


这些演员也是日剧中的常青树。即使不是主演,但他们精湛的演技为作品增添了独具的色彩。通过他们,更多的新演员和这个阵营里的其他人合作。有他们姓名在列的作品,也是剧作品质的多一重保障哦。


好了,以上就是从某瓣数据得出的高分剧作推荐和高分保障的演员推荐了。文末还有一枚彩蛋,不要走开~


彩蛋:木村拓哉弹幕

用研究某瓣数据的方法,我尝试着研究了B站的弹幕信息——先来感受一下他的弹幕氛围:


从木村拓哉的200个视频中共获取了5万6千多条数据,我们选择了一个小巧方便的数据库MongoDB来储存数据


有了弹幕内容以后,打开Python导入jieba分词,jieba的功能是对句子进行分词处理。将一句完整的话,分割成一个个单独的词语。比如下面这样,调用jieba的lcut函数就对一句话进行分词:

import jieba
jieba.lcut('怎么可以这么帅')


得到的结果是:


整屏的弹幕通过jieba被分成了一个个单词后,为了更形象的将它展示出来,再导入wordcloud库制作词云。

import wordcloud
w = wordcloud.WordCloud()
w.generate("".join(['怎么','可以','这么','帅']))
w.to_file("test.jpg")


Wordcloud的使用基本四步走:导入wordcloud库→配置对象参数→加载词云文本→输出词云文件。


上面四行代码就是遵守了四步走的原则,我们得到了这样一张词云图。


因为词云是对文本中出现频率较高的“关键词”进行视觉化的展现,它会过滤掉大量的低频低质的文本信息,使得浏览者只要一眼扫过文本就可领略文本的主旨。那我们对刚刚爬取到的五万六千多条弹幕内容来做一个词云展示。


这样是不是视觉冲击感强烈了很多呢?如果觉得画面内容过多过于杂乱,那再挑出最高频的20个词,做个最高浓缩的总结吧。



大神好看!大神太帅!喜欢大神!表白大神!


这就是这5万多条弹幕内容的核心了。词云图还可以通过修改背景样式,背景颜色,字体样式等等来让显示更加美观和个性化,小伙伴们可以自己多多尝试。




本文所有代码和数据:

https://pan.baidu.com/s/1fvgZgiSLWDQqkw7uy7pgxA 

提取码:hclb


📌CDA课程咨询

赵老师

微信号 : CDA11111111

联系电话:13381275813

长按二维码,添加好友咨询



⭐️为CDA数据分析师点亮星标⭐️









📚推荐阅读 READ MORE


 干货 | 如何用Python开启你的机器学习之路

 【神预测】数据分析精准预测2019天猫双11成交额! 误差仅仅千分一!

  今年双11,你盖楼了吗? | 用数据解读不一样的双11

●  实锤!中国自己的数字货币DCEP!拥有法币地位,任何机构和个人不得拒绝,没网的地方也能用!央行DCEP,全球第一大主权数字货币!





喜欢本篇内容请点个“在看”哦!❤️



Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/51566
 
563 次点击