作为一名正经的数据分析师,分析情趣内衣数据这个事真的是为了客户拓展海外市场,绝对不是我闲着无聊,也绝对不是我想看什么东西...
打开亚马逊,点击“女士情趣内衣”——
啧啧信息量很大!数据怎么来?Python在手,数据我有~下面可是正经的分析教学:
第一步:爬取商品排名和详情页链接
第二步:爬取商品详情,包括店家、价格、上架时间、评论、尺寸颜色等
第三步:数据转化为可视化图表,并做分析报告
爬虫的代码因为篇幅有限,文末有网盘链接领取方式,完整代码和清洗好的数据源都放在里面,下面来看看有哪些有趣的结论~
① 哪些情趣内衣人气高?
如果是想要送礼物的记得避雷,星级排名倒数的那几个品牌还是不买为好。
星级排名第一的LALAVAVA长什么样呢?看上去其实和泳衣差不多吧,大家有这个感觉吗
② 情趣内衣一般都卖多少钱?
锁定高端市场的ELOVE从款式上看也更女神了,这钱还是花的值
③ 情趣内衣应该怎么挑?
想要买到称心如意的内衣,首先需要对各个品牌有综合的了解,数据分析师就拿数据来说话~
将分析所得的星级、平均评论数、商品均价、商品数量等数据进行标准化处理后,综合这四个方面来整体看每个品牌的情况。因为不好拍定加权的比例,便将4项的归一化结果x10后直接累加得到总分,并制作成堆积图。
每个品牌的4项指标的占比,都能够反映他们的优劣势:
Avidlove:以商品数量优势夺得综合分第一,款式多,总有一款满足你
Garmo:主要依靠口碑(星级、平均评论数)的优势,买这个基本不会出错
ELOVER:整体得分排第三,看来高价的高端市场也有很多人买账
N-pearI:没有任何优势,妥妥的雷区
排名最低的N-pearI
④ 买情趣内衣的人最关心什么?
从评论标签的词频分析来看,是否合身、质量、款式是比较关键的点
从size & color来看,非常直观,黑色、红色永远不会出错,有个意料之外的绿色出现;从size来说,large、medium、small均有涵盖;从款式来看,词频中出现trim、lace字眼
看了上面的分析,各位有没有觉得数据分析还挺好玩的,做一名会爬虫的数据分析师还是非常重要的~今晚8:00,我将在网易云课堂免费直播,各位可以感兴趣可以来听,你也可以做出有趣的数据分析:
除此之外,还可获取以下福利:
添加小助手即可免费预约直播,领取Python数据分析资料包,席位有限 ,还不快来