Py学习  »  Python

情趣内衣哪家强?Python告诉你!

Python中文社区 • 4 年前 • 395 次点击  

作为一名正经的数据分析师,分析情趣内衣数据这个事真的是为了客户拓展海外市场,绝对不是我闲着无聊,也绝对不是我想看什么东西...


打开亚马逊,点击“女士情趣内衣”——





啧啧信息量很大!数据怎么来?Python在手,数据我有~下面可是正经的分析教学:


第一步爬取商品排名和详情页链接

第二步爬取商品详情,包括店家、价格、上架时间、评论、尺寸颜色等

第三步数据转化为可视化图表,并做分析报告



爬虫的代码因为篇幅有限,文末有网盘链接领取方式,完整代码和清洗好的数据源都放在里面,下面来看看有哪些有趣的结论~


歪果情趣内衣哪家强?


① 哪些情趣内衣人气高?

  • 星级评分Top1:LALAVAVA(4.9分),倒数第一:N-pearI(3.2分)

  • 平均星级达4.15分,高于一半的商家都在平均分以上(17/32)


如果是想要送礼物的记得避雷,星级排名倒数的那几个品牌还是不买为好。


星级排名第一的LALAVAVA长什么样呢?看上去其实和泳衣差不多吧,大家有这个感觉吗


② 情趣内衣一般都卖多少钱?

  • 主要价格区间为10-20刀,星级评分Top1的LALAVAVA就是这个定价

  • 定价最高的是ELOVER为49刀,Goddessvan只需0.39刀,这里的水还是挺深的


锁定高端市场的ELOVE从款式上看也更女神了,这钱还是花的值


③ 情趣内衣应该怎么挑?

想要买到称心如意的内衣,首先需要对各个品牌有综合的了解,数据分析师就拿数据来说话~

将分析所得的星级、平均评论数、商品均价、商品数量等数据进行标准化处理后,综合这四个方面来整体看每个品牌的情况。因为不好拍定加权的比例,便将4项的归一化结果x10后直接累加得到总分,并制作成堆积图。


每个品牌的4项指标的占比,都能够反映他们的优劣势:

  • Avidlove:以商品数量优势夺得综合分第一,款式多,总有一款满足你

  • Garmo:主要依靠口碑(星级、平均评论数)的优势,买这个基本不会出错

  • ELOVER:整体得分排第三,看来高价的高端市场也有很多人买账

  • N-pearI:没有任何优势,妥妥的雷区

排名最低的N-pearI


④ 买情趣内衣的人最关心什么?



从评论标签的词频分析来看,是否合身、质量、款式是比较关键的点



从size & color来看,非常直观,黑色、红色永远不会出错,有个意料之外的绿色出现;从size来说,large、medium、small均有涵盖;从款式来看,词频中出现trim、lace字眼


手把手教你玩数据


看了上面的分析,有没有觉得数据分析还挺好玩的,做一名会爬虫的数据分析师是非常有优势的~今晚8:00,我将在网易云课堂免费直播,各位可以感兴趣可以来听,你也可以做出有趣的数据分析,同时还送给你以下免费福利:



添加小助手即可免费预约直播,领取Python数据分析资料包,席位有限 ,还不快来

Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/34136
 
395 次点击