社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  Python

用奶茶一起来聊聊 Python 数据分析

AirPython • 3 年前 • 566 次点击  

前一阵“秋天的第一杯奶茶”的梗刚刷爆我的朋友圈,这两天又开始了“冬天的第一杯奶茶”。从什么时候开始,连“奶茶自由”都成了人们的理想生活方式之一

 

本来以为这件事情跟我没什么关系,但是那天我司同事喊我拼单的时候,我突然发现,奶茶的制作过程和数据分析的原理有一定相似之处!不信你看~



1.数据生成:收集情报


同事们经常就会讨论着:“喜X又出新品了”,“X雪的果茶最适合冬天”,“星X克的新品颜值很高。”(不过我一般都是谢绝之后握紧装有枸杞的保温杯

 

这就像一开始的数据生成过程,就像那些用户操作,或者那些会触发传感器的移动、热源或噪声信号等,在这一步,我们将从所有可能的特征中,选取和最后模型直接相关的那些,并据此定下需要生成、测量、统计哪些数据。

 


2.数据收集:点单


收集情报之后,确认自己具体点哪一杯,这就对应了数据收集的过程



3. 数据准备:拼单

 

当同事们全都下单之后,手机传到你这里时,你会看到,点单程序进行了一个对应的分类。这就像是把数据整理到数据库或者数据湖之类的仓库里,以便程序读取。同样,在这一步,你可能需要把数据分成用于训练和用于检测等不同的部分。

 


4. 确定数据预处理方式和算法:选择茶底和容量


在数据分析的过程中,茶(咖啡/奶)底就是你要采用的数据预处理方法,而容量就是数学算法,不同的选项将是影响你模型的超参数。



5. 选择模型:加料


选定了数据预处理方式和算法,也就是定了基底之后还要在考虑看看要不要加些芋圆、珍珠或者红豆、椰果等等,这些组合就好比你的模型。



6.数据预处理:摇匀

当你需要的所有料都在一个容器时,除非你喜欢被投诉你就可以干巴巴的直接就给顾客了,一般情况下还是要摇匀,所有东西混合在一起,即使很多人都觉得这一步太麻烦。



7.特征工程(处理复杂数据):包装


有时候,你光一杯饮品很难去打动别人,但只要你稍微用点心思在包装上,一切就会显得不一样了。

 

没错,这就是特征工程!这一步很重要,因为如果你干的足够巧妙,它能在很大程度上优化模型的表现。基本上差不多每个数据分析师都喜欢这一步

 


8.训练模型:品尝


这一步是所有步骤的灵魂之处,前面忙活了半天可能就是为了这一口甜。品尝也就是训练模型的过程了,是否过甜?茶底是否最佳?都是你需要自己去体会的。

 


9.微调参数:回购


一回生,二回熟。可能你面前的这一杯还有一点小瑕疵,但是下一次就可以往完美的方向发展。

 

就像是评估和微调的过程。你需要检查你的模型,判断它是否按照你设想的那样运行。如果不是,你可能需要加入更多的特征,或者调节超参数,以期对模型产生改变。但你还需要继续训练下去!

 

但如果你就是不喜欢这家店,一喝就拉肚子,那你也只能含泪舍弃这个模型,吸取教训,从头来过。

 

不过只要坚持不懈,你的经验在加上一点点运气,还是很有希望训练出一个高性能的模型啦~


 

 

说了这么多,你真的确定不来一杯奶茶吗???

 

不过现在有一个更好的选择:就着奶茶来看免费直播课。


为了让大家少走弯路,早日掌握数据分析技能,10倍提升工作效率,在职场中步步高升,网易云课堂特别免费推出《3天Python数据分析实战营直播》课程。


在这三节课里,不仅所有的问题都有老师解答,更有资深数据分析大牛带你在通过一边现场实战一边开放互动,从而锻炼量化交易能力,快速学习数据可视化,迅速提升数据分析能力。带你少走弯路,真正实现从入门到大神。


3天数据分析实战营直播主题


11月24日&职场晋升必备


制作炫酷报告

4步带你快速学习数据可视化



11月25日&量化交易入门:


用Python做股票指标

分析和买卖时机选择




11月26日&量化交易进阶:


0基础用Python搭建量化分析平台



免费训练营参与方式

扫码添加网易小姐姐
限时免费训练营+网易内部资料包
(温馨提示:错过直播也可以扫码收看回放喔)

若扫码人数过多,显示频繁

请稍后再扫码添加~


网易内部数据分析资料包

网易数据分析4G+干货资料包,免费领!!



名师直播 干货满满


实战项目讲解


打破传统思维  知识化繁为简  巩固技能


理论实操结合  在线有奖答题


左右滑动查看更多

(更多精彩内容 等你解锁



专属学员社群


如果在学习过程中遇到问题,不用怕


👇


左右滑动查看更多

边学边练 · 稳扎稳打 · 逐一突破



免费训练营参与方式


扫码添加网易小姐姐
限时免费训练营+网易内部资料包
(温馨提示:错过直播也可以扫码收看回放喔)

若扫码人数过多,显示频繁

请稍后再扫码添加~


Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/99281
 
566 次点击  
文章 [ 1 ]  |  最新文章 3 年前