社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  机器学习算法

AWS机器学习模型:理论联系实际之前的准备

健谈始于戊戌年 • 2 年前 • 215 次点击  


机器学习的模型很抽象,实际生活中的问题很复杂。本文就是要介绍如何将抽象的机器学习理论同复杂的实际业务相结合的问题。

 

1.准备

 

在归纳业务问题之前,首先要考虑机器学习模型是否使用于这些问题。也就是说,机器学习模型是否使用于实际的业务问题?

 

要回答这个问题,我们先要强调:机器学习模型可以发现数据中潜在的结构,然后做出预测。而且理论上讲,通过训练之后,机器学习模型预测的效果会越来越好。                           

 

我们通过一个常见的机器学习模型案例来说明这个问题。假设某一家银行希望预测信用卡违约的情况。这时,银行希望对海量信用卡交易数据的挖掘,发现其中的交易结构,特别是那些能够发现违约的结构。通过这些结构,就可以利用机器学习模型,预测未来的违约事件。

 

理论上讲,银行有大量的信用卡交易历史数据。面对这样的海量数据,银行无法快速而且准确地找出某一个变量来预测违约交易。这就是所谓数据的结构非常复杂。

 

所以,如果我们需要通过海量数据,分析它们的结构,进而做出预测,那么就可以使用机器学习模型。

 

2.不适合机器学习模型的情况。

 

机器学习并不适用于所有的情况。例如,如果我们可以通过简单的法则、公式或者计算就可获得目标值,那么就没必要使用机器学习模型。

 

但是,在以下两种情况,就需要使用机器学习模型。

 

第一,你无法确定法则。很多人工完成的工作(如判断垃圾邮件)无法通过简单的法则找到答案。影响答案的因素很多,而且它们之间也会互相影响。这样我们就不能准确的制定法则。所以要用机器学习的方法解决问题。

 

第二,你无法大规模实现目标。如果只有几百封邮件,你可以人工判断哪些是垃圾邮件。但是如果有上百万封邮件,用人工的办法就不行了。这时就要用机器学习模型。

Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/121272
 
215 次点击