机器学习的模型很抽象,实际生活中的问题很复杂。本文就是要介绍如何将抽象的机器学习理论同复杂的实际业务相结合的问题。
1.准备
在归纳业务问题之前,首先要考虑机器学习模型是否使用于这些问题。也就是说,机器学习模型是否使用于实际的业务问题?
要回答这个问题,我们先要强调:机器学习模型可以发现数据中潜在的结构,然后做出预测。而且理论上讲,通过训练之后,机器学习模型预测的效果会越来越好。
我们通过一个常见的机器学习模型案例来说明这个问题。假设某一家银行希望预测信用卡违约的情况。这时,银行希望对海量信用卡交易数据的挖掘,发现其中的交易结构,特别是那些能够发现违约的结构。通过这些结构,就可以利用机器学习模型,预测未来的违约事件。
理论上讲,银行有大量的信用卡交易历史数据。面对这样的海量数据,银行无法快速而且准确地找出某一个变量来预测违约交易。这就是所谓数据的结构非常复杂。
所以,如果我们需要通过海量数据,分析它们的结构,进而做出预测,那么就可以使用机器学习模型。
2.不适合机器学习模型的情况。
机器学习并不适用于所有的情况。例如,如果我们可以通过简单的法则、公式或者计算就可获得目标值,那么就没必要使用机器学习模型。
但是,在以下两种情况,就需要使用机器学习模型。
第一,你无法确定法则。很多人工完成的工作(如判断垃圾邮件)无法通过简单的法则找到答案。影响答案的因素很多,而且它们之间也会互相影响。这样我们就不能准确的制定法则。所以要用机器学习的方法解决问题。
第二,你无法大规模实现目标。如果只有几百封邮件,你可以人工判断哪些是垃圾邮件。但是如果有上百万封邮件,用人工的办法就不行了。这时就要用机器学习模型。