Py学习  »  机器学习算法

白话机器学习 | 找规律

闪客 • 10 月前 • 121 次点击  
小宇:闪客闪客,现在的 AI 好神奇呀,你问它一句话它就能理解并回答你的问题,就跟人一样。这是怎么实现的呀?
闪客:这个问题可就复杂了,我可不能一句两句给你说明白。
小宇:哦,那我去问问别人吧。
闪客:别别别,这样吧,你每天晚上来我这里一小时,我一个月给你讲明白,怎么样?
小宇:那你现在先给我开个头吧,我看看你水平再决定来不来。

闪客:行,那你搬个小板凳坐那吧,我们开始。

---

闪客:现在你先忘掉 AI,忘掉所有的什么 ChatGPT、大模型、深度学习、机器学习、神经网络这些概念。

小宇:哦好,虽然我本来就没听说过这些。

闪客:啊这... 好吧,我们来一个场景。我想研究鸡的数量和腿的数量的关系,于是我列了一个表格。

鸡    腿 

5    10

7    14

8    16

9    18

那我问你,假如鸡的数量是 10,那么腿的数量是多少?
小宇:额,你是不是把我当傻帽呀,我不看你这表也知道,腿的数量就是鸡数量的 2 倍嘛,当然是 20 了!

闪客:没错,你直接找到了鸡和腿数量之间的规律,是严格符合 y = 2x 的函数关系。假如世界上所有的事情都能找到其对应的严格的函数关系,那该多好,这就是早期机器学习符号主义的愿景。

画外音:机器学习的符号主义(Symbolic AI 或 Symbolic Machine Learning) 是人工智能(AI)领域的一种方法,主要基于符号和规则来表示知识和推理。这种方法与现代机器学习方法(例如深度学习)形成了鲜明对比,后者依赖于神经网络和大量数据的模式识别。符号主义在20世纪70-90年代被广泛应用,是人工智能早期的主要研究方向之一。 

小宇:诶?这看起来非常科学严谨呀,为什么这样做不行呢?

闪客:如果能实现这个愿景固然是好的,但人们还是低估了这个世界的复杂程度。想想看,如果让你用一个函数来预测股票是涨还是跌,这可能吗?

小宇:总感觉理论上是可行的,但实际上应该做不到,不然我也不会在这学什么机器学习了哈哈。

闪客:是的,这种看似能够找到规律的事情都做不到,更别提人类智慧这种的复杂问题了。 

小宇:哎,那这可怎么办呢?

闪客:别急,咱先别考虑那么远的问题,我先给你出一个比刚刚数鸡腿更复杂点的问题,你找找看下面 X 和 Y 的关系。

X    Y 
1   2.6

2   3.0

3   3.7

4   4.5

5   4.4

6   4.9

7   6.0

8   6.2

9   6.4

10   7.2 


小宇:额,总感觉有点规律,但又不能一下子看出来,有点烧脑。

闪客:确实,不过我们把这些点画在坐标轴上,你再看看呢。

小宇:哇!这么看清晰了好多,不过还是不能一下子看出来什么。

闪客:那我再加一条线呢?

小宇:哎呀!这感觉已经找到规律了,大概就是 y = 0.5x + 2 嘛!

闪客:没错,你居然直接把函数说出来了。

小宇:你图都画成这样了,我还说不出函数,那就太不应该了。不过我猜到你接下来要说什么了,就是如何找到这个函数对吧?

闪客:没错,直觉上,我们是想让这条线尽可能靠近所有点,但怎么用数学或计算机语言表达"靠得近",就是个问题了。

小宇:emmm,好像不太容易想到,没想到这么简单直观的问题,要是用严肃的数学语言描述,还挺难的。

闪客:是的,我给你加几条线,你看看有没有启发。

小宇:啊!我明白了,可以用每个点到这条线的偏离距离的总和,来表示点与线的“贴合程度”,这个数越小越好。

闪客:没错!所以我们就可以定义如下的损失函数,来表示这条线和这些点的偏离程度,只要找到这个函数的最小值即可!

小宇:额,闪客,你这太不丝滑了呀,前面还一个公式都没有,怎么突然冒出来这么个东西。

闪客:哈哈,今天讲的内容已经足够多啦,剩下的就留到下节课再讲吧。我看也到饭点了,我们一起去吃个饭吧。

小宇:哦不了,最近积攒了好多综艺节目还没有看,我要回去看电视啦,下次见。

闪客:哦~

Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/176257