小宇:闪客闪客,现在的 AI 好神奇呀,你问它一句话它就能理解并回答你的问题,就跟人一样。这是怎么实现的呀?闪客:这个问题可就复杂了,我可不能一句两句给你说明白。闪客:别别别,这样吧,你每天晚上来我这里一小时,我一个月给你讲明白,怎么样?小宇:那你现在先给我开个头吧,我看看你水平再决定来不来。闪客:行,那你搬个小板凳坐那吧,我们开始。
---
闪客:现在你先忘掉 AI,忘掉所有的什么 ChatGPT、大模型、深度学习、机器学习、神经网络这些概念。
闪客:啊这... 好吧,我们来一个场景。我想研究鸡的数量和腿的数量的关系,于是我列了一个表格。
鸡 腿
5 10
7 14
8 16
9 18
那我问你,假如鸡的数量是 10,那么腿的数量是多少?小宇:额,你是不是把我当傻帽呀,我不看你这表也知道,腿的数量就是鸡数量的 2 倍嘛,当然是 20 了!闪客:没错,你直接找到了鸡和腿数量之间的规律,是严格符合 y = 2x 的函数关系。假如世界上所有的事情都能找到其对应的严格的函数关系,那该多好,这就是早期机器学习符号主义的愿景。
画外音:机器学习的符号主义(Symbolic AI 或 Symbolic Machine Learning) 是人工智能(AI)领域的一种方法,主要基于符号和规则来表示知识和推理。这种方法与现代机器学习方法(例如深度学习)形成了鲜明对比,后者依赖于神经网络和大量数据的模式识别。符号主义在20世纪70-90年代被广泛应用,是人工智能早期的主要研究方向之一。 小宇:诶?这看起来非常科学严谨呀,为什么这样做不行呢?
闪客:如果能实现这个愿景固然是好的,但人们还是低估了这个世界的复杂程度。想想看,如果让你用一个函数来预测股票是涨还是跌,这可能吗?
小宇:总感觉理论上是可行的,但实际上应该做不到,不然我也不会在这学什么机器学习了哈哈。
闪客:是的,这种看似能够找到规律的事情都做不到,更别提人类智慧这种的复杂问题了。
小宇:哎,那这可怎么办呢?
闪客:别急,咱先别考虑那么远的问题,我先给你出一个比刚刚数鸡腿更复杂点的问题,你找找看下面 X 和 Y 的关系。
X Y
1 2.6
2 3.0
3 3.7
4 4.5
5 4.4
6 4.9
7 6.0
8 6.2
9 6.4
10 7.2
小宇:额,总感觉有点规律,但又不能一下子看出来,有点烧脑。
闪客:确实,不过我们把这些点画在坐标轴上,你再看看呢。

小宇:哇!这么看清晰了好多,不过还是不能一下子看出来什么。
闪客:那我再加一条线呢?
小宇:哎呀!这感觉已经找到规律了,大概就是 y = 0.5x + 2 嘛!闪客:没错,你居然直接把函数说出来了。
小宇:你图都画成这样了,我还说不出函数,那就太不应该了。不过我猜到你接下来要说什么了,就是如何找到这个函数对吧?
闪客:没错,直觉上,我们是想让这条线尽可能靠近所有点,但怎么用数学或计算机语言表达"靠得近",就是个问题了。
小宇:emmm,好像不太容易想到,没想到这么简单直观的问题,要是用严肃的数学语言描述,还挺难的。
闪客:是的,我给你加几条线,你看看有没有启发。

小宇:啊!我明白了,可以用每个点到这条线的偏离距离的总和,来表示点与线的“贴合程度”,这个数越小越好。
闪客:没错!所以我们就可以定义如下的损失函数,来表示这条线和这些点的偏离程度,只要找到这个函数的最小值即可!

小宇:额,闪客,你这太不丝滑了呀,前面还一个公式都没有,怎么突然冒出来这么个东西。
闪客:哈哈,今天讲的内容已经足够多啦,剩下的就留到下节课再讲吧。我看也到饭点了,我们一起去吃个饭吧。
小宇:哦不了,最近积攒了好多综艺节目还没有看,我要回去看电视啦,下次见。
闪客:哦~