千问LLM：三大AI助手的“奇葩说”：ChatGPT、KiMi和Claude的对决

千问LLM之二十七：“奇葩说”：从一个大模型输出错误中，看出它需要改进的路有多长？

亲爱的网友们，今天我们不聊明星八卦，不聊政治经济，我们来聊聊那些比肥皂剧还精彩的AI助手们——ChatGPT、KiMi和Claude。它们就像是三个性格迥异的室友，各有各的特点，各有各的“奇葩”之处。准备好你的爆米花，让我们一起来围观这场AI界的“奇葩说”！

“从昨天的博文中我们看出大模型一开始都是个傻子，但是架不住它每时每刻的学习。听说某个公司最近要玩12天的直播活动，踏踏实实把产品做好已经不行了对吧？要天天来吹牛才行？”

—

一个问题

昨天我们一起看了千问LLM之二十六：“破案”扛把子扩散模型是如何训练出来的？其实机器一开始都是大傻子，人和机器相比，人需要休息而机器可以不用休息。人有情感，而机器没有情感。

我想让当今业界最强的大语言模型帮我解决一个求立方根的问题：

描述：计算一个浮点数的立方根，不使用库函数。

保留一位小数。数据范围：∣val∣≤20

输入描述：待求解参数，为double类型（一个实数）

输出描述：输出参数的立方根。保留一位小数。

尝试一我让OpenAI的chatgpt给出代码：


def cube_root(val):    # 确定搜索区间，若 val 为负，区间是 [val, 0]，否则是 [0, val]    if val >= 0:        left, right = 0, val    else:        left, right = val, 0    # 设置精度    epsilon = 1e-6
    # 二分法搜索    while right - left > epsilon:


    
        mid = (left + right) / 2        if mid**3 < val:            left = mid  # 如果 mid^3 < val，则从右半部分继续搜索        else:            right = mid  # 如果 mid^3 >= val，则从左半部分继续搜索
    # 返回结果，保留一位小数    return round(left, 1)# 输入并调用函数val = float(input().strip())print(cube_root(val))

可以看出主要的算法是二分法逼近，如果我的输入是0.3，问题就是问0.3的立方根是多少？从上述算法中来看，输出的结果一定是小于等于0.3的。

GPT大言不惭的坚持认为输出是0.7。

我IDE里面实际测试发现果然输出是0.3.

尝试二我让kimi月之暗面来解决：

我认为它提醒出了一些问题，但是很遗憾的是它也没有改对。

尝试三 ClaudeAI来解决:

答对了，它发现了需要特殊处理的情形，就是abs 小于等于1的情况。、

# 确定初始搜索范围if abs(val) <= 1:    left, right = -1, 1

def cube_root(val):    # 处理 0 的情况    if val == 0:        return 0.0
    # 确定初始搜索范围    if abs(val) <= 1:        left, right = -1, 1    else:        if val > 0:            left, right = 0, val        else:            left, right = val, 0
    # 二分查找    epsilon = 1e-10  # 更精确的误差范围    while right - left > epsilon:        mid = (left + right) / 2        cube = mid ** 3
        if cube == val:            return round(mid, 1)        elif cube < val:            left = mid        else:            right = mid
    return round(left


    
, 1)# 从标准输入读取try:    val = float(input())    print(cube_root(val))except ValueError:    print("请输入有效的数字")

—

总结

ChatGPT：自信满满的“忽悠大师”

想象一下，ChatGPT就像是那种在聚会上总是滔滔不绝的人。它给你的答案，总是那么自信，那么有说服力，以至于你几乎要相信它就是真理的化身。但是，当你回家一查，哦豁，原来它只是在“忽悠”你。它的准确性可能不是最高的，但它的自信和说服力，绝对能让你在不验证的情况下，觉得它给出的结果是最正确的。

KiMi：那个总是“差一点”的可爱朋友

KiMi就像是那个总是差一点就能赢得比赛的朋友。它的答案可能不是完全正确，但总是那么接近，让你不禁为它鼓掌。它可能没有做对题，但整体的感觉却让人很舒服，就像是那个总是给你温暖拥抱的朋友，虽然有时候会有点小失误，但你还是愿意相信它。

Claude：简洁明了的“实用主义者”

Claude就像是那个总是一针见血的朋友。它的答案简单直接，有时候甚至让你怀疑它是不是太懒了，不愿意多说几句。但当你回过神来，你会发现，它的答案虽然简单，但却是真正能解决问题的。它就像是那个在紧急情况下，能给你指明方向的人，虽然有时候你不太愿意相信它，但它总是能带你走出困境。

亲爱的朋友们，你们更倾向于哪种类型的AI助手呢？欢迎在评论区留下你的看法！

进技术交流群请添加AINLP小助手微信（id: ainlp2)
请备注具体方向+所用到的相关技术点
关于AINLP
AINLP 是一个有趣有AI的自然语言处理社区，专注于 AI、NLP、机器学习、深度学习、推荐算法等相关技术的分享，主题包括LLM、预训练模型、自动生成、文本摘要、智能问答、聊天机器人、机器翻译、知识图谱、推荐系统、计算广告、招聘信息、求职经验分享等，欢迎关注！加技术交流群请添加AINLP小助手微信(id：ainlp2)，备注工作/研究方向+加群目的。