Py学习  »  chatgpt

千问LLM:三大AI助手的“奇葩说”:ChatGPT、KiMi和Claude的对决

AINLP • 11 月前 • 159 次点击  

千问LLM之二十七:“奇葩说”:从一个大模型输出错误中,看出它需要改进的路有多长?

亲爱的网友们,今天我们不聊明星八卦,不聊政治经济,我们来聊聊那些比肥皂剧还精彩的AI助手们——ChatGPT、KiMi和Claude。它们就像是三个性格迥异的室友,各有各的特点,各有各的“奇葩”之处。准备好你的爆米花,让我们一起来围观这场AI界的“奇葩说”!

从昨天的博文中我们看出大模型一开始都是个傻子,但是架不住它每时每刻的学习。听说某个公司最近要玩12天的直播活动,踏踏实实把产品做好已经不行了对吧?要天天来吹牛才行?”



01

一个问题


昨天我们一起看了千问LLM之二十六:“破案”扛把子扩散模型是如何训练出来的?其实机器一开始都是大傻子,人和机器相比,人需要休息而机器可以不用休息。人有情感,而机器没有情感。


我想让当今业界最强的大语言模型帮我解决一个求立方根的问题:

描述:计算一个浮点数的立方根,不使用库函数。
保留一位小数。数据范围:∣val∣≤20
输入描述:待求解参数,为double类型(一个实数)
输出描述:输出参数的立方根。保留一位小数。

尝试一 我让OpenAI的chatgpt给出代码:


def cube_root(val): # 确定搜索区间,若 val 为负,区间是 [val, 0],否则是 [0, val] if val >= 0: left, right = 0, val else: left, right = val, 0 # 设置精度 epsilon = 1e-6
# 二分法搜索 while right - left > epsilon: mid = (left + right) / 2 if mid**3 < val: left = mid # 如果 mid^3 < val,则从右半部分继续搜索 else: right = mid # 如果 mid^3 >= val,则从左半部分继续搜索
# 返回结果,保留一位小数 return round(left, 1)# 输入并调用函数val = float(input().strip())print(cube_root(val))

可以看出主要的算法是二分法逼近,如果我的输入是0.3,问题就是问0.3的立方根是多少?从上述算法中来看,输出的结果一定是小于等于0.3的。
GPT大言不惭的坚持认为输出是0.7。


我IDE里面实际测试发现果然输出是0.3.



尝试二 我让kimi月之暗面来解决:

我认为它提醒出了一些问题,但是很遗憾的是它也没有改对。


尝试三 ClaudeAI来解决:

答对了,它发现了需要特殊处理的情形,就是abs 小于等于1的情况。、
# 确定初始搜索范围if abs(val) <= 1:    left, right = -1, 1
def cube_root(val):    # 处理 0 的情况    if val == 0:        return 0.0
# 确定初始搜索范围 if abs(val) <= 1: left, right = -1, 1 else: if val > 0: left, right = 0, val else: left, right = val, 0
# 二分查找 epsilon = 1e-10 # 更精确的误差范围 while right - left > epsilon: mid = (left + right) / 2 cube = mid ** 3
if cube == val: return round(mid, 1) elif cube < val: left = mid else: right = mid
return round(left , 1)# 从标准输入读取try: val = float(input()) print(cube_root(val))except ValueError: print("请输入有效的数字")



02

总结

  1. ChatGPT:自信满满的“忽悠大师”

  • 想象一下,ChatGPT就像是那种在聚会上总是滔滔不绝的人。它给你的答案,总是那么自信,那么有说服力,以至于你几乎要相信它就是真理的化身。但是,当你回家一查,哦豁,原来它只是在“忽悠”你。它的准确性可能不是最高的,但它的自信和说服力,绝对能让你在不验证的情况下,觉得它给出的结果是最正确的
  • KiMi:那个总是“差一点”的可爱朋友

    • KiMi就像是那个总是差一点就能赢得比赛的朋友。它的答案可能不是完全正确,但总是那么接近,让你不禁为它鼓掌。它可能没有做对题,但整体的感觉却让人很舒服,就像是那个总是给你温暖拥抱的朋友,虽然有时候会有点小失误,但你还是愿意相信它。
  • Claude:简洁明了的“实用主义者”

    • Claude就像是那个总是一针见血的朋友。它的答案简单直接,有时候甚至让你怀疑它是不是太懒了,不愿意多说几句。但当你回过神来,你会发现,它的答案虽然简单,但却是真正能解决问题的。它就像是那个在紧急情况下,能给你指明方向的人,虽然有时候你不太愿意相信它,但它总是能带你走出困境。


    亲爱的朋友们,你们更倾向于哪种类型的AI助手呢?欢迎在评论区留下你的看法!


    进技术交流群请添加AINLP小助手微信(id: ainlp2)

    请备注具体方向+所用到的相关技术点

    关于AINLP

    AINLP 是一个有趣有AI的自然语言处理社区,专注于 AI、NLP、机器学习、深度学习、推荐算法等相关技术的分享,主题包括LLM、预训练模型、自动生成、文本摘要、智能问答、聊天机器人、机器翻译、知识图谱、推荐系统、计算广告、招聘信息、求职经验分享等,欢迎关注!加技术交流群请添加AINLP小助手微信(id:ainlp2),备注工作/研究方向+加群目的。



    Python社区是高质量的Python/Django开发社区
    本文地址:http://www.python88.com/topic/176673