社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  chatgpt

千问LLM:三大AI助手的“奇葩说”:ChatGPT、KiMi和Claude的对决

AINLP • 5 月前 • 92 次点击  

千问LLM之二十七:“奇葩说”:从一个大模型输出错误中,看出它需要改进的路有多长?

亲爱的网友们,今天我们不聊明星八卦,不聊政治经济,我们来聊聊那些比肥皂剧还精彩的AI助手们——ChatGPT、KiMi和Claude。它们就像是三个性格迥异的室友,各有各的特点,各有各的“奇葩”之处。准备好你的爆米花,让我们一起来围观这场AI界的“奇葩说”!

从昨天的博文中我们看出大模型一开始都是个傻子,但是架不住它每时每刻的学习。听说某个公司最近要玩12天的直播活动,踏踏实实把产品做好已经不行了对吧?要天天来吹牛才行?”



01

一个问题


昨天我们一起看了千问LLM之二十六:“破案”扛把子扩散模型是如何训练出来的?其实机器一开始都是大傻子,人和机器相比,人需要休息而机器可以不用休息。人有情感,而机器没有情感。


我想让当今业界最强的大语言模型帮我解决一个求立方根的问题:

描述:计算一个浮点数的立方根,不使用库函数。
保留一位小数。数据范围:∣val∣≤20
输入描述:待求解参数,为double类型(一个实数)
输出描述:输出参数的立方根。保留一位小数。

尝试一 我让OpenAI的chatgpt给出代码:


def cube_root(val): # 确定搜索区间,若 val 为负,区间是 [val, 0],否则是 [0, val] if val >= 0: left, right = 0, val else: left, right = val, 0 # 设置精度 epsilon = 1e-6
# 二分法搜索 while right - left > epsilon: mid = (left + right) / 2 if mid**3 < val: left = mid # 如果 mid^3 < val,则从右半部分继续搜索 else: right = mid # 如果 mid^3 >= val,则从左半部分继续搜索
# 返回结果,保留一位小数 return round(left, 1)# 输入并调用函数val = float(input().strip())print(cube_root(val))

可以看出主要的算法是二分法逼近,如果我的输入是0.3,问题就是问0.3的立方根是多少?从上述算法中来看,输出的结果一定是小于等于0.3的。
GPT大言不惭的坚持认为输出是0.7。


我IDE里面实际测试发现果然输出是0.3.



尝试二 我让kimi月之暗面来解决:

我认为它提醒出了一些问题,但是很遗憾的是它也没有改对。


尝试三 ClaudeAI来解决:

答对了,它发现了需要特殊处理的情形,就是abs 小于等于1的情况。、
# 确定初始搜索范围if abs(val) <= 1:    left, right = -1, 1
def cube_root(val):    # 处理 0 的情况    if val == 0:        return 0.0
# 确定初始搜索范围 if abs(val) <= 1: left, right = -1, 1 else: if val > 0: left, right = 0, val else: left, right = val, 0
# 二分查找 epsilon = 1e-10 # 更精确的误差范围 while right - left > epsilon: mid = (left + right) / 2 cube = mid ** 3
if cube == val: return round(mid, 1) elif cube < val: left = mid else: right = mid
return round(left , 1)# 从标准输入读取try: val = float(input()) print(cube_root(val))except ValueError: print("请输入有效的数字")



02

总结

  1. ChatGPT:自信满满的“忽悠大师”

  • 想象一下,ChatGPT就像是那种在聚会上总是滔滔不绝的人。它给你的答案,总是那么自信,那么有说服力,以至于你几乎要相信它就是真理的化身。但是,当你回家一查,哦豁,原来它只是在“忽悠”你。它的准确性可能不是最高的,但它的自信和说服力,绝对能让你在不验证的情况下,觉得它给出的结果是最正确的
  • KiMi:那个总是“差一点”的可爱朋友

    • KiMi就像是那个总是差一点就能赢得比赛的朋友。它的答案可能不是完全正确,但总是那么接近,让你不禁为它鼓掌。它可能没有做对题,但整体的感觉却让人很舒服,就像是那个总是给你温暖拥抱的朋友,虽然有时候会有点小失误,但你还是愿意相信它。
  • Claude:简洁明了的“实用主义者”

    • Claude就像是那个总是一针见血的朋友。它的答案简单直接,有时候甚至让你怀疑它是不是太懒了,不愿意多说几句。但当你回过神来,你会发现,它的答案虽然简单,但却是真正能解决问题的。它就像是那个在紧急情况下,能给你指明方向的人,虽然有时候你不太愿意相信它,但它总是能带你走出困境。


    亲爱的朋友们,你们更倾向于哪种类型的AI助手呢?欢迎在评论区留下你的看法!


    进技术交流群请添加AINLP小助手微信(id: ainlp2)

    请备注具体方向+所用到的相关技术点

    关于AINLP

    AINLP 是一个有趣有AI的自然语言处理社区,专注于 AI、NLP、机器学习、深度学习、推荐算法等相关技术的分享,主题包括LLM、预训练模型、自动生成、文本摘要、智能问答、聊天机器人、机器翻译、知识图谱、推荐系统、计算广告、招聘信息、求职经验分享等,欢迎关注!加技术交流群请添加AINLP小助手微信(id:ainlp2),备注工作/研究方向+加群目的。



    Python社区是高质量的Python/Django开发社区
    本文地址:http://www.python88.com/topic/176673
     
    92 次点击