以ChatGPT为代表的AI,则可以根据过去的语料来「预测下一个Token」。
那问题来了,AI能不能像先知一样,从全世界的杂乱信息里找出蛛丝马迹,准确地预测未来呢?
比如:
AI监管今年能否成为联邦法律?
美国职业足球大联盟比赛中,谁会获胜?
NBA今年的冠军会是谁?
在昨晚的男篮亚洲杯冠军争夺战中,中国男篮虽以1分之差惜败澳大利亚,但已是近十年来的最好成绩!
相信绝大部分人都不会猜到这个比分,那么,AI能否根据中国队此前的表现,提前预测到呢?
更进一步的,AI能否像拉普拉斯妖一样,在获取了当下世界的所有信息后,精确预测未来的一切?
如果它能在某一瞬间知道宇宙中所有粒子的位置与速度,并且完全理解自然规律。
那么,就可以准确计算出过去的一切,并且精确预测未来的一切。
今天要介绍的Prophet Arena就是一个通过实时更新的真实世界预测任务来评估AI系统预测智能的基准测试。
把市场共识、自动化预测、信息整理和社区洞察结合起来,形成更强的整体预测能力
简单来说,Prophet Arena作为基准测试是独一无二的:
考的是预测能力:这是一种需要综合理解力、推理能力的高级智慧。
为「人机协作」而生:你可以给AI提供线索,看看它的预测如何变化;AI也会把它的思考过程告诉你。
不会过拟合,数据永不过时:因为未来的事件永远是全新的考题。
直面真实世界:AI的预测直接与真实的投注决策挂钩,表现好的模型真的能在虚拟市场里赚到钱。
Prophet Arena以实时预测市场事件为依托,首次建立了一个无法「刷题」的动态基准。
全面衡量AI在不确定性推理、信息整合、概率预测和真实收益中的表现。
就连OpenAI 推理研究(AI reasoning research)负责人Noam Brown也赞叹,预测能力是人类独有的能力,现在AI终于开始涉足了。AI版华尔街之狼!o3-mini靠「神之押注」狂赚9倍,DeepSeek R1最特立独行
那问题来了,AI能不能像先知一样,从全世界的杂乱信息里找出蛛丝马迹,准确地预测未来呢?
比如:
AI监管今年能否成为联邦法律?
美国职业足球大联盟比赛中,谁会获胜?
NBA今年的冠军会是谁?
在昨晚的男篮亚洲杯冠军争夺战中,中国男篮虽以1分之差惜败澳大利亚,但已是近十年来的最好成绩!
相信绝大部分人都不会猜到这个比分,那么,AI能否根据中国队此前的表现,提前预测到呢?
更进一步的,AI能否像拉普拉斯妖一样,在获取了当下世界的所有信息后,精确预测未来的一切?
如果它能在某一瞬间知道宇宙中所有粒子的位置与速度,并且完全理解自然规律。
那么,就可以准确计算出过去的一切,并且精确预测未来的一切。
今天要介绍的Prophet Arena就是一个通过实时更新的真实世界预测任务来评估AI系统预测智能的基准测试。
把市场共识、自动化预测、信息整理和社区洞察结合起来,形成更强的整体预测能力
简单来说,Prophet Arena作为基准测试是独一无二的:
考的是预测能力:这是一种需要综合理解力、推理能力的高级智慧。
为「人机协作」而生:你可以给AI提供线索,看看它的预测如何变化;AI也会把它的思考过程告诉你。
不会过拟合,数据永不过时:因为未来的事件永远是全新的考题。
直面真实世界:AI的预测直接与真实的投注决策挂钩,表现好的模型真的能在虚拟市场里赚到钱。
Prophet Arena以实时预测市场事件为依托,首次建立了一个无法「刷题」的动态基准。
全面衡量AI在不确定性推理、信息整合、概率预测和真实收益中的表现。
就连OpenAI 推理研究(AI reasoning research)负责人Noam Brown也赞叹,预测能力是人类独有的能力,现在AI终于开始涉足了。AI版华尔街之狼!o3-mini靠「神之押注」狂赚9倍,DeepSeek R1最特立独行