社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  Git

GitHub(微博搜索)-20231109-1

GitHub(微博搜索) • 1 年前 • 250 次点击  
本条微博地址OneFlow
#大模型日报##AI前沿动态# [技术]
【JudgeLM:经微调的语言大模型作为可扩展的评判LM】

论文链接:网页链接
Code & Models:github.com/baaivision/JudgeLM
概述:在开放式场景中评估语言大模型(LLM)具有挑战性,为了解决这一问题,本文提出将LLM经过微调,作为可扩展的评判LM(JudgeLM),以有效、高效地在开放式基准测试中评估LLM。

本文使用7B、13B和33B参数规模训练了#JudgeLM#,并对其能力和行为进行了系统分析。然后分析了将LLM经过微调作为评判LM时的关键偏见,并将它们定义为位置偏见、知识偏见和格式偏见。为解决这些问题,JudgeLM引入了一系列技术,包括交换增强、参考支持和参考剔除,显著提升了评判LM的性能。JudgeLM在现有的#PandaLM#基准测试以及本文提出的新基准测试中获得了最先进的评判性能。
搜索微博更多关键词-GitHub
Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/164129