1.【京东发布语音合成大模型言犀LiveTTS,支持数十种方言】京东言犀发布语音合成大模型LiveTTS及通用数字人大模型2.0,支持zero-shot音色复刻和精品音色微调,并支持更精准的数字人声唇对齐,将大幅提升人机自然交互体验。在SeedTTS test-hard测试中,LiveTTS CER指标(字符错误率)较其他头部厂商模型降低了0.2%-5.12%不等,相当于每万字最多减少512处发音失误。据悉,目前该技术已针对直播、外呼、客服、营销等超10种特定商业化场景完成调优适配。(同花顺)
2.【腾讯问答模型训练专利公布,可提高问答准确性】天眼查知识产权信息显示,2月18日,腾讯科技(深圳)有限公司申请的“一种问答模型的训练方法、对象分析方法及相关设备”专利公布。摘要显示,本申请用于解决训练得到的目标问答模型的问答准确性较低的问题。
该方法至少包括:采用所述预训练问答模型,将选取的样本问题拆分为多个子问题,并基于各自的子答案,生成所述样本问题的预测答案;基于预设的多种问答评估策略,分别执行:采用一种问答评估策略,分别评估查询的各子答案各自在生成所述预测答案时的贡献值,获得评估结果;确定获得的多个评估结果满足训练筛选条件时,基于所述各子答案调整所述预训练问答模型的模型参数。通过对整个问答过程进行综合性全面评估,采用满足训练筛选条件的问答过程进行训练,可以提高训练得到的目标问答模型的问答准确性。(新浪财经)
3.【撞车DeepSeek NSA,Kimi杨植麟署名的新注意力架构MoBA发布】2月18日,DeepSeek发布了一篇新论文,提出了一种改进版的注意力机制NSA,有创始人兼CEO梁文锋亲自参与。同一天,月之暗面发布了一篇主题类似的论文,月之暗面创始人兼CEO杨植麟也是该论文的署名作者之一。这篇论文提出了一种名为MoBA的注意力机制,据介绍,MoBA是“一种将混合专家(MoE)原理应用于注意力机制的创新方法。”该方法遵循“更少结构”原则,并不会引入预定义的偏见,而是让模型自主决定关注哪些位置。(财联社)
4.【朗玛信息“39AI医生大脑”升级为具备慢思考能力的医学大模型】2月19日,贵阳朗玛信息技术股份有限公司自主研发的“39AI医生大脑”正式升级为具备慢思考能力的医学大模型,并通过“39AI全科医生”小程序新版本(s 0.9.X)向广大用户提供医疗健康服务。慢思考模式通过对病人多维度数据进行交叉验证(如症状、病史、检查结果的逻辑关联分析),可以大幅度减少单一数据误判的风险,从而较大的降低疾病的误诊率。新版“39AI全科医生”小程序(s 0.9.0)也已接入DeepSeek-R1 671B满血版,“39AI医生大脑”在对病历和报告进行深度分析和评估诊断的同时,也给用户提供了DeepSeek-R1 671B满血版的深度分析结果,这种多元化的深度分析和评估诊断可以更好的满足广大用户尤其医生用户的医学诊断需求。(腾讯)
此外,如果您还想查公司、找项目、看行业,深入了解人形机器人、商业航天、AGI等热门赛道,欢迎加入睿兽分析会员,解锁相关行业图谱和报告等。(活动期间加入会员可免费获赠一份产业日报)👇👇
