社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  aigc

星环科技入局 AIGC!发布“无涯”“求索”两款大模型

AI前线 • 12 月前 • 125 次点击  

作者 | 李冬梅

以 ChatGPT 为代表的超大语言模型的迅速应用,加速了 AI 普及,让 AI 伸手可及,并开始走进大众的工作和生活。毫无疑问,AI 大模型等技术已经深刻地影响到所有行业的发展,并正在重构企业核心产品,重塑用户与企业产品和服务的交互方式。

5 月 26 日,星环科技在“向星力·未来数据技术峰会(FDTC)”上发布了金融大模型“无涯”和大数据分析大模型 SoLar“求索”。

“无涯”是一款面向金融量化领域、超大规模参数量的生成式大语言模型。无涯使用上百万的专业金融语料,其中涵盖了研报、公告、政策、新闻等高质量的自然语言文本来作为基础大模型的二次预训练语料,使得“无涯”具备对包括基本面、技术面、消息面在内的金融通识领域准确的理解能力。

无涯构建了包括政策、舆情、ESG、风险、量价、产业链等六类大模型基础因子集,擅长处理金融量化领域的各类问题,诸如在政策和研报分析、新闻解读、事件总结和演绎推理上都具备强大的理解和生成能力;能够对股票、债券、基金、商品等各类市场事件进行全面的复盘、传播和推演;能够生成另类的策略因子集合,构建立体的归因解释体系。“无涯”大模型通过多模感知 + 事件驱动 + 深度图计算,从时间和空间、深度和广度等多个方面扩展了投资研究的视角。

SoLar“求索”大模型将作为数据查询和分析的智能助手,为数据工程师、数据科学及业务人员提供更好的使用体验,让非专业用户在不需要学习和掌握数据库编程语言的前提下,就可以通过自然语言自由地按需查询数据。

星环科技创始人、CEO 孙元浩表示,未来人人都是数据科学家,人类与数据的交互方式将发生重大变革,语言、视频等自然语言的交互方式将逐渐普及, 每个人都将需要一个“虚拟业务助手”。

ChatGPT 主导的对话式 AI 开始渗透到各行各业,使人和信息结合比以往任何时候都更紧密。然而,超大模型虽好,但是要想训练、维护好一款大模型并不容易。大模型对算法、算例和数据的要求都非常高,因此如果不投入巨大的人力和无力很难有所建树,同时,目前市场现有的通用大模型对于特定领域的适用性表现也不佳。

为此,除了上述两大模型外,为了帮助企业用户基于大模型构建未来应用,星环科技推出了 Sophon LLMOps,帮助企业构建自己所在垂直领域的大模型。

作为一个机器学习模型全生命周期管理的工具平台,星环 Sophon LLMOps 针对大语言模型及其衍生数据、模型、应用问题,提供了相应的增强,形成了 LLMOps 的工具链:

首先是样本仓库能力。覆盖训练数据开发、推理数据开发、数据维护等工作,对大语言模型涉及的原始数据、样本数据、提示词数据做清洗、探索、增强、评估和管理。

第二,模型运维管理能力。除了传统 MLOps 的六大统一——统一纳管、统一运维、统一应用、统一监控、统一评估、统一解释外,针对大语言模型的微调、持续提升、评估、对齐等提供从计算框架、工具到计算、存储、通信的调度和优化支持。

第三,大语言模型和其他任务的编排和调度和上线能力。星环 Sophon LLMOps 提供 Agent、Ops、DAG,结合星环的多款大数据、数据库产品,如向量数据库 Hippo 和星环分布式图数据库 StellarDB 等,将不同大语言模型、传统机器学习、其他流程等编排成符合用户实际领域和业务需求的任务,并为客户提供服务。

孙元浩预测,未来数据处理将走向智能化、多模态和平民化。让普通人不再需要掌握复杂工具,就可以快速处理数据,这是数据处理平民化的一大追求。

你也「在看」吗? 👇

Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/155713
 
125 次点击