社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  chatgpt

AI日报:即梦3.0内测直出2K商业海报;ChatGPT又更新图片生成功能;饿了么推“AI入驻智能经理”

AIbase基地 • 4 周前 • 140 次点击  
AI日报

4月3日•AIbase

1、设计师天又塌了!即梦3.0内测:可直出2K商业海报

2、ChatGPT又更新了图片生成功能

3、饿了么推出“AI入驻智能经理” 新商家上线只需 5 分钟

4、Hugging Face 新增实用功能:一键查看电脑可运行模型

5、字节跳动在Hugging Face发布MegaTTS3:轻量化语音合成新突破

6、OpenAI 的 o3模型成本修正:每任务价格或将达到30,000美元

7、Genspark发布自动化AI代理Super Agent 具备自主思考、调用工具的能力

8、OpenAI推出AI Agent评测基准PaperBench

9、2024 年全球移动发行商收入榜单发布OpenAI 首次上榜

10、谷歌DeepMind预测:到2030年AGI 可能会超过人类并发布安全策略

11、NotebookLM 推出 “ Discover sources” 功能,输入主题系统自动搜集网络来源


1. 设计师天又塌了!即梦3.0内测:可直出2K商业海报


即梦3.0模型在图像生成领域取得了重大突破,能够通过简单的文字提示生成高质量、细节丰富的图像。其对复杂场景和细节的精准把控,使得生成的视觉效果超越了传统设计师的手工绘制水平。



亮点提要:

🖼️ 即梦3.0在图像质量上有重大突破,能够生成细节丰富的图像作品。

⚙️ 该模型在训练数据量和生成网络结构上进行了大幅改进,提升了用户意图理解能力。

⏱️ 从输入提示到输出成品仅需数秒,极大提升了创意迭代的效率。




2. ChatGPT又更新了图片生成功能


最近,ChatGPT的图片生成能力得到了显著提升,尤其是在中文文字生成方面。新版本不仅支持草书生成,还在细节渲染和对复杂指令的理解上有了明显改进。用户能够通过简单的描述生成高质量的图像,这一快速迭代的能力展示了OpenAI在算法优化上的深厚积累。


image.png


亮点提要:

🎨 新版ChatGPT支持草书生成,文字笔画完整且准确。

🛠️ 引入选区工具,用户可对图像特定区域进行精细调整。

🚀 细节渲染和色彩协调性有明显提升,满足用户需求。




3. 饿了么推出“AI入驻智能经理” 新商家上线只需 5 分钟


饿了么近期推出了“AI入驻智能经理”这一智能助手,旨在简化新商家的入驻流程。商家在启动外卖业务时,整个入驻过程可在最快5分钟内完成,极大地提高了效率。该助手提供24小时自然语言对话服务,支持商家完成实名认证、签约授权、材料上传等一站式操作,避免了以往繁琐的手动填写申请表的过程。


image.png


亮点提要:

🍔 饿了么推出 AI 入驻智能经理,商家上线外卖最快仅需5分钟。

🤖 该智能助手提供24小时服务,支持材料上传、实名认证等一站式入驻流程。

💰 饿了么计划在2025年前投入超10亿元,持续加强 AI 技术的应用支持。




4.  Hugging Face 新增实用功能:一键查看电脑可运行模型


Hugging Face 推出了一个新功能,允许用户轻松查看其电脑硬件可以运行哪些机器学习模型。用户只需在个人设置中添加硬件信息,系统将智能分析并显示可运行的模型。这一功能简化了模型选择过程,特别对开发者和 AI 爱好者非常友好。


image.png


亮点提要:

🛠️ 用户可以通过设置添加硬件信息,系统将显示可运行的机器学习模型。

📊 该功能直观便捷,简化了开发者和研究人员的模型选择流程。

🔗 新功能与 Hugging Face 生态系统其他工具互补,提升开发效率。




5. 字节跳动在Hugging Face发布MegaTTS3:轻量化语音合成新突破


字节跳动在Hugging Face上发布了其最新的文本转语音模型MegaTTS3,吸引了全球AI研究者的关注。该模型以其轻量化设计和多语言支持而闻名,参数仅为0.45亿,适合资源受限的设备使用。



亮点提要:

🛠️ MegaTTS3是字节跳动与浙江大学合作开发的轻量级语音合成工具,参数仅为0.45亿,适合资源受限设备。

🌍 支持中英混合朗读和口音强度控制,用户可生成多样化的语音输出,满足个性化需求。

📥 开源代码和模型已在GitHub和Hugging Face上发布,推动AI技术的普及和创新。

详情入口:

🔗 https://huggingface.co/ByteDance/MegaTTS3




6. OpenAI 的 o3模型成本修正:每任务价格或将达到30,000美元


Arc Prize Foundation对OpenAI即将推出的o3推理AI模型的成本估算进行了重大修正,预计每项ARC-AGI任务的费用将达到30,000美元,这一价格比最初的3,000美元高出十倍。尽管o3尚未正式发布,Arc Prize Foundation认为o1-pro模型的成本更能反映o3的真实情况。


亮点提要:

💸 成本修正:o3模型的每项ARC-AGI任务成本从3,000美元调整至30,000美元,显示出高昂的运行费用。

🖥️ 计算需求:o3high配置在解决ARC-AGI问题时所需计算量是o3low的172倍,反映出模型的复杂性。

📈 企业计划:OpenAI可能为企业客户推出高价计划,专业AI代理的月费或达2万美元。




7. Genspark发布自动化AI代理Super Agent 具备自主思考、调用工具的能力


Genspark最近推出了其全新的自动化AI代理Super Agent,凭借其强大的自主思考和任务执行能力,迅速成为行业的焦点。该系统采用了创新的多智能体混合系统设计,能够在多种场景下高效处理任务,从日常事务到复杂研究均展现出巨大潜力。


image.png


亮点提要:

🚀 Super Agent通过多智能体混合系统设计,整合了8个大型语言模型,提升了任务处理的灵活性和准确性。

🛠️ 该系统配备超过80种工具,能够与外部系统无缝交互,完成从信息检索到实际操作的全流程任务。

🔍 尽管Super Agent表现出色,但其具体实现细节尚未完全公开,未来在复杂任务中的表现仍需进一步验证。

详情入口:

🔗 https://top.aibase.com/tool/genspark




8. OpenAI推出AI Agent评测基准PaperBench


OpenAI团队推出了PaperBench基准测试,旨在评估AI代理在复制先进AI研究方面的能力。该测试要求AI代理从头开始复制20篇2024年国际机器学习会议的重点和口头论文,整个过程涉及理解论文贡献、开发代码库以及成功执行实验。研究团队设计了详细的评分标准,并开发了基于大型语言模型的自动评分系统。


亮点提要:

🌟 PaperBench是一个新基准,用于评估AI代理复制AI研究的能力,涉及20篇ICML2024论文。

🔍 该测试设计了8316个可单独评分的任务,评分标准与论文作者共同开发。

🤖 Claude3.5Sonnet是测试中表现最佳的模型,但仍未超越顶尖人类研究者。

详情入口:

🔗 https://github.com/openai/preparedness/tree/main/project/paperbench




9. 2024 年全球移动发行商收入榜单发布OpenAI 首次上榜


Sensor Tower发布的《2024年全球移动发行商收入 TOP50》榜单显示,全球移动应用市场付费总额首次突破1500亿美元,增长13%。腾讯继续稳居第一,字节跳动紧随其后,AI技术的崛起使OpenAI首次进入榜单,显示出其在用户分析和个性化推荐方面的进步。


image.png


亮点提要:

🎮 腾讯以绝对优势继续领跑全球移动发行商,得益于其丰富的产品线和庞大的用户基础。

📊 字节跳动通过TikTok的全球化战略实现了38.2%的收入增长,稳居第二。

🤖 OpenAI首次进入全球TOP50,显示出在用户分析和内容生成等领域的显著进步。




10. 谷歌DeepMind预测:到2030年AGI 可能会超过人类并发布安全策略


谷歌DeepMind最近发布了一份战略文件,详细阐述了其开发安全人工通用智能(AGI)的方针。AGI被定义为能够与人类在大多数认知任务中匹配或超越的系统。DeepMind预计,当前的机器学习方法,尤其是神经网络,将是实现AGI的主要途径。


亮点提要:

💡 AGI系统可能在2030年前超越人类能力,影响多个领域。

🔒 DeepMind关注防止AI滥用和目标错位,推出多层次安全策略。

⚡ 报告分析基础设施限制,认为继续扩展具经济可行性。




11. NotebookLM 推出 “ Discover sources” 功能,输入主题系统自动搜集网络来源


谷歌的NotebookLM推出了新功能“Discover sources”,旨在帮助用户快速获取网络上的相关信息。用户只需输入感兴趣的主题,系统便能迅速找到相关网页并总结,用户可以一键将这些来源添加到笔记本中,方便查阅。


亮点提要:

🌐全新功能: NotebookLM推出“Discover sources”,让用户能快速获取网络信息。

📝便捷操作: 用户只需输入主题,即可获得相关来源并一键添加到笔记本。

🔍趣味体验: 新用户可通过“我很好奇”按钮随机生成话题,体验系统功能


           

点击阅读原文,进AIbase官网.


Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/180671
 
140 次点击