社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  chatgpt

AI 小报第 4 期:Qwen2.5 全系列开源、可灵 1.5 模型、ChatGPT 新增指令等

AI工具派 • 8 月前 • 198 次点击  

往期 AI 小报:

离国庆长假还有 7 天,哈哈,今天一起回顾下上周在知识星球上分享的主要内容,包括以下内容:

  1. 🔥 Qwen2.5 系列正式开源!
  2. 🔥 可灵 1.5 模型发布,新增运动笔刷能力!
  3. 🔥 通义万相 AI 生视频正式上线
  4. 🌈 阿里通义上线“智能生成 PPT”,完全免费
  5. 🍭 重磅升级!OpenAI o1 使用权限大提升!
  6. 🍭 腾讯元器智能体支持发布到微信公众号
  7. 📚 GOT-OCR2.0:阶跃星辰推出的端到端通用 OCR 模型
  8. 📚 ChatGPT 新增“/picture”和“/search”指令
  9. 📚Suno 推出 Covers 功能,一键翻唱任意风格歌曲

接下来详细了解下:

1. 🔥 Qwen2.5 系列正式开源!

上周 Qwen 在云栖大会上,正式宣布 Qwen2.5 系列大模型开源!包括通用模型 Qwen2.5编程模型 Qwen2.5-Coder数学模型 Qwen2.5-Math

其中模型尺寸从 0.5B 到 72B,覆盖终端设备到企业级,非常完整!

相关链接:

  1. 开源地址:https://huggingface.co/collections/Qwen/qwen25-66e81a666513e518adb90d9e
  2. Github 仓库:https://github.com/QwenLM/Qwen2.5?tab=readme-ov-file
  3. 在线 demo:https://huggingface.co/spaces/Qwen/Qwen2.5
  4. API 地址:https://help.aliyun.com/zh/model-studio/developer-reference/what-is-qwen-llm
  5. 文档地址:https://qwen.readthedocs.io/zh-cn/latest/#

详细可以看下面大图:

2. 🔥 可灵 1.5 模型发布,新增运动笔刷能力!

上周可灵又迎来全新版本,此次发布的 1.5 版本,主要内容包括:

  1. 基座模型升级:可灵 1.5 模型支持生成 1080P 高清视频,清晰度大幅提升,画面美感运动合理度文本响应度均有明显提升!
  2. 新增“运动笔刷”功能:可灵 1.0 模型图生视频新增“运动笔刷”功能,为图片中的人物/物体等各种元素指定运动轨迹,从而实现更好的运动控制和运动表现!

近期其他更新内容包括:

  1. 支持一次性生成最多 4 条视频,方便快速多次抽卡;
  2. “图生视频功能”新增支持 10 秒时长,标准模式下支持增加尾帧;
  3. “AI 图片”生成支持“画质增强”;
  4. 上线“AI 图片”,帮助大家更好地使用可灵 AI

官方介绍:https://mp.weixin.qq.com/s/-PemOoM0y47JT2idf_rSBQ

3. 🔥 通义万相 AI 生视频正式上线

就在上周,通义万相 AI 生视频正式上线,效率非常高!目前通义万相完全免费不限量,并且支持 APP 端网页端

官方网址:https://tongyi.aliyun.com/wanxiang/
官方介绍:https://mp.weixin.qq.com/s/mFaT7NVPe_yi_dPeq8NCCg

目前通义万相支持“文生视频”和“图生视频”,可以生成多种风格视频,支持中国风灵感扩写超现实主义等。支持 2 个核心功能:

  1. 灵感扩写:通过简单提示词,生成丰富细致的描述,帮用户生成更好的视频内容;
  2. 音频生成:生成的视频自带音频,直接省去单独创作音效的环境,一步到位。

4. 🌈 阿里通义上线“智能生成 PPT”,完全免费

Chris 最近在通义网页版上,发现通义上线了“智能生成 PPT”功能了!经过简单体验一番,简直太香了~

🔍 详细介绍:https://mp.weixin.qq.com/s/hOayOHDSMDm8pvlgbrC3SQ
🔗 官方地址:https://tongyi.aliyun.com/qianwen/

其核心功能包括:

  1. 上传文件生成 PPT:支持上传文档音视频文件网页链接,直接生成 PPT;
  2. 长文本生成 PPT:支持输入长文本进行生成 PPT;
  3. 免费下载 PPT:导出功能完全免费,支持导出为 PPT、PDF、图片和长图;
  4. 随时更换 PPT 模板:支持对生成好的 PPT 直接更换模板,用户使用时,就不用特地重新再生成一遍 PPT 了,很方便。

5. 🍭 重磅升级!OpenAI o1 使用权限大提升!

为感谢大家对 OpenAI o1 的热情支持,OpenAI 特别为 Plus 和 Team 用户带来了超大福利:

  • o1-mini:每周 50 条消息直接提升到每天 50 条!畅享 7 倍升级,用更多,玩更多!
  • o1-preview:消息限额从每周 30 条提升至每周 50 条!虽然成本更高,但我们仍希望大家能多体验这款强大工具!

官方介绍:https://x.com/openai/status/1835857163765637607?s=46

6. 🍭 腾讯元器智能体支持发布到微信公众号

腾讯元器智能体终于支持发布到微信公众号啦,算是闭环起来了。可以用来作为数字分身,7*24 小时客服,粉丝互动等场景。

🌟“AI 工具派”公众号已经第一时间接入,效果不错,大家可以在后台与“AI 工具派”公众号对话试试~

使用教程:https://docs.qq.com/aio/p/scxmsn78nzsuj64?p=UaURIMeI5yybhR1GbWJuaLw
官方介绍:https://mp.weixin.qq.com/s/4J_wwjqtdS-YEhn-GzXYEw

7. 📚 GOT-OCR2.0:阶跃星辰推出的端到端通用 OCR 模型

GOT-OCR2.0 是阶跃星辰推出的一款端到端通用 OCR 模型,支持多语言多模态,采用端到端架构,可直接从图像中识别并提取文本,无需进行复杂预处理。

其特点如下:

  1. 不仅能识别文本,还可识别数学公式、分子式、图表、乐谱、几何图形等。
  2. 支持多种输入格式,如照片、文档、切片等,也支持多种输出格式,除纯文本外,还能生成 Markdown、TikZ、SMILES、Kern 等。
  3. 解码器支持 8K 最大长度的 token,能够处理长文本场景。
  4. 具备交互式 OCR 功能、动态分辨率策略以及多页 OCR 技术支持。

详细可以查看:

  • Github 仓库地址:https://github.com/Ucas-HaoranWei/GOT-OCR2.0
  • 模型地址:https://huggingface.co/ucaslcl/GOT-OCR2_0

8. 📚 ChatGPT 新增“/picture”和“/search”指令

OpenAI 进一步改善 ChatGPT 的用户体验,新增了两个快捷指令功能:

  1. /picture指令:调用 OpenAI 的 DALL-E 文生图模型,即使用户没有提供明确提示,只需选择/picture,系统便可自动生成图像。
  2. /search指令:开启搜索模式,用户输入的任何内容都会被视为搜索查询。即使没有输入新内容,ChatGPT 也能根据与用户上次讨论的内容,自动提取相关信息。

9. 📚Suno 推出 Covers 功能,一键翻唱任意风格歌曲

Suno 推出 Covers 翻唱功能,支持一键翻唱任意风格歌曲,可以将任何音频、歌曲转化为另一种全新的风格且保留原有的旋律。

功能介绍:

  1. 支持从器乐到人声,通过给器乐曲目添加歌词,制作出多层次的音乐作品;
  2. 支持转换上传的音频,上传一段唱歌、哼唱或演奏乐器的片段,使用翻唱功能进行重新演绎;
  3. 该功能现已向所有 Pro/Premier 订阅用户开放,并赠送 100 次免费翻唱机会。

工具地址:https://suno.com/
工具介绍:https://mp.weixin.qq.com/s/e4bLgllZe3_bsvff9L1Buw

下期见~!

Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/174397
 
198 次点击