社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  aigc

开发者活动 | 业界首个云端 AIGC 合成数据实操课程,成功落地国内十所院校!

NVIDIA企业开发者社区 • 1 年前 • 134 次点击  

2023 年 8 月 13 日- 9 月 24 日,NVIDIA 企业开发者社区、赞奇科技联合发起业界首个云端 AIGC 合成数据生成体验课程,先后在南开大学、兰州大学、中国海洋大学、上海海洋大学、西南石油大学、中国农业大学、南京大学、复旦大学、东莞理工学院、上海大学十所知名高校开设专场课程,共有 476 名学生(含本科、硕士、博士)参与课程,其中 375 名学生通过考核取得课程证书。


图1- 课程任务场景:利用软件工具生成逼真的小车行进的场景照片,用于替换现实环境中拍摄的 1,700 多张照片以及手动标注的工作量,自动避障小车经训练后可在无锥桶障碍物的空间里自由行走。


“AI 合成数据科普进校园” 在线培训每次为 3 小时,每课提供 50 个名额。课程由 NVIDIA 企业开发者社区授课,讲师为 NVIDIA GPU、CUDA 应用市场总监侯宇涛、NVIDIA 企业开发者社区高级经理何琨。课程云平台为赞奇云工作站。开发工具包括 NVIDIA Omniverse™ Code、NVIDIA Omniverse™ Replicator 、Visual Studio Code、Jupyter Notebook、Anaconda、PyTorch、NVIDIA TensorRT™。


课程分为四个版块,包括:合成数据生成理论课、合成数据生成实操课、数据清洗及数据集训练理论课、数据清洗及数据集训练实操课。在 NVIDIA A4000 显卡、Omniverse+Code 编程环境下,讲师以一个四分类的自动避障小车训练数据集制作的代码编制和运行过程为例,带领学生在云端编程环境中,体验合成数据生成、训练和推理的整个流程。


在讲师的带领下,学员可通过 8 段实验代码,生成涵盖 28 个场景、共计 4 个分类(free-前进/block-停止/left-左转/right-右转)的合成数据集。随后,学员在 Jupyter Lab 中通过 PyTorch、NVIDIA TensorRT™ 完成图像分类模型的训练和推理。


图2- 课程通过 Omniverse Code 界面,调用了 Omniverse Replicator 中 9 类 API



图3 - 在讲师的带领下,学员通过 8 段实验代码,生成涵盖 28 个场景、共计 4 个分类(free-前进/block-停止/left-左转/right-右转)的合成数据集



课程成果


学生们在赞奇云工作站的云端环境中,利用免费模型创建自己的场景、并利用生成的数据训练模型,初步掌握合成数据制作流程。在课程实操中,学生们完成了诸多富有创意的作品,逐步理解了合成数据生成的流程。


来一起看看大家的创作吧!




>> 左右滑动查看学生生成的场景图片 >>





>> 左右滑动查看学生训练模型的结果图片 >>



课程寄语


刘晓光
南开大学计算机学院、网络空间安全学院副院长
“非常荣幸能够在南开大学承办这场课程。同学们已经对 NVIDIA CUDA、AI 方向的一些工作比较熟悉,包括图形、AI 训练等方面。这次课程是数据方面,希望之后能够和 NVIDIA、赞奇科技在这方面深化合作。”

周庆国
兰州大学信息科学与工程学院教授、博士生导师
“感谢 NVIDIA 这么多年来对兰大的支持,从最早期帮助我们建立俱乐部,到后期的活动支持与 AI 培训,再到每年的 GTC 大会高校会议,以及此次的合成数据生成入门培训。NVIDIA 一直为我们输送前沿的知识与技术,通过校企合作促进 AI 人才培养,提升学生的就业竞争力。”

王胜科
中国海洋大学计算机科学与技术学院实验中心主任
“感谢 NVIDIA 对中国海洋大学的支持,一直为我们输送前沿的知识与技术。合成数据是一个比较新的话题,我们很期待这次活动,希望同学们都能有所收获。”

胡庆松
上海海洋大学工程学院院长
“人工智能领域正在进行一场变革,从以模型为中心向以数据为中心转变,这个变革的关键在于合成数据。它是一种基于算法生成的虚拟的数据,可以模拟我们真实世界的情景。我期待同学们在老师的带领下,通过有趣的动手操作,开始入门级的学习。相信对同学们今后的研究、创新,都会有所帮助。”

彭博
西南石油大学计算机科学学院教授
“ AI 合成数据生成是一个热门的研究方向。期待通过本次科普活动,同学们能够对合成数据、以及 NVIDIA 提供的最新的  AI  技术、工具有更好的了解,扩展自己的视野。”

井天军
中国农业大学信息与电气工程学院副院长
“感谢 NVIDIA 和赞奇科技提供的科普培训机会,能够让同学们了解到 AI 技术如何能在数据处理中起作用,我们也很荣幸有这次机会参与到此次活动中来。期待同学们可以通过本次课程,通过理论知识与动手实践,有所收获!”

于莹
南京大学天文与空间科学学院
“感谢 NVIDIA 和赞奇科技给南京大学的同学提供一个宝贵的机会,让我们今天来感受一下用 Omniverse 合成数据的魅力。”

陈传祥
东莞理工学院计算机科学与技术学院 ACE 智能机器人实验室负责人
“AIGC 的内容正是大家热切期待了解的技术。希望同学们能够认真学习,争取通过课程任务。感谢 NVIDIA的支持,也感谢赞奇科技提供这么好的一个实践环境。”

李晓强
上海大学计算机工程与科学学院副院长
“计算机从早期的计算时代、数据时代进入到机器学习时代,机器可以学习了。深度学习,又是机器学习的一个代表。这次培训内容,也是 AIGC 的一部分,属于目前人工智能领域的前沿方向。祝贺这次课程圆满成功!”

刘念宁

NVIDIA 全球副总裁

“合成数据应用于 AI 训练场景,已经成为了应对数据采集挑战的创新方法!同学们如果想成长为全栈式 AI 开发工程师,不仅要学会用 GPU 来加速计算、写算法代码去调优和训练网络,还需要学会生成 3D 场景、生成带有标注的合成数据,来加快模型训练的生命周期。感谢合作伙伴赞奇,与 NVIDIA 一起搭建了业界首个云端 AI 合成数据生成体验课的平台。我们期待与更多院校、合作伙伴携手,培养出更多全栈式 AI 开发工程师。”


梅向东

赞奇科技董事长

“对于我们将来从事 AI 开发的同学来说,提升 AI 模型训练效率,用 AI 提升开发效率的技能,将是我们工作中必备的技能,也会为未来我们工作打下坚实的基础。这其实正是赞奇和 NVIDIA 合作此次课程的初衷和目的。感谢老师们的支持,也希望同学们学有所获。”



关于合成数据生成


合成数据是指通过计算机模拟或算法生成的带有标记的虚拟数据。它可以模拟实际的情况,提供现实世界难以或者无法采集的数据,从而有助于解决数据匮乏、数据质量、数据隐私、采集成本等问题,最终推动 AI 技术的更广泛应用。目前,包括 NVIDIA、OpenAI 在内的多家公司已经应用合成数据训练自己的 AI 模型。根据 Gartner预测,到 2024 年,合成数据将占人工智能和数据分析项目中数据的60% ,成为 AI 模型训练使用数据的主要来源。


随着 AIGC 及数字孪生的发展,合成数据技术开始步入诸多人工智能应用的开发领域。计算机视觉AI 应用的模型训练需要大量高质量、多样化且无偏向的数据集。全栈式 AI 开发工程师不仅需要会用 GPU、会写算法代码调优训练网络,还要会自己设计 3D 场景生成带有标注的合成数据以加快模型训练生产周期。合成数据生成(SDG,Synthetic Data Generation)使用技术逐渐成为 AI 开发工程师的一项基本技能。


NVIDIA Omniverse™ Code 是一款 NVIDIA Omniverse 应用,可用作集成开发环境(IDE),供开发者和高级用户轻松构建自己的 Omniverse 扩展程序、应用或微服务。借助 Omniverse™ Code 工具以及 Omniverse™ Replicator 的 API 功能,学员能够生成具有精确物理属性的 3D 合成数据。



合成数据生成入门教程


合成数据生成入门教程现已上线。

扫描海报二维码或点击 “阅读原文”观看学习!



Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/162956
 
134 次点击