Py学习  »  Git

像git一样管理数据,高效的数据管理平台TensorBay来了!

我爱计算机视觉 • 4 年前 • 511 次点击  


非结构化数据,是人工智能领域重要的大数据类型,占据了数据总量的80%以上。


管理非结构化数据存在很多难点:

存储消耗空间大,没有合适空间存储庞大的非结构化数据;

版本管理困难,无法立即找所需数据版本;

 数据可视化难以实现,检索费时费力;

...

而这些难点大幅度地影响了AI开发者的开发效率。


使用TensorBay,您的难点问题将迎刃而解,您的AI开发效率也将大幅度提升!



什么是TensorBay?


TensorBay是Graviti的云端非结构化数据管理平台,为AI开发者与开发团队提供数据托管版本管理数据可视化团队协作等SaaS服务,支持通过开发者工具对数据进行直接管理和使用,与您的Pipeline轻松集成。


安全可靠的云端数据托管


您是否在数据管理上遇到过以下问题:


团队协作时,大量时间消耗在数据文件的结构管理数据复制数据迁移操作上,数据多次传输交换造成大量冗余

数据存储分散,无法快速找到数据的准确存储位置,无法快速查找和发现有价值的数据集

同类标注数据缺少统一标准,数据管理和使用需要大量代码来实现


TensorBay为您和您的团队提供云端数据托管服务:


对数据统一进行云端存储,按需读取数据

 清晰地看到数据信息,快捷高效地搜索和筛选数据

数据关系具有统一标准和格式,减少代码操作时间

TensorBay还为您提供数据筛选与合并功能,您可以通过数据集的标注信息或者Meta信息来筛选您的数据,将结果与其他数据集进行合并,帮助您快速准备一个符合需求的数据集。


清晰可追溯的数据版本管理


您是否在数据版本管理上遇到过以下问题:


版本信息记录只能通过建立不同文件夹或整合excel文档,每创建一个版本都要将上一版本全量复制备份,耗时耗力且无法清晰看到数据迭代过程

标注数据和原数据只能以文档形式分开管理,数据的对比查找操作复杂

版本数据和训练模型难以匹配,找不到模型训练的对应版本数据


TensorBay为您和您的团队提供数据版本管理服务:


几秒内Commit数据变更,灵活管理版本标签和版本信息

原数据及标注进行统一的版本管理,通过列表与树状分支图,将版本迭代过程可视化

查看和对比历史版本数据细节自由切换历史数据版本,快速开始新的数据迭代


01

清晰的版本信息管理

02

便捷的版本切换与数据查看

03

可视化版本迭代

滑动查看更多


简单易用的在线数据可视化组件


TensorBay为您和您的团队提供实时在线数据可视化组件: 


● 预览原数据:在线预览主流格式的图片、文本、音视频数据,包括多种激光雷达点云图像

 查看标注数据:在线查看标注数据的标签、属性、追踪标注等信息

 分布信息可视化:列表、柱状图、饼图等多种样式查看数据的多级标注与属性分布,在线查看、实时统计数据


01

主流视觉类数据及标注的在线可视化

02

融合数据及其标注的在线可视化

03

音频数据清晰的分类与标注

04

分布可视化:支持列表、柱状图、饼状图查看数据分布

滑动查看更多


关于Graviti

格物钛Graviti是一家AI数据服务平台提供商,通过专业的数据管理SaaS服务和构建以AI开发者为核心的开源数据集生态,降低AI开发过程中因处理非结构化数据带来的不断增长的数据获取、存储、管理和应用等成本,加速AI开发流程,提供坚实的人工智能基础设施。公司获得红衫、真格、云启以及风和资本的千万美金Pre-A轮融资。

关注Graviti公众号

了解到更多TensorBay信息


点击阅读原文,即刻开启您的TensorBay之旅。

Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/110903
 
511 次点击