Py学习  »  aigc

创新先锋推荐 | 右脑科技:AIGC视觉创作赛道的"技术突围者"​

企名片 • 1 周前 • 37 次点击  

北京右脑科技有限公司成立于2022年,是一家专注于人工智能(AI)图像与视频生成技术的科技企业,核心业务涵盖AI软件开发、视觉内容创作平台、数据处理及AIGC(人工智能生成内容)应用。公司致力于通过前沿AI技术赋能创意产业,推动视觉内容生产的智能化升级。

数据来源:企名片Pro

核心团队

右脑创始团队成员均毕业于北京大学,是NUWA女娲、 智源悟道等多模态预训练大模型的核心成员, 具备微软亚洲研究院、商汤研究院、智源研究院等研究背景, 拥有业内丰富的图像视频生成的研究和落地经验,数篇成果发表于NeurIPS、ECCV、ACM MM等顶会。 目前已经完成了陆奇博士创立的奇绩创坛的种子轮,以及光速中国等一线VC数千万天使轮融资, 作为国内早期从事AI视觉生成的研究者,大模型研究经验丰富, 右脑科技致力于重塑AIGC(Artificial Intelligence Generated Content)创作生态,不断释放创作想象力。

梁健创始人兼 CEO,北京大学计算机科学硕士。曾在微软亚洲研究院(MSRA)实习期间提出 NUWA 女娲模型,长期从事视觉生成研究,代表作还有 NUWA Infinity 等,引发了学术界和业界广泛关注。他是国内最早一批从事生成式 AI 工作的研究者,具备深厚的技术背景和创新能力。

周呈华 联合创始人,北京大学软件工程硕士。曾在 STCA、智源研究院从事视觉生成研究,参与了智源悟道・文生图模型、国画模型的研发,在计算机视觉与人工智能领域有着丰富的研究经验。

史杰联合创始人,北京大学智能系统硕士。曾在微软亚洲研究院女娲项目组从事 Diffusion 模型研究,还曾任商汤研究员,负责抖散视频生成模型研究,在图像视频生成领域积累了大量的实践经验和技术成果。

数据来源:企名片Pro

核心产品与技术

Vega AI 创作平台

这是一款在线图片生成工具。它支持一键定制个人模型,能多功能辅助整套设计流程,高效生图,解放生产力。平台拥有海量风格模型广场,可超清生成图片。其功能丰富,包括文生图,用户输入描述性文本,AI 即可生成相应的图像;图生图,根据用户上传的图片,AI 生成新的图片;还支持风格训练,用户可以在线快速训练 AI 绘画模型,自由定制生成效果。

图像生成

文生图 用户输入文本描述,选择喜欢的艺术风格,AI 即可快速生成高质量图像。平台提供了写真、虚拟建模、二次元、3D 二次元、真实影像等多种基础模型,以满足不同的创作需求。

图生图用户上传任意图片,无论是模糊的素材图还是风格单一的旧作,都能通过 Vega AI 实现风格转换、元素添加、细节优化等。

条件生图支持线稿生成、动作捕捉和区域构图三种条件控制方式,用户可以上传条件图片或条件特征,如线稿、姿态图或者色块图,系统直接根据条件特征生成新的图片。

姿势生图用户可以描述一个人或物体的姿势,然后 AI 模型将根据描述生成相应的图像,方便用户创建特定姿势的图像,适用于角色设计、动作捕捉等场景。

画质提升该功能通过对图像进行细致的处理和优化,提升图像的清晰度、色彩鲜艳度和细节表现力,使生成的图像更加逼真和高质量。

视频生成

文生视频用户输入文字描述,AI 模型将根据描述生成相应的视频内容,用户可以描述场景、剧情或动作,极大地简化了视频创作流程。

图生视频用户上传一系列图像,AI 模型会将这些图像转换成一个连贯的视频,可用于制作幻灯片、动画短片或视频故事等。

模型训练

风格训练用户可以上传个人作品或素材,Vega AI 能学习其色彩搭配、构图方式、笔触风格等特征,训练出专属的个性化模型,操作简单易上手。

风格广场平台汇集了海量社区创意作品和平台精选内容,用户可以从中选择喜欢的风格,一键调用即可快速应用于图像、视频创作,为创作提供无限灵感。

Video Studio 视频创作平台

这是一个全新的 AI 视频创作平台,支持定制视频模型,具备一键视频风格切换、特效生成、拖拽式视频创作等功能。该平台支持文生视频,用户可根据文字描述生成视频,还可选择不同的风格模型和基础模型对生成效果进行更精准的控制;同时支持视频定制,用户可训练风格模型,操作简单易上手,海量风格模型可对图像进行风格化生成;此外,平台还提供拖拽控制功能,用户上传基础图片后,可通过算法按照原图的线稿、背景、人物姿势、景深等进行控制生成图片。

文生视频用户输入文字描述,AI 即可根据文字生成相应的视频内容,并且可选择不同的风格模型和基础模型对生成效果进行更精准的控制,满足用户多样化的创作需求。

视频定制支持用户训练风格模型,操作简单易上手。用户可以上传自己的素材,让 AI 学习其风格特点,从而生成具有独特风格的视频。平台还拥有海量风格模型,可对图像进行风格化生成,为视频创作提供更多创意和可能性。

拖拽控制用户上传基础图片后,可通过算法按照原图的线稿、背景、人物姿势、景深等进行控制生成图片,实现更灵活的创作方式,解放生产力,稳定易用。

风格迁移具备补充背景、补充人物、改变画幅等多功能实用性操作,能够帮助用户快速改变视频的整体风格和视觉效果,提升视频的吸引力和创意性。

视频编辑自动选区支持一键快速换脸、更换服装、发型、背景、小场景微调等实用便捷功能,方便用户对视频内容进行细节调整和优化,无需复杂的操作即可实现丰富的视频效果。

右脑多模态图像视频合成算法

算法架构该算法模型为自主研发,包括文本、图像、视频三种模态的编码器以及一个共享的视觉生成器。这种架构设计使得算法能够同时处理多种模态的输入信息,并将它们有效地融合在一起,从而生成高质量的图像和视频内容。

输入输出算法支持中英文输入,用户可以输入文本、图像或视频等多种形式的内容,算法会根据用户的输入生成符合需求的图像或视频。例如,用户可以通过输入文本描述来生成相应的图像或视频,也可以上传现有图像或视频,让算法对其进行编辑和风格转换。

主要功能

文本生成图像用户输入文本描述,算法通过文本编码器将文本信息转化为特征向量,再由共享的视觉生成器根据这些特征向量生成相应的图像。

文本生成视频基于用户输入的文本,算法能够生成连贯的视频内容,将文本中的场景、情节等以视频的形式呈现出来。

图像编辑用户上传图像后,算法可以对图像进行各种编辑操作,如风格转换、元素添加、细节优化等。算法通过图像编码器提取图像的特征,然后根据用户的编辑需求,利用视觉生成器生成编辑后的图像。

视频风格转换对于用户上传的视频,算法可以将其风格转换为其他指定的风格。算法先通过视频编码器提取视频的特征,然后根据目标风格的要求,由视觉生成器生成具有新风格的视频。

审核机制对于用户输入内容和模型输出内容,由机器审核配合人工审核进行合规性判定。模型输出内容在返回用户端前先经过机器审核,当自有检测模型和第三方评测模型都判定内容安全才返回用户端,如果判定为疑似则转交人工审核判定。同时,对于疑似内容的评测结果会反馈到检测模型,根据具体情况调整审核策略,评估检测模型的优化方向。

应用领域该算法目前在平面设计、工业设计以及影视制作等领域得到了广泛应用,主要应用场景为图像与视频内容的生成与编辑,可以显著提高视觉内容的生产效率,同时也极大地提升了创作的多样性和独创性。

应用领域


商品图与电商模特:通过 Vega AI 创作平台或 Video Studio 视频创作平台,为电商行业生成高质量的商品图片和虚拟电商模特形象,帮助电商企业更高效地展示商品,降低拍摄成本。


IP 创作:在 IP 创作领域,利用平台的图像生成和视频生成功能,为创作者提供丰富的创意支持,帮助他们快速生成 IP 形象、故事场景等内容,加速 IP 的孵化和开发。


游戏美术:为游戏开发提供美术资源,如角色设计、场景绘制、道具建模等。通过文生图、图生图等功能,快速生成游戏所需的各种美术素材,提高游戏开发的效率和质量。


产品设计: 在产品设计过程中,设计师可以借助右脑科技的平台进行产品外观设计、概念设计等。通过输入文本描述或上传现有设计草图,生成多种设计方案,为产品设计提供更多的创意和选择。


室内外设计:帮助室内外设计师快速生成设计效果图,根据客户的需求和场地条件,通过文本或图片输入,生成不同风格的室内外设计方案,方便设计师与客户沟通和确认设计方向。


AI 相机:应用于 AI 相机领域,通过图像编辑和风格转换功能,为用户提供更多样化的拍照效果,如实时风格转换、特效添加等,提升用户的拍照体验。


融资历史

数据来源:企名片Pro

*根据公开资料整理

更多企业相关内容可在【企名片APP】查询...

图片
扫码下载企名片APP~
科技企业营销拓客平台
    查企业联系企业

 往期推荐 


2025中国股权投资系列年中榜单正式揭晓


2025中国股权投资系列年中榜单--人工智能榜


创新先锋推荐 | 优理奇机器人:以全栈自研破局,领跑家庭服务机器人新赛道

Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/185849
 
37 次点击