社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  Git

ControlNet仅靠一张照片完成“旧房改造”!GitHub热榜第一

CVer • 2 年前 • 416 次点击  

点击下方卡片,关注“CVer”公众号

AI/CV重磅干货,第一时间送达

点击进入—>【计算机视觉】微信技术交流群

Alex 发自 凹非寺
转载自:量子位(QbitAI)

这是同一个房间改装前后的样子:

一下子质感Up,从凌乱过时变成了有腔有调的现代风。

至于设计费嘛,其实是…一分钱都没花!

因为这并不是专业设计师做的方案,而全靠一只AI完成。

——只用给AI一张照片,它就能搞定的那种。

还可以选择不同风格。

如此实用的“旧房改造”AI,很快引来大波网友驻足围观;原帖登上了GitHub热榜第一,目前已收获2700+颗星。

还在HackerNews上引起热议。

有网友称,这个应用让他觉得很惊喜,并表示:

如果这种AI还能添加一些功能就更好了,比如给生成图片中各设施进行估价,这样就有机会落地商用了。

还有网友指出:

这实际上就是一种生成式预训练Transformer,和其他Transformer本质是一样的。

一张图就能搞定房间设计

不管怎么说,这个AI确实在现有技术上整出了实用且新颖的用法。量子位没忍住也亲自上手试了试

我先找来几张破旧房间的照片,然后开始和AI共同设计改造。

说是共同改造,但其实我要做的,就只用给AI一张图,然后点击两个选项:风格和房间用途。

比如,这里选择现代风的客厅:

几秒钟后,我眼前一亮。不仔细对比左右两张图的格局,真的很难相信这是同一个房间。

除了现代风,还有其他选择,于是我又试了试极简风:

虽然这似乎不太“简”,但很精美,甚至比上面的现代风更胜一筹。(给我看得都心动了…)

不过需要说明的是,目前此AI一个IP每天最多只能用3次——实在想多弄几张的话,可以换台电脑。

看到这里,话说一只小小的AI,为何短短几秒就能设计好一整个房间?

其实,这主要得益于它背后一种强大的新晋机器学习模型:ControlNet

ControlNet,由斯坦福大学研发,是一种通过添加额外条件,来控制扩散模型的神经网络。

这个模型,可以将神经网络块的不同权重,分别复制到“锁定”副本(locked copy)和“可训练”副本(trainable copy)中。

锁定副本,会保留输入信息的一些关键特征;可训练副本,则会通过训练、学习来调节其他特征。然后,这两部分还会连接起来协同工作。

对于可训练副本而言,其训练的方向包括:物体的准确边缘、语义分割、人体姿势等等。

简单来说,就是AI能够判定,一张图中各个要素是否可以改变;然后会在原图某些核心要素不变的前提生成新的内容,不会导致生成图和原图看起来毫无联系。

另外,这个模型搭配文字“食用”效果更佳——比如刚才我选择的房间用途和装修风格,其实就是在给AI添加一点文字提示。

总而言之,基于这样的原理,ControlNet不仅可以胜任室内设计,还有可以玩出别的花样。

比如,一键涂色:

还有“一键换猫”(猫换了,但可爱的歪头杀不变)

“一键换牛”:

Emmm,那某些游戏皮肤是不是……?

值得一提的是,如果你嫌专门登陆官网(见传送比较麻烦,可以通过API将这个AI应用连到你的本地应用上。

按这种用法,首先需要下载数据库。

git clone https://github.com/Nutlope/roomGPT

接着去Replicate网站上创建一个帐户,并获取 API 密钥。注意,然后需要把将API 密钥存储在 .env 文件中,如 .example.env。

再安装依赖项:

npm install

然后你就能在命令行中运行该AI了:

npm run dev

开发者简介

最后,来认识一下此AI的幕后开发者:其实一共就3个人。

其中,最主要的贡献者Hassan El Mghari,本科毕业于德雷塞尔大学计算机工程系,现在是一名全栈软件工程师。

除了开发各种应用,这哥们儿还曾创立了一家游戏营销公司,在Steam上拥有500,000+名用户。

官网传送门:
https://www.roomgpt.io/
Relicatec传送门:
https://replicate.com/
参考链接:
[1]https://github.com/Nutlope/roomGPT
[2]https://news.ycombinator.com/item?id=35001046
[3]https://levelup.gitconnected.com/controlnet-control-your-ai-art-generation-616c86c88964
[4]https://www.elmghari.com/about

点击进入—>【计算机视觉】微信技术交流群


最新CVPP 2023论文和代码下载


后台回复:CVPR2023,即可下载CVPR 2023论文和代码开源的论文合集

后台回复:Transformer综述,即可下载最新的3篇Transformer综述PDF


扩散模型和GAN交流群成立


扫描下方二维码,或者添加微信:CVer333,即可添加CVer小助手微信,便可申请加入CVer-扩散模型和GAN 微信交流群。另外其他垂直方向已涵盖:目标检测、图像分割、目标跟踪、人脸检测&识别、OCR、姿态估计、超分辨率、SLAM、医疗影像、Re-ID、GAN、NAS、深度估计、自动驾驶、强化学习、车道线检测、模型剪枝&压缩、去噪、去雾、去雨、风格迁移、遥感图像、行为识别、视频理解、图像融合、图像检索、论文投稿&交流、PyTorch、TensorFlow和Transformer等。


一定要备注:研究方向+地点+学校/公司+昵称(如扩散模型和GAN+上海+上交+卡卡),根据格式备注,可更快被通过且邀请进群


▲扫码或加微信号: CVer333,进交流群


CVer学术交流群(知识星球)来了!想要了解最新最快最好的CV/DL/ML论文速递、优质开源项目、学习教程和实战训练等资料,欢迎扫描下方二维码,加入CVer学术交流群,已汇集数千人!


扫码进群

▲点击上方卡片,关注CVer公众号

整理不易,请点赞和在看

Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/152830
 
416 次点击