ControlNet仅靠一张照片完成“旧房改造”！GitHub热榜第一

点击下方卡片，关注“CVer”公众号

AI/CV重磅干货，第一时间送达

点击进入—>【计算机视觉】微信技术交流群

Alex 发自凹非寺
转载自：量子位（QbitAI）

这是同一个房间改装前后的样子：

一下子质感Up，从凌乱过时变成了有腔有调的现代风。

至于设计费嘛，其实是…一分钱都没花！

因为这并不是专业设计师做的方案，而全靠一只AI完成。

——只用给AI一张照片，它就能搞定的那种。

还可以选择不同风格。

如此实用的“旧房改造”AI，很快引来大波网友驻足围观；原帖登上了GitHub热榜第一，目前已收获2700+颗星。

还在HackerNews上引起热议。

有网友称，这个应用让他觉得很惊喜，并表示：

如果这种AI还能添加一些功能就更好了，比如给生成图片中各设施进行估价，这样就有机会落地商用了。

还有网友指出：

这实际上就是一种生成式预训练Transformer，和其他Transformer本质是一样的。

一张图就能搞定房间设计

不管怎么说，这个AI确实在现有技术上整出了实用且新颖的用法。量子位没忍住也亲自上手试了试。

我先找来几张破旧房间的照片，然后开始和AI共同设计改造。

说是共同改造，但其实我要做的，就只用给AI一张图，然后点击两个选项：风格和房间用途。

比如，这里选择现代风的客厅：

几秒钟后，我眼前一亮。不仔细对比左右两张图的格局，真的很难相信这是同一个房间。

除了现代风，还有其他选择，于是我又试了试极简风：

虽然这似乎不太“简”，但很精美，甚至比上面的现代风更胜一筹。（给我看得都心动了…）。

不过需要说明的是，目前此AI一个IP每天最多只能用3次——实在想多弄几张的话，可以换台电脑。

看到这里，话说一只小小的AI，为何短短几秒就能设计好一整个房间？

其实，这主要得益于它背后一种强大的新晋机器学习模型：ControlNet。

ControlNet，由斯坦福大学研发，是一种通过添加额外条件，来控制扩散模型的神经网络。

这个模型，可以将神经网络块的不同权重，分别复制到“锁定”副本（locked copy）和“可训练”副本（trainable copy）中。

锁定副本，会保留输入信息的一些关键特征；可训练副本，则会通过训练、学习来调节其他特征。然后，这两部分还会连接起来协同工作。

对于可训练副本而言，其训练的方向包括：物体的准确边缘、语义分割、人体姿势等等。

简单来说，就是AI能够判定，一张图中各个要素是否可以改变；然后会在原图某些核心要素不变的前提下生成新的内容，不会导致生成图和原图看起来毫无联系。

另外，这个模型搭配文字“食用”效果更佳——比如刚才我选择的房间用途和装修风格，其实就是在给AI添加一点文字提示。

总而言之，基于这样的原理，ControlNet不仅可以胜任室内设计，还有可以玩出别的花样。

比如，一键涂色：

还有“一键换猫”（猫换了，但可爱的歪头杀不变）：

“一键换牛”：

Emmm，那某些游戏皮肤是不是……？

值得一提的是，如果你嫌专门登陆官网（见传送门）比较麻烦，可以通过API将这个AI应用连到你的本地应用上。

按这种用法，首先需要下载数据库。

git clone https://github.com/Nutlope/roomGPT

接着去Replicate网站上创建一个帐户，并获取 API 密钥。注意，然后需要把将API 密钥存储在 .env 文件中，如 .example.env。

再安装依赖项：

npm install

然后你就能在命令行中运行该AI了：

npm run dev

开发者简介

最后，来认识一下此AI的幕后开发者：其实一共就3个人。

其中，最主要的贡献者Hassan El Mghari，本科毕业于德雷塞尔大学计算机工程系，现在是一名全栈软件工程师。

除了开发各种应用，这哥们儿还曾创立了一家游戏营销公司，在Steam上拥有500,000+名用户。

官网传送门：
https://www.roomgpt.io/
Relicatec传送门：
https://replicate.com/
参考链接：
[1]https://github.com/Nutlope/roomGPT
[2]https://news.ycombinator.com/item?id=35001046
[3]https://levelup.gitconnected.com/controlnet-control-your-ai-art-generation-616c86c88964
[4]https://www.elmghari.com/about

点击进入—>【计算机视觉】微信技术交流群

最新CVPP 2023论文和代码下载

后台回复：CVPR2023，即可下载CVPR 2023论文和代码开源的论文合集

后台回复：Transformer综述，即可下载最新的3篇Transformer综述PDF

扩散模型和GAN交流群成立

扫描下方二维码，或者添加微信：CVer333，即可添加CVer小助手微信，便可申请加入CVer-扩散模型和GAN 微信交流群。另外其他垂直方向已涵盖：目标检测、图像分割、目标跟踪、人脸检测&识别、OCR、姿态估计、超分辨率、SLAM、医疗影像、Re-ID、GAN、NAS、深度估计、自动驾驶、强化学习、车道线检测、模型剪枝&压缩、去噪、去雾、去雨、风格迁移、遥感图像、行为识别、视频理解、图像融合、图像检索、论文投稿&交流、PyTorch、TensorFlow和Transformer等。

一定要备注：研究方向+地点+学校/公司+昵称（如扩散模型和GAN+上海+上交+卡卡），根据格式备注，可更快被通过且邀请进群

▲扫码或加微信号: CVer333，进交流群

CVer学术交流群（知识星球）来了！想要了解最新最快最好的CV/DL/ML论文速递、优质开源项目、学习教程和实战训练等资料，欢迎扫描下方二维码，加入CVer学术交流群，已汇集数千人！

▲扫码进群

▲点击上方卡片，关注CVer公众号

整理不易，请点赞和在看