AI/CV重磅干货,第一时间送达
点击进入—>【计算机视觉】微信技术交流群
Alex 发自 凹非寺
转载自:量子位(QbitAI)
这是同一个房间改装前后的样子:

一下子质感Up,从凌乱过时变成了有腔有调的现代风。
至于设计费嘛,其实是…一分钱都没花!
因为这并不是专业设计师做的方案,而全靠一只AI完成。
——只用给AI一张照片,它就能搞定的那种。
还可以选择不同风格。

如此实用的“旧房改造”AI,很快引来大波网友驻足围观;原帖登上了GitHub热榜第一,目前已收获2700+颗星。

还在HackerNews上引起热议。
有网友称,这个应用让他觉得很惊喜,并表示:
如果这种AI还能添加一些功能就更好了,比如给生成图片中各设施进行估价,这样就有机会落地商用了。

还有网友指出:
这实际上就是一种生成式预训练Transformer,和其他Transformer本质是一样的。

一张图就能搞定房间设计
不管怎么说,这个AI确实在现有技术上整出了实用且新颖的用法。量子位没忍住也亲自上手试了试。
我先找来几张破旧房间的照片,然后开始和AI共同设计改造。
说是共同改造,但其实我要做的,就只用给AI一张图,然后点击两个选项:风格和房间用途。
比如,这里选择现代风的客厅:

几秒钟后,我眼前一亮。不仔细对比左右两张图的格局,真的很难相信这是同一个房间。

除了现代风,还有其他选择,于是我又试了试极简风:

虽然这似乎不太“简”,但很精美,甚至比上面的现代风更胜一筹。(给我看得都心动了…)。
不过需要说明的是,目前此AI一个IP每天最多只能用3次——实在想多弄几张的话,可以换台电脑。

看到这里,话说一只小小的AI,为何短短几秒就能设计好一整个房间?
其实,这主要得益于它背后一种强大的新晋机器学习模型:ControlNet。
ControlNet,由斯坦福大学研发,是一种通过添加额外条件,来控制扩散模型的神经网络。
这个模型,可以将神经网络块的不同权重,分别复制到“锁定”副本(locked copy)和“可训练”副本(trainable copy)中。
锁定副本,会保留输入信息的一些关键特征;可训练副本,则会通过训练、学习来调节其他特征。然后,这两部分还会连接起来协同工作。

对于可训练副本而言,其训练的方向包括:物体的准确边缘、语义分割、人体姿势等等。
简单来说,就是AI能够判定,一张图中各个要素是否可以改变;然后会在原图某些核心要素不变的前提下生成新的内容,不会导致生成图和原图看起来毫无联系。
另外,这个模型搭配文字“食用”效果更佳——比如刚才我选择的房间用途和装修风格,其实就是在给AI添加一点文字提示。
总而言之,基于这样的原理,ControlNet不仅可以胜任室内设计,还有可以玩出别的花样。
比如,一键涂色:

还有“一键换猫”(猫换了,但可爱的歪头杀不变):

“一键换牛”:

Emmm,那某些游戏皮肤是不是……?
值得一提的是,如果你嫌专门登陆官网(见传送门)比较麻烦,可以通过API将这个AI应用连到你的本地应用上。
按这种用法,首先需要下载数据库。
git clone https://github.com/Nutlope/roomGPT
接着去Replicate网站上创建一个帐户,并获取 API 密钥。注意,然后需要把将API 密钥存储在 .env 文件中,如 .example.env。
再安装依赖项:
然后你就能在命令行中运行该AI了:
开发者简介
最后,来认识一下此AI的幕后开发者:其实一共就3个人。

其中,最主要的贡献者Hassan El Mghari,本科毕业于德雷塞尔大学计算机工程系,现在是一名全栈软件工程师。

除了开发各种应用,这哥们儿还曾创立了一家游戏营销公司,在Steam上拥有500,000+名用户。
官网传送门:
https://www.roomgpt.io/
Relicatec传送门:
https://replicate.com/
参考链接:
[1]https://github.com/Nutlope/roomGPT
[2]https://news.ycombinator.com/item?id=35001046
[3]https://levelup.gitconnected.com/controlnet-control-your-ai-art-generation-616c86c88964
[4]https://www.elmghari.com/about
最新CVPP 2023论文和代码下载
后台回复:CVPR2023,即可下载CVPR 2023论文和代码开源的论文合集
后台回复:Transformer综述,即可下载最新的3篇Transformer综述PDF
扩散模型和GAN交流群成立
扫描下方二维码,或者添加微信:CVer333,即可添加CVer小助手微信,便可申请加入CVer-扩散模型和GAN 微信交流群。另外其他垂直方向已涵盖:目标检测、图像分割、目标跟踪、人脸检测&识别、OCR、姿态估计、超分辨率、SLAM、医疗影像、Re-ID、GAN、NAS、深度估计、自动驾驶、强化学习、车道线检测、模型剪枝&压缩、去噪、去雾、去雨、风格迁移、遥感图像、行为识别、视频理解、图像融合、图像检索、论文投稿&交流、PyTorch、TensorFlow和Transformer等。
一定要备注:研究方向+地点+学校/公司+昵称(如扩散模型和GAN+上海+上交+卡卡),根据格式备注,可更快被通过且邀请进群

▲扫码或加微信号: CVer333,进交流群
CVer学术交流群(知识星球)来了!想要了解最新最快最好的CV/DL/ML论文速递、优质开源项目、学习教程和实战训练等资料,欢迎扫描下方二维码,加入CVer学术交流群,已汇集数千人!

▲扫码进群
整理不易,请点赞和在看