Github 3.4k星，200余行代码，让你实时从视频中隐身

点击上方“小白学视觉”，选择加"星标"或“置顶”

重磅干货，第一时间送达

项目作者 | Jason Mayes

Jason Mayes 是一名在谷歌工作的资深网页工程师，他长期致力于运用新兴技术提供物联网解决方案。近日，充满奇思妙想的 Mayes 又使用 TensorFlow.js 制作了一个仅用 200 余行代码的项目，名为 Real-Time-Person-Removal。它能够实时将复杂背景中的人像消除，而且仅基于网页端。

现在，Mayes 在 GitHub 上开源了他的代码，并在 Codepen.io 上提供了演示 Demo。从视频中看到，你现在只需要一台能上网的电脑和一个网络摄像头就能体验它。

项目地址：https://github.com/jasonmayes/Real-Time-Person-Removal

Demo 地址：https://codepen.io/jasonmayes/pen/GRJqgma

目前，该项目异常火热，在 Github 上已经获得了 3.4k 的 Star 量。

实时隐身不留痕项目作者：Jason Mayes

我们先来看一下运行的效果。下图中，上半部分是原始视频，下半部分是使用 TensorFlow.js 对人像进行消除后的视频。可以看到，除了偶尔会在边缘处留有残影之外，整体效果还是很不错的。

为了展现这个程序在复杂背景下消除人像并重建背景的能力，Mayes 特意在床上放了一台正在播放视频的笔记本电脑。当他的身体遮挡住笔记本电脑时，可以看到消除算法暂停在电脑被遮挡前的播放画面，并能在人移开时迅速地重建出当前画面。

此外，Mayes 还在 Codepen.io 上提供了能够直接运行的示例。只需要点击 Enable Webcam，离开摄像头一段距离确保算法能够较全面的收集到背景图像，之后当你再出现在摄像头前时就能从下方的预览窗口看到「隐形」后的画面了。

网友表示有了这个程序，像之前 BBC 直播中孩子闯进门来那样的大型翻车现场就有救了。

项目运行机制

Mayes 开发的这个人像消除程序背后的运行机制十分简单，他使用了 TensorFlow.js 中提供的一个预训练的 MobileNet，用于人像分割。

const bodyPixProperties = {
  architecture: 'MobileNetV1',



    
  outputStride: 16,
  multiplier: 0.75,
  quantBytes: 4
};

TensorFlow.js 提供的部分计算机视觉预训练模型。

MobileNet 是谷歌在 2017 年针对移动端和嵌入式设备提出的网络，针对图像分割。其核心思想是使用深度可分离卷积构建快速轻量化的网络架构。Mayes 选择使用它的原因也是出于其轻量化的原因，假如使用 YOLO 或者 Fast-RCNN 这类物体检测算法的话，在移动端就很难做到实时性。

通过 MobileNet 的输出获得检测到人物像素的边界框。

// Go through pixels and figure out bounding box of body pixels.
  for (let x = 0; x     for (let y = 0; y       let n = y * canvas.width + x;
      // Human pixel found. Update bounds.
      if (segmentation.data[n] !== 0) {
        if(x           minX = x;
        }

        if(y           minY = y;
        }

        if(x > maxX) {
          maxX = x;
        }

        if(y > maxY) {
          maxY = y;
        }
        foundBody = true;
      }
    } 
  }

为避免人物没有被检测完全的现象，这里使用变量额 scale 对检测区域进行适当放缩。这个 1.3 的参数是测试出来的，感兴趣的读者可以调整试试看。




    
// Calculate dimensions of bounding box.
  var width = maxX - minX;
  var height = maxY - minY;

  // Define scale factor to use to allow for false negatives around this region.
  var scale = 1.3;

  //  Define scaled dimensions.
  var newWidth = width * scale;
  var newHeight = height * scale;

  // Caculate the offset to place new bounding box so scaled from center of current bounding box.
  var offsetX = (newWidth - width) / 2;
  var offsetY = (newHeight - height) / 2;

  var newXMin = minX - offsetX;
  var newYMin = minY - offsetY;

之后对人物 bounding box 之外的区域进行更新，并且当检测到人物移动时，更新背景区域。

// Now loop through update backgound understanding with new data
  // if not inside a bounding box.
  for (let x = 0; x     for (let y = 0; y       // If outside bounding box and we found a body, update background.
      if (foundBody && (x  newXMin + newWidth) || ( y  newYMin + newHeight)) {
        // Convert xy co-ords to array offset.
        let n = y * canvas.width + x;



    

        data[n * 4] = dataL[n * 4];
        data[n * 4 + 1] = dataL[n * 4 + 1];
        data[n * 4 + 2] = dataL[n * 4 + 2];
        data[n * 4 + 3] = 255;            

      } else if (!foundBody) {
        // No body found at all, update all pixels.
        let n = y * canvas.width + x;
        data[n * 4] = dataL[n * 4];
        data[n * 4 + 1] = dataL[n * 4 + 1];
        data[n * 4 + 2] = dataL[n * 4 + 2];
        data[n * 4 + 3] = 255;    
      }
    }
  }

  ctx.putImageData(imageData, 0, 0


    
);

  if (DEBUG) {
    ctx.strokeStyle = "#00FF00"
    ctx.beginPath();
    ctx.rect(newXMin, newYMin, newWidth, newHeight);
    ctx.stroke();
  }
}

至此为算法的核心部分，用了这个程序，你也可以像灭霸一样弹一个响指（单击一下鼠标）让人凭空消失。

热门的「视频隐身术」

其实，这并非机器之心报道的第一个消除视频中人像的项目。

2019 年，我们也曾报道过「video-object-removal」项目。在此项目中，只要画个边界框，模型就能自动追踪边界框内的物体，并在视频中隐藏它。

项目地址：https://github.com/zllrunning/video-object-removal

但从项目效果来看，也会有一些瑕疵，例如去掉了行人后，背景内的车道线对不齐等。

与 Mayes 的这个项目类似，video-object-removal 主要借鉴了 SiamMask 与 Deep Video Inpainting，它们都来自 CVPR 2019 的研究。通过 SiamMask 追踪视频中的目标，并将 Mask 传递给 Deep Video Inpainting，然后模型就能重建图像，完成最终的修复了。

对此类技术感兴趣的读者可自行运行下这两个项目，做下对比。

下载1：OpenCV-Contrib扩展模块中文版教程

在「小白学视觉」公众号后台回复：扩展模块中文教程，即可下载全网第一份OpenCV扩展模块教程中文版，涵盖扩展模块安装、SFM算法、立体视觉、目标跟踪、生物视觉、超分辨率处理等二十多章内容。

下载2：Python视觉实战项目52讲

在「小白学视觉」公众号后台回复：Python视觉实战项目，即可下载包括图像分割、口罩检测、车道线检测、车辆计数、添加眼线、车牌识别、字符识别、情绪检测、文本内容提取、面部识别等31个视觉实战项目，助力快速学校计算机视觉。

下载3：OpenCV实战项目20讲

在「小白学视觉」公众号后台回复：OpenCV实战项目20讲，即可下载含有20个基于OpenCV实现20个实战项目，实现OpenCV学习进阶。

交流群

欢迎加入公众号读者群一起和同行交流，目前有SLAM、三维视觉、传感器、自动驾驶、计算摄影、检测、分割、识别、医学影像、GAN、算法竞赛等微信群（以后会逐渐细分），请扫描下面微信号加群，备注：”昵称+学校/公司+研究方向“，例如：”张三 + 上海交大 + 视觉SLAM“。请按照格式备注，否则不予通过。添加成功后会根据研究方向邀请进入相关微信群。请勿在群内发送广告，否则会请出群，谢谢理解~