计算机视觉技术诞生于半个多世纪以前,随着深度学习技术的成熟开始在很多领域大规模落地,以研究方向来说,大大小小至少数十个领域
。这里我重点想说的有几件事情。
(1) 计算机视觉技术饱和了吗?这是在过去的一段时间里被反复讨论的主题。
我认为研究领域没有饱和,诸如3D图像,计算机图形学等领域甚至只能说初探其境,很多老问题如分类检测跟踪也在与复杂的现实场景做搏斗,很多底层问题如图像增强离产品落地也有距离,从视觉感知要走到人类理解的水平,还远远谈不上饱和。工业届的很多行业都还等着计算机视觉技术去优化流程,降低成本,我们要把目光放得更大更远,而不仅仅是龟缩于自己感兴趣的小圈子。
所谓饱和,饱和的是浅尝辄止的心态,如果不求甚解,并不爱这个行业,那么我的建议就是劝退。
另外,关于算法工程师,请大家不要停留在算法工程师就是看看文章做做调参这个认知上,它要做的事情很多。搜集合适的数据,选定项目方案,模型优化部署,算法后续迭代,都不是简单的工作。
(2) 达到一个什么样的水平可以去找工作?
这应该是取决于你想找一个什么样的工作,一个行业发展渐趋成熟稳定后,从业者肯定是金字塔分布。
如果将这一行的从业者分为三个梯队,那么第一梯队是顶级研发人员,占比不会超过5%,大部分同志并不会成为其中一员,在没有三五年的积累后不用考虑这个问题。
第二梯队是大中小企业的一线开发,占比至少在60%以上,所需要的技能是丰富的项目经验和扎实的编程能力,其中难点在于培养出对项目的敏感性,能够以较低成本不走歧路地完成项目。如何成为这样的人,第一步至少要先熟练掌握计算机视觉的基础算法,精读足够多的文章,从头到尾完整做过多个不同方向的项目。
第三梯队是非核心开发人员。很少有人一上来就担当大任,所以一开始入行往往是从这个梯队开始的,跟着别人做事学习,比如做数据分析与标注类工作。所需要的技能是扎实的编程能力和一定的算法经验,东西看的懂,用得对。