社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  机器学习算法

今年要如何准备?想去阿里/美团/头条做机器学习工程师

机器学习AI算法工程 • 3 年前 • 361 次点击  


向AI转型的程序员都关注了这个号👇👇👇

机器学习AI算法工程   公众号:datayx


阿里巴巴菜鸟网络  算法工程师(机器学习)提前批笔试面试总结


1. 技术面:~40min

怼项目;介绍一个你最熟悉的项目(基于判别式滤波的跟踪、基于深度网络的匹配跟踪、基于立体形变匹配的跟踪): 


项目中使用的什么机器学习方法,应用了那种深度学习框架,采用哪种深度平台实现的

解释SVM,解释最大间隔分类,解释SVM和LR、SR、FR的不同之处

如何理解SVM中的函数间隔functional margin 和 几何间隔 Geometry margin

这个项目中遇到的最大的困难,怎么解决的;

怼数据结构;


描述双向链表,给个链表让描述过程,时间复杂度

有没有数据结构的paper(没有)

B树和B+树的区别

怼竞赛;


大学生数学建模竞赛和美国大学生数学建模竞赛选一个你最熟悉的,讲一下你们的模型

美国建模竞赛是全英文的吗?你们几个人参加的,你的贡献是什么?

解释一下系统动力学模型,为什么没有采用深度学习?

怼C++/Python/算法;


python 垃圾回收机制解释一下

知道哪些垃圾回收算法,他们有什么区别

选一个你最熟悉的快速排序算法,解释一下最糟糕的情况应该是什么情况

怼博客;博客坚持多久了,来公司要注意项目的隐私,你还会继续写博客吗?


2 技术面:~40min

怼项目,你这么多项目我也不能一个个问,挑最熟悉的项目介绍一下 .


说一下深拷贝的细节,如果我不采用深拷贝会有什么风险(内存泄漏)

Python中是如何实现深拷贝和浅拷贝的?

 为什么选择用了SVM作为分类器?

有没有考虑过其他分类器,如随机森林?解释集成分类器的优势

怼项目;小沈你对juc包熟悉嘛,用过线程池吗?


怎么用的

说一下线程池有哪些参数

线程池的底层原理 

怼编程;你使用过C++/Python/Matlab/Java/Qt


对那个最熟呢?(matlab) 机器学习直接调用库函数还是自己写(分情况讨论)

C++/python擅长哪一个?(C++) 那我们说说Qt(绝对假校友...) 阐述一下信号-槽机制

对数据结构、算法;


之前最习惯用那个数据库(没用过), 为什么不用?(算法开发不涉及到优化)

描述一下红黑树,对比红黑树和二叉树 (红黑树绝对高啊)

算法方面,排序你知道哪些, 详细描述归并,快速排序算法一定优于普通算法吗?(利用极端情况反驳) 

聊人生;你来过杭州吗?你在学校经常吃那个食堂?


3 技术面:~55min

手撕代码(<30min),面试官给发一个链接到邮箱,然后共享屏幕,解决一个二次规划问题,又是青蛙蹦蹦蹦....


Frog-贪心青蛙跳石子(点击有参考) 这个是必须要完整写下来的,曾经我笔试华为,第三题也是它。其实吧,很多同学本科参加ACM的过程中,这道题刷了没有十遍也有八遍了,但是还是要复习啊,绝对高频...


选择语言,讲解思路(5min); 是小姐姐面试的,她和我一起分析了算法的效率,边界条件...分析完之后就开始写。


其实很多算法,本科毕业之后都进行过盲写训练(感谢曾经的美国梦那个孩子)。我感觉,非科班出身,在清华科研压力又重,刷LeetCode完全没可能....所以,要么强行挤时间刷一刷,要么就把曾经的算法都进行一下盲写训练 (很像托福听力中的盲听)。


怼论文。


先怼CBME2013年的文章(大二),SVM, 傅里叶频谱特征, 纹理特征,小波, 很多细节都忘了,面试官不太满意...

然后怼了CVPR预发文章(研二) DCF原理, 对偶空间, DCF主流研究组,DCF的深度网络实现(效果为什么不好)

形变立体跟踪的意义, CBME2018的论文,解释评价指标

这次面试很奇怪没有问任何数据结构和算法....  也没有问竞赛什么的。


4 技术面(交叉面):~45min

应该是三面表现还不错,这次面试时间很多。简单自我介绍。


怼算法。全程问的都是深度学习(估计是专业搞深度学习的...)


讲mask RCNN与其他各种分割model的思路;faster RCNN的RPN的过程,正负样本的选取

 轻量化模型的方法,讲思路

常见的防止过拟合方法,如何理解BN,怎么做,dropout怎么做

详细解释Simianese Network, 如何解决深度模型与传统机器学习算法的耦合(从正向传播、反向传播解释)

 最近还有没有读论文*(天天读,夜夜读,为什么读...),介绍CVPR2018你最感兴趣一篇论文的工作。

怼算法。竟然还是深度学习???我去!!!


有没有用过RNN;

为什么在图像处理领域大多时候RNN性能落后于CNN

有没有尝试过做NLP(自然语言处理),文章看过,只是闲下来没事的时候会看,但是研究生项目很多,很紧凑,做的还是图像的

知道GUN嘛?  能说一下Forgetgate是如何设计的吗?(这个也是高频,一般DL入门教材都会讲,背下来就好了,能理解更好)

......



最近有一些低年级同学包括一些同校的师弟们因为今年的算法行情都对自己找算法岗不自信,开始放弃初衷转其他岗位了,下面从某研究僧个人校招经历来谈谈自己的理解,希望能帮助到未来的算法工程师们。

       硬件出身,本科电气硕士控制,从去年5月转行算法以来入坑差不多有一年半了,在今年的校招过程中除了腾讯三面倒在coding上,其他参加面试的主流互联网公司CV/NLP/推荐广告/机器学习等算法工程师岗位基本都收到offer了,大多为白菜,少数是sp,具体的面试问题牛客论坛很多大佬已经总结的很详细了,下面主要把自己的一些经验感悟说一下。

       首先,现在各大互联网公司的算法岗需求相比开发确实比较少但是并没有饱和,而且比较缺人(缺合适的),只是很多找算法的同学可能在项目经历/coding/实习/top竞赛/论文/学校上有所欠缺,如果在其中有一两项比较突出我觉得找个主流公司的算法offer问题应该不大,至少从我身边认识的朋友而言是这样,准确定位自己,如果简历上没有算法类的项目经历或者没有实习,没有算法类top竞赛经历可能在就业上难度确实比较大,而且从今年我面试的经历来说,主流公司核心部门的算法对学校要求都比较高,基本没有非985硕士,而且大多是top高校硕士,当然非核心部门在学校上要求会松一些,但总体相比于开发在学历上要求更高。
        其次,对于算法一定要把握好提前批内推,因为提前批内推大多是不用笔试的,比如百度,阿里巴巴,腾讯,今日头条(白金码),美团,京东,地平线等都是不需要笔试的,等到了秋招基本都要笔试,从我今年做的一些笔试来说,很少通过,可能是因为做算法笔试的人太多但是需求比较少的原因,所以coding能力不是很强的同学一定要把握好提前批,等到秋招可能一次面试机会都比较难。

        此外在找工作的过程中信息资源是最重要的,多认识一些和自己找类似工作的朋友,相互交流,分享招聘信息与面试经验对拿到offer帮助会非常大,我的美团面试机会就是后来通过我的朋友推荐的部门leader和HR直接面试的,同时多关注牛客论坛,这里面会有很多一手招聘内推信息与最新面经,记得暑假的时候自己每天平均刷牛客的时间可能在2个小时以上。

       再说一下各大互联网公司的提前批面试流程与考察特点:

       (1)今日头条:总共三轮技术面,优秀者后期会加面,若远程面试则均通过牛客视频会议进行,头条的面试效率比较高每轮面试大概1小时左右,三轮技术面半天就可以结束,且相邻场次面试等待时间大概为5-10分钟,考察重点为coding能力以及算法相关经历,基本每轮面试都会考coding,我当初一共被问了六题,如果没有通过面试也会当场告诉结果。

       (2)百度:总共三轮技术面,百度面试风格和其它所有公司的风格均不相同,重视面试者的工程能力和基础知识,会考察linux系统常用命令,以及c++语言特性与数据结构基础知识,前两轮面试,面试的一半时间以上都在考察在线coding的能力,一般每轮1到2个相关的coding题目,三面是经理面这个看运气了有的会考代码有的不会考,大多数情况不会考代码,通过聊天考察思维,沟通能力。

        (3)阿里巴巴:阿里巴巴招聘是集团统一负责,一旦简历被某个部门锁定则无法再面其它部门,直到这个部门的面试流程结束,简历释放才可以面其它部门,透露一个细节,如果不喜欢当前面试的部门可以和leader商量让HR释放简历转投其它部门,或者当前面试流程被回绝了也是可以再面其它部门的,但是阿里的面试评价是一直存在的,前面的面试评价如果不好后面会很难。阿里每轮面试都有一个评级,研发/算法达到B+就算通过面试,有下一轮面试机会,正常算法一共会有5轮面试,评级为A,前三轮是组内技术面(三面是你未来的部门leader),四面为交叉面,5面为HR面,没有交叉面评级就没有A,即使前面告诉的结果是通过面试了也基本拿不到算法OFFER。至于面试特点,阿里的面试比较注重思维,沟通表达能力,项目经历情况,整个面试过程一般只会考一个coding题,也有可能不考,因此简历好的同学面阿里相对会比较轻松。

        (4)腾讯:总共三轮技术面,二面是leader,三面是总监面,腾讯的校招评级分的比较多有A- ,A, A+,S,达到A-就达到录取标准,因此腾讯的薪资差距比较大。就我面试的经历而言,腾讯比较注重算法理论基础,对算法基础知识问的比较多,也相对比较细。然后就是coding了,腾讯的coding比较喜欢考察一些DP的问题,对于总监面,我的总监面,面了两个多小时,全程只和我交流他们现有推荐算法工程化过程中碰到的一个问题,考察我们的思维能力。

        (5)美团:总共三轮技术面,美团的面试感觉还是挺不错的,每一轮面试都会出一个coding题,但是不会通过coding刷人,会综合考察我们的经历,思维情况,从面试中给我的感觉,美团的算法应用做的相对比较多,面试官们对算法的理解也比较深,因此聊的比较开心,虽然代码基本都写的比较差,但是最后还是给我offer了。

        (6)华为:华为的面试比较佛系,一般都是现场面,2-3轮,不同于其它任何互联网公司,华为比较看重学校,学历,还有成绩,会让我们带上成绩单,每一轮面试开始前都会仔细看我们的每一科成绩,就我上次的面试经历来说,没有问任何深一点的东西,大多都是简单浅显的询问就结束了。

         (7)地平线:总共三轮技术面,地平线的三轮面试官都很NICE,正常面试不管我们说错了还是说对了,面试官都不会告诉我们结果,但是地平线的每一轮面试官在我们回答不正确或者不完善的时候,他们都会紧接着告诉我们正确答案,由于当时面试的是CV感知算法岗,因此三轮技术面问的全部都是计算机视觉相关的深度学习方法,除了常规基础知识,算法特点,地平线的部分面试官还会考察我们的学术思维。当然地平线也少不了coding要求,一面二面没有考察,三面的时候考了我三个coding题目一题Leetcode,两题概率题,coding难度中等。

        好了,现在可以说一下算法面试重点需要准备的细节了,我觉得算法面试重点关注我们的算法思维能力还有项目/比赛/实习经历以及coding能力与一些概率相关题目。对于coding重点刷一下剑指offer加50道左右leetcode easy题,我觉得绝大多数面试基本可以应付(自己因为提前没有接触过数据结构,加上今年暑假去了5个城市参加答辩与出差耽误了20多天时间,只刷了35题剑指offer与3题leetcode,因此在面试过程中还是经常在写代码的时候被虐,只能拿白菜),然后就是概率相关题目,这个也是最容易被忽视的,在8月之前我并没有关注过概率觉得面试应该不会问,但是后来多了发现这个是面试的一个重点考察方面,尤其喜欢考硬币,扑克牌,随机数发生器相关,百度有相关总结基本都覆盖到了,除了这些基本知识外,在找工作前一定要丰富自己的简历,比较重要的就是实习/top竞赛或者比较好的项目经历,这样才能让我们的简历从简历池里脱颖而出获得面试机会。很多实验室导师都是不同意学生实习的,我自己也是,没有实习经历,但是可以通过算法竞赛与算法类项目进行弥补。在7月开始的内推前,我参加了多个比赛,涉及cv/nlp/推荐广告/数据挖掘等方面,获得3个top名次,当然最重要的是在这些比赛中学习到的一些行业知识。除了比赛,自己也做了实验室一个算法相关的小项目,并发了一篇水文。

        最后,强调一下,口头offer不等于offer,作为应届生在求职的过程中一定要多找几个offer在手上才能保证自己不至于太过被动。在去年8月初的时候我先后收到了百度与蚂蚁金服的口头offer,头条也成功面完了三面,而且蚂蚁金服的leader和我承诺肯定没有问题,已经把我的offer报上去了,然后我就没有再投其他公司了,觉得两个已经够了而且都是比较不错的,再投其他的影响其他人找工作不太好,就这样拖到了9月底,但是却被告知他们部门算法hc发不了了,只能给我发研发offer。这个时候我再去投京东的,发现提前批基本结束了。后面又紧接着投了华为,地平线cv感知算法,美团广告部推荐,快手社科推荐,开始了疯狂的面试,于是在9月又拿到了头条,华为,地平线,美团的offer,快手三面自己主动放弃了。过程中先后还收到了阿里巴巴集团hr打来的电话说给我发其他部门的offer,阿里的招聘和其他公司区别还是蛮大的,是集团统一负责。所以只要面试评级通过,就会不断被分到其他有hc的部门,主要是大文娱,高德这些。

        最后的最后,算法没有网上说的那么难,但也不是很简单,只要你的简历上有一些算法相关的东西,找准自己的定位,坚持下去就可以。

推荐一套不错的机器学习视频资源,由浅入深讲解,讲师都是业界有名,比如寒小阳、张雨石,在机器学习领域有丰富工作经验。

可用我特批的优惠券( 减290元)

优惠券: 

26C5031E9E


获取视频资源流程:

复制优惠券>扫描二维码>点击立即报名>点击优惠券>输入优惠券


也可以打开下面的链接


https://www.julyedu.com/course/getDetail/110?ccode=5ebcebdd4c4d5



(有任何问题请联系小编微信:hai299014


整个机器学习的核心知识体系

(获取完整版高清思维导图,回复公众号 导图 即可获取)






阅读过本文的人还看了以下文章:


【全套视频课】最全的目标检测算法系列讲解,通俗易懂!


《美团机器学习实践》_美团算法团队.pdf


《深度学习入门:基于Python的理论与实现》高清中文PDF+源码


特征提取与图像处理(第二版).pdf


python就业班学习视频,从入门到实战项目


2019最新《PyTorch自然语言处理》英、中文版PDF+源码


《21个项目玩转深度学习:基于TensorFlow的实践详解》完整版PDF+附书代码


《深度学习之pytorch》pdf+附书源码


PyTorch深度学习快速实战入门《pytorch-handbook》


【下载】豆瓣评分8.1,《机器学习实战:基于Scikit-Learn和TensorFlow》


《Python数据分析与挖掘实战》PDF+完整源码


汽车行业完整知识图谱项目实战视频(全23课)


李沐大神开源《动手学深度学习》,加州伯克利深度学习(2019春)教材


笔记、代码清晰易懂!李航《统计学习方法》最新资源全套!


《神经网络与深度学习》最新2018版中英PDF+源码


将机器学习模型部署为REST API


FashionAI服装属性标签图像识别Top1-5方案分享


重要开源!CNN-RNN-CTC 实现手写汉字识别


yolo3 检测出图像中的不规则汉字


同样是机器学习算法工程师,你的面试为什么过不了?


前海征信大数据算法:风险概率预测


【Keras】完整实现‘交通标志’分类、‘票据’分类两个项目,让你掌握深度学习图像分类


VGG16迁移学习,实现医学图像识别分类工程项目


特征工程(一)


特征工程(二) :文本数据的展开、过滤和分块


特征工程(三):特征缩放,从词袋到 TF-IDF


特征工程(四): 类别特征


特征工程(五): PCA 降维


特征工程(六): 非线性特征提取和模型堆叠


特征工程(七):图像特征提取和深度学习


如何利用全新的决策树集成级联结构gcForest做特征工程并打分?


Machine Learning Yearning 中文翻译稿


蚂蚁金服2018秋招-算法工程师(共四面)通过


全球AI挑战-场景分类的比赛源码(多模型融合)


斯坦福CS230官方指南:CNN、RNN及使用技巧速查(打印收藏)


python+flask搭建CNN在线识别手写中文网站


中科院Kaggle全球文本匹配竞赛华人第1名团队-深度学习与特征工程



不断更新资源

深度学习、机器学习、数据分析、python

 搜索公众号添加: datayx  



机器学习算法资源社群

不断上传电子版PDF资料

技术问题求解

 QQ群号: 333972581   

长按图片,识别二维码

阅读原文”查看资源详情!

Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/63076
 
361 次点击