Py学习  »  机器学习算法

机器学习训练营第三期来了!

进击的Coder • 5 年前 • 397 次点击  

差不多在两个月前,我分享了自己对爬虫和 AI 行业的一些看法,文章原文是:分享我对爬虫和 AI 行业的一点看法,顺便打个广告,还是强烈建议大家在阅读本篇文章之前先看一下这篇文章。


在上面的这篇文章中,我和几位朋友开办了机器学习的相关训练营的第一期,但当时报名人数设置了限制,300 人很快就报满了,后来在一个月之前我们又开办了机器学习训练营的第二期,当时的课程介绍的这样子的:机器学习训练营第二期开始报名了!,当时报名了将近 500 人,现在第三期针对前两期的内容作了新的调整,这里作一下介绍,希望大家可以支持。


介绍课程之前还是首先还是说下我的一些情况以及为什么要办这个训练营吧,其实之前的文章已经介绍过:


我现在是硕士三年级,北航这边硕士毕业是两年半,所以说我明年一月份左右就要毕业了,今年肯定是要参加秋招的。所以整个九月份都在忙着各种面试,可以说整个九月份都比较焦虑,不过好在事情已经告一段落了,当我得知自己拿到自己心仪公司的 Offer 的时候,心里一块石头终于落地了。


我一直在微软这边实习,已经一年多了,所以这次肯定也参加了微软的转正面试,前几天刚刚接到录用意向书,今天刚刚参加了 Offer 说明会,谈了具体的薪资待遇等情况,不过具体的薪资就不太方便透露啦,总之我还是非常满意的。


最初我来微软微软的时候实际上是以爬虫工程师的身份进入的,在微软小冰部门,是做聊天机器人的,需要用到各种深度学习模型来实现一些回复检索和生成功能,而训练这些模型就需要非常多的对话语料,所以当时就帮部门爬了数亿对话数据,同时也自己维护了一套较为稳定的爬虫系统。


工作几个月期间,我一直在帮同事们爬各种数据,把数据给他们之后,他们就会做一些分析处理,然后搭建模型,所以我也会经常听到同事在讨论各种模型优化算法,看各种论文然后加以实现。说实话一开始我是完全听不懂的状态,虽然我研一的时候上过机器学习的相关课程,但说实话那会真没觉得机器学习有多大用处,所以那会儿就其实还是为了应付考试的,平时的精力依然放在爬虫和开发上面。所以当时听到同事们讲什么 S2S,NN 模型是的时候一脸懵逼。


那会儿我就意识到,如果我一直陷在爬虫的坑里,几乎不懂什么是机器学习,什么是深度学习,将来毕业了可能真的就只是一个爬虫工程师了。而且说实话做爬虫其实并没有那么简单,尤其是当某个深夜,你与各种反爬手段斗争迟迟无果,服务器各种给你返回 403 却怎么也调不出来的时候,那时候的心情可以说叫绝望!绝望!绝望!我甚至都有怀疑我为什么要做爬虫,我做了爬虫有啥意义,我以后靠这个找不到工作了可咋办?我想如果你也做过爬虫的话,可能或多或少也有这种体会吧。


嗯,由于我平时也有逛知乎的习惯,那时候我看到某个大 V 又发了某某数据分析的文章了,又发了某某深度学习的模型了,我一想这么牛逼的吗?我感到非常羡慕,然后再回过头来看看自己干的事,每天就是在堆爬取规则,把数据爬下来,爬下来之后怎么办?我当时说实话没什么办法,数据分析没经验,搭模型没经验,可以说这些数据我都没有能力利用起来,是一些死数据。所以,那会就萌生了一些念头,我意识到,我需要自己学会利用这些数据,所以就决定开始学习机器学习、深度学习相关的一些知识。


当时也是由于一些机遇和调整,我在公司也开始负责一些数据分析和对话方向的项目,一边做一边学习,学机器学习,学深度学习,学 NLP,随着时间的推移,逐渐我也慢慢地学会了搭建一些模型,实现一些算法,同时读论文多了,也不会再因为公式而犯愁了。


而直到现在,我也学会了怎样去处理我爬下来的数据,知道了业界在人工智能如 NLP、CV 等方向的最新成果,所以我也知道了该怎样利用数据去创造更大的价值。


所以说,在学术界,我学会了怎样去探索和了解前沿的研究进展,了解了人工智能在各个方向到底可以做到什么程度,哪些方向是困难的,哪些方向是容易的,哪些可能是泡沫,哪些是确实能落地的,同时也学会了自己去实现和搭建模型来完成某个效果;在工业界,由于我之前的一些积累,所以对爬虫、Web、大数据等领域也都有所掌握,要实现某些算法的落地也比较得心应手。所以在平时跟同事们的合作过程中,也变得更加游刃有余。


所以我个人方向是什么?爬虫当然不能丢,因为数据是一个经久不衰的需求,但我不能仅限于爬虫方向,爬下来的数据要学会利用,其实往数据分析和人工智能方向来做都是不错的选择,我选择了后者,毕竟这是一个 AI 的时代,后面我也会继续在这个方向深耕。


所以我还是非常看好这个行业的,正好我也认识几个这个方向的朋友,于是就开办了机器学习训练营。


同时我也提到过,如果要做这个方向的话,有什么加分项:


第一个就是你的工程动手能力,如果你了解了一些基本算法,动手能力还又不错,比如你写过好多模型,能根据论文实现一个模型,GitHub 收了很多 Star,或者有很多 Follower,都是可以加分的。第二个就是打比赛,Kaggle 听说过吧?就是专门搞机器学习领域竞赛的,Kaggle 里面分好多等级,比如 Master 就是大师级别,Grand Master 是里面最高的宗师级别。如果你是 Master 级别,Offer 加成会非常大,如果你是 Grand Master,你就是一个 Offer 收割机!全世界只有几百个获得这个称号。微软这边我就认识一位 Grand Master,是我的好朋友,比我高一级,去年校招的时候他收割了几乎所有大厂的 Offer,另外他打比赛获的奖金已经足够在北京全款买房了,简直人赢。


和我一起开办这个训练营的正是上文所说的这位 Grand Master 大佬,还有两位 Master 大佬,目的就是让更多想学习从事或者转入这个方向的朋友提供一些指导和帮助,同时还会指导 Kaggle 比赛,分享相关经验,也让各位朋友在学习的过程中少走一些弯路,现在已经举办了两期了。


之前的训练营一共是十周,会教大家掌握从零基础掌握机器学习,现在第一期训练营已经接近尾声了,第二期现在已经进行到了一半,现在依然有非常多的小伙伴在坚持打卡,共同学习,氛围也着实不错,我也相信大家在这个过程中有真正的收获



为了不断地把课程继续优化,我们深入采访了几位同学,询问他们课程的难度或者可以优化的地方。我们发现很多同学其实是有编程背景的,但是对于机器学习还是第一次接触,从其他语言到 Python 的转换需要时间,掌握数据分析包的使用也需要时间。


所以,我们研讨了很久,针对大家的反馈对课程做了一些调整,设计更多 Python 与数据分析的内容来帮大家夯实基础,但内容的丰富度依然是有保证的。


下面是课程的一个大纲:


本课程将介绍如何使用 Python 进行数据处理、数据分析与可视化、机器学习建模等。


第1部分:Python 入门


  • Jupyter Notebook 介绍,它们提供了数据科学家需要的计算环境;

  • 讲解 Python 基础语法,掌握 Python 注释、缩进、数据结构以及控制流等。


第2部分:使用 NumPy 与 Pandas 进行数据处理与分析


  • 学习如何使用热门的数据分析工具进行数据处理,来帮助自己处理现实中的问题;

  • NumPy:  用 Python 高效地存储和操作大型数组,很方便地进行数据变换;

  • Pandas:  用 Python 高效地存储和操作带标签的/列式数据,可用于数据挖掘中的各种特征处理;


第3部分:机器学习入门与应用


  • 讲解特征工程与机器学习算法,并学会如何建立模型,并将模型应用在多个领域的数据中;

  • Scikit-Learn:它提供了各种机器学习算法高效整洁的 Python 实现。


本课程将从 Python 编程基础教起,并一步步学会如何进行数据分析和机器学习,所以基础要求会更低一些,对小白更加友好。当然如果你具备一定的编程经验背景的话可以帮助你更好地掌握课程中的知识,当然没有也完全不必担心。


课程我们一共设计了八周,课程安排是这样的:



这里我们设计了 Python 基础入门、数据分析和机器学习入门基础课程三大部分,设计了如下的学习模式:


  • 每周一会在知识圈发布阅读材料,学员自行下载阅读学习。

  • 每周四会在知识圈发布与本周学习内容相关的作业

  • 每周六为学员在知识圈中提交作业。

  • 平日学员可以随时在知识圈中提问,我们会在 24 小时内回复你的问题

  • 另外,我们也鼓励学员间互相帮助,互相讨论提出的问题,同时巩固自己所学知识。


通过这门课程你可以获得如下内容:


  • 高效、科学的 AI 入门学习计划

  • 各位大佬的零距离答疑

  • 机器学习比赛冠军大佬们的经验分享与答疑解惑

  • 进行职业、学习路径答疑

  • 高质量技术交友圈的微信群


下面是之前训练营的答疑交流圈的一些交流截图:



这次第三期正式的开营日期是 2018 年 11 月 19 日,也就是下周一,价格依然还是 99 元,另外加入之后还可以进一步分享,如果别的朋友通过你的分享报名了,还会获得返佣。


最后也就是最重要的了,大家可以下方的扫描二维码查看课程的详情,然后点击报名参与即可:



最好的投资就是投资自己,我们也会与你一路同行!

推荐阅读

1

跟繁琐的命令行说拜拜!Gerapy分布式爬虫管理框架来袭!

2

跟繁琐的模型说拜拜!深度学习脚手架 ModelZoo 来袭!

3

只会用Selenium爬网页?Appium爬App了解一下

4

妈妈再也不用担心爬虫被封号了!手把手教你搭建Cookies池

崔庆才

静觅博客博主,《Python3网络爬虫开发实战》作者

隐形字

个人公众号:进击的Coder

长按识别二维码关注



今天看啥 - 高品质阅读平台
本文地址:http://www.jintiankansha.me/t/HuajB1hd0x
Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/26426
 
397 次点击