Py学习  »  机器学习算法

# 开新坑 # 一起来学习机器学习吧~

生信菜鸟团 • 4 年前 • 452 次点击  

目前,机器学习和数据挖掘方法已经被广泛应用于解决生物信息学问题。在我研究的宏基因组领域更是如此,无论大的小的文章,总会用上一些机器学习的概念,比如用一些算法来区分不同样本,亦或是构建模型进行预测等等。所以作为 21 世纪的生物狗,这些时髦的东西还是得了解一些滴~

机器学习相关概念

首先,给大家介绍一些概念,人工智能、机器学习与深度学习之间到底是啥关系?

人工智能的范围最大,各个分支包括专家系统、机器学习、进化计算、模糊逻辑、计算机视觉、自然语言处理、推荐系统等等。

人工智能分为弱人工智能和强人工智能,前者让机器具备观察和感知的能力,可以做到一定程度的理解和推理,而强人工智能让机器获得自适应能力,解决一些之前没有遇到过的问题。但目前的科研工作都集中在弱人工智能这部分,并很有希望在近期取得重大突破。弱人工智能有希望取得突破,是如何实现的,“智能”又从何而来呢?这主要归功于一种实现人工智能的方法——机器学习

机器学习是人工智能的一个分支,是一种实现人工智能的方法,即以机器学习为手段解决人工智能中的问题。让一个计算机程序针对某一个特定任务,从经验中学习,并且越来越好。

机器学习直接来源于早期的人工智能领域,传统的算法包括决策树、聚类、贝叶斯分类、支持向量机、EM、Adaboost等等。从学习方法上来分,机器学习算法可以分为监督学习(如分类问题)、无监督学习(如聚类问题)、半监督学习、集成学习、深度学习和强化学习。

而深度学习则是机器学习拉出的分支。是机器学习算法中的一种算法,一种实现机器学习的技术和学习方法。

学习路径

我打算根据《机器学习实战》开始学习,每周看 1 ~ 2 章。这本书主要讲解了如何使用 Python 代码实现一些机器学习的主流算法,并尝试应用这些算法到自己的数据中。我大概翻了翻,觉得关于 Python 代码的部分,写的并不是很好,一方面是这本书还用的是 Python2,另一方面是,我习惯于用 Pandas 中的 dataframe 来处理数据(书上还是比较原始的方法。。),所以我打算在之后的学习中把所有的代码都替换为 Python3 并使用数据框来处理数据。

关于 Python 数据处理基础,推荐大家阅读《Python 数据科学手册》,若只是想学习在《机器学习实战》中用得上的函数,只需学习关于 NumPy,Pandas,Matplotlib 的三章即可。欢迎大家阅读我对《Python 数据科学手册》一书的学习笔记~

如果你还没有开始学习 Python 的话,推荐阅读《Python 生物信息学数据管理》,这本书从一个个实际的生物学问题出发,带你入门 Python!下面的链接也是我曾经的学习笔记~

因为《机器学习实战》一书主要是讲解代码实现,更多关于机器学习的理论知识,我还打算参考周志华的《机器学习》和李航的《统计学习方法》进行总结。




正式内容下周开始更新~不见不散哦

Reference

  • 一篇文章讲清楚人工智能、机器学习和深度学习的区别和联系

猜你喜欢

Jupyter Notebook 你不得不知的交互式笔记本

Bpipe | 教你轻松搭建分析流程

神奇的单行命令

FASTP | 极速全能的 FASTQ 预处理神器

我的 Shiny 入门学习笔记

我的 Docker 笔记

使用 bcl2fastq 将 base call 文件转换成 fastq 文件

在 Python 中调用百度 API 批量翻译

生信考研经历分享

生信基础知识100讲

生信菜鸟团-专题学习目录(5)

生信菜鸟团-专题学习目录(6)

生信菜鸟团-专题学习目录(7)

还有更多文章,请移步公众号阅读

▼ 如果你生信基本技能已经入门,需要提高自己,请关注下面的生信技能树,看我们是如何完善生信技能,成为一个生信全栈工程师。

如果你是初学者,请关注下面的生信菜鸟团,了解生信基础名词,概念,扎实的打好基础,争取早日入门。


Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/35370
 
452 次点击