自学AI 和ML资料汇总

目录

近年来,随着多个机器学习和人工智能项目的成功,机器学习和人工智能领域将会涌现出大量机会包括工作岗位和创业机会。因此,机器学习和人工智能将当之无愧的成为下一个风口。目前全国各地的科技城和产业园如雨后春笋般拔地而起,什么样的人才能够入住?以机器学习和人工智能技术为依托的互联网内容提供商将会占据很大比例。

处于这样一个飞速发展的时代,又恰好从事信息技术产业,对我来说没有什么是稳定的。等一切稳定,意味着没有机会。快速学习的技能将会是超越其他技能的最总要重要的技能。那么如何快速学习机器学习,本文提供了一些资料汇总。

1 简介

机器学习是近20多年兴起的一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。机器学习算法是一类从数据中自动分析获得规律,并利用规律对未知数据进行预测的算法。因为学习算法中涉及了大量的统计学理论,机器学习与统计推断学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。

2 学习资料

2.1 公开课

  1. Andrew NG的《机器学习》,这个课程在网易公开课(据说版本比较老了),stanford学校上(cs229)还有coursera上也有的。
  2. NTU 林轩田 《机器学习基石》和《机器学习技法》
  3. corsera上明尼苏达两位老师的《Recommender system》
  4. Caltech的公开课 learning from data

2.2 书籍

  1. 吴军 《数学之美》 科普用
  2. 李航《统计学习方法》数学推导比较多
  3. Harrington 《机器学习实践》调用了python的两个包numpy,scipy. scikit-learn几乎包含了所有常用的算法。
  4. Duda 《模式分类》
  5. 项亮的《推荐系统实践》
  6. Kevin Murphy's Machine learning: a Probabilistic Perspective
  7. Hastie, Tibshirani, and Friedman's The Elements of Statistical Learning
  8. Bishop's Pattern Recognition and Machine Learning
  9. David Barber's Bayesian Reasoning and Machine Learning
  10. Larry Wasserman's All of Statistics: A Concise Course in Statistical Inference
  11. An Introduction to Statistical Learning with Applications in R
  12. Tom Mitchell的 machine learning,还有他的论文 The siscipline of Machine Learning

2.3 博客

  1. 林达华的博客
  2. pluskid的博客
  3. jerrylead 的博客
  4. LeftNotEasy 的博客
  5. Jason Brownlee的博客

2.4 资源汇总

  1. 机器学习的最佳入门学习资源 系统总结了一些机器学习的相关资源。
  2. 机器学习入门资源不完全汇总 这里有相当详细的资源汇总,但是个人认为太过繁杂而有不成体系,看得头大
  3. 机器学习该怎么入门 张松阳的回答提供了比较多的有用资源
  4. github awesome-machine-learning 提供了不少资源,有书籍有项目,丰俭由人

3 学习方法

读书,实践,读书,实践。

  1. 有英文原版的尽量读英文原版。
  2. 要有自己的项目输出(通过github来实现)
  3. 要和别人有交流(通过github来实现)

4 学习日记

这几天一直在看《linear algebra done right》和《Bayesian Reasoning and machine Learning》,同步学习的还有《Thinking in Java》以及《Python Doc》(这是Python的官方文档)。前两者是理论基础,后两者是工具。这与以后要从事的工作是高度契合的:既要懂得原理,又要会用计算机语言验证想法。

关于原理的学习还需要更输入的学习,接下来我的进一步计划是《随机过程》和《The Elements of Statistical Learning》。具体参阅哪一本书,稍后再定。不过在学习的过程中,一定要避免知识点的堆砌,所有的学习都要围绕一个问题展开来。为了保证这一点,我通过写博客的方式约束自己。每一篇博客都要有一个中心,围绕这个中心展开知识点的铺垫。中心就像树干,知识点的展开就像树枝,这样才有整体感。

5 最重要的能力

最重要的能力不是学习一门语言或者一种技术,最重要的能力是 解决问题的能力 。你所学习的语言,你所掌握的技术以及你的思维方式都是解决问题的副产品。所以不要为掌握了某种新技能沾沾自喜,解决问题的能力才是最重要的。

要有提问题的能力,提出问题,分析问题,搜集资料,解决问题。不要花费太多精力在搜集资料上,针对那些硬盘里放了一大堆电子书,并幻想自己已经掌握的硬盘式专家,我也不好多说什么。