相信如果你「坚持」读到这里的话,机器学习对你来说已经不是什么高深的概念了。如果你对教机器学习这件事特别感兴趣的话,那你一定需要下面这个能马上学起来的 ToolKit。


「先上课」

《机器学习》(Machine Learning)

4-1

教授:

吴恩达,前斯坦福计算机系的副教授,师从机器学习的大师级人物迈克尔· I .乔丹(Michael I. Jordan)

2008 年,吴恩达入选《麻省理工科技创业》杂志评选出的科技创新 35 俊杰;

2010 年,加入谷歌开发团队 XLab,「认猫」就是吴恩达团队所开发的人工神经网络项目;

2013 年,吴恩达入选《时代》杂志年度全球最有影响力 100 人;

2014 年,加入百度,担任百度公司首席科学家,负责百度研究院的领导工作。

吴恩达在自己创立的在线教育平台 Coursera 上开设的《机器学习》几乎已经成为公认的机器学习入门课程了 。平均评分 4.9 (满分 5 分),从广义机器学习最基础的知识开始讲解,一步一步深入到数据挖掘、数据模型识别。此外还有课程作业。如果能够自己动手完成,将对机器学习算法有一个很深入的认识,全部完成还能拿到斯坦福的证书。另外,你还可以通过下载安装 SciKit-Learn,用它来试验无数个机器学习算法。它是一个对于所有标准算法都有黑盒版本的 Python 框架。

《机器学习》入门后,可以去看进阶版同名课程《机器学习》又称 CS229。学完 Coursera 上的《机器学习》后再去看 CS229 会感到比较轻松,后者拓展了很多理论上的东西。

哦对了,这个课程还保持一项纪录:在 2013–2014 年斯坦福大学秋季学期的「机器学习」课程有超过 800 名学生选修。这是斯坦福历史上最多人同时选修的课程。

课程链接:

《机器学习》:https://www.coursera.org/learn/machine-learning

CS229 : http://open.163.com/special/opencourse/machinelearning.html

《机器学习基石》和《机器学习技术》

4-2

教授:

林轩田,毕业于加州理工学院,目前是台湾人工智能公司 Appier 的首席科学家和台湾大学电机系教授。素有「机器学习之神」的美名,曾连续 4 年带领团队拿下人工智能国际大赛 KDDCup 6 个冠军。他于 Coursera 开设的「机器学习基石」、「机器学习技法」课程吸引来自全球各地数百万人抢上,适合有一定机器学习基础的人学习。

课程囊括机器学习最核心的知识。如果你是研究需要「应用」机器学习的领域,学完后你已经可以妥善使用机器学习的核心工具来解决手上的问题了。而且该课程生动又有趣,林教授把枯燥的算法与数学式的推导引入了「故事性」,让学生们带着问题去学习,学完之后可以直接应用。

课程链接:http://www.csie.ntu.edu.tw/~htlin/

《深度学习教程》(Deep Learning Tutorial)

4-3

作者:李宏毅

译者:胡祥杰

台湾大学电机系助理教授李宏毅利用短短的一天时间,300 页 PPT 深入浅出地介绍了深度学习这个概念,每一个核心概念在文中都有非常生动的案例进行呈现。李宏毅教授没有用大量的学术文字来解释深度学习,而是通过形象化原理与举例把原本枯燥烧脑的概念解释得通俗易懂。讲义中分四个部分对神经网络的原理、目前存在形态以及未来的发展进行了介绍。

原版 PDF 下载链接:http://www.slideshare.net/tw_dsconf/ss-62245351(需翻墙)
墙内下载链接:https://pan.baidu.com/s/1nv54p9R 密码:3mty

「再读书」

《终极算法》(The Master Algorithm

4-4

作者:佩德罗·多明戈斯

多明戈斯是华盛顿大学计算机科学教授,在机器学习与数据挖掘方面著有 200 多部专业著作和数百篇论文,美国人工智能协会院士(AAAI Fellow,国际人工智能界的最高荣誉),荣获 SIGKDD 创新大奖(数据科学领域的最高奖项)等奖项。

本书是一本介绍算法领域的书,同时也是对最先进的技术的报告。多明戈斯说他的写作目的有二:第一个目的是给予这个领域之外的人对机器学习的基本理解以及意识。第二个则是将这个领域向正确的方向推动。他相信我们生活在一个算法的时代,并认为我们也许能看到算法彻底重塑我们世界的那一天——甚至比今天更多。

多明戈斯也提供给想自学机器学习者们一个路径:「可以从在线课程开始,我的课程、Andrew Ng、Yaser Abu-Mostafa 的课程, Carlos Guestrin 和 Emily Fox 在近期开办的系列课程。接着再看开源图书馆,例如 Weka,来自 UCI 数据库或 Kaggle 的数据,开始尝试。然后是学习教科书。Tom Mitchell 所编写的书籍虽然最广为传播且很方便,但它并不是最新的。Kevin Murphy的书籍则覆盖甚广且具有深度,也是数学和代码的优秀结合。」

获取渠道:https://book.douban.com/subject/26931905/

《机器学习》

4-5

作者:周志华

周志华教授是第一位在中国大陆取得全部学位的 ACM Fellow(美国计算机学会院士),也是国内研究机器学习最好的两个实验室之一的 LAMDA ——南京大学计算机软件新技术国家重点实验室的主任。

该书可称得上是机器学习的入门级教科书,在内容上尽可能涵盖了机器学习基础知识的各方面,作者已经试图尽可能少地使用数学知识。然而,少量的概率、统计、代数、优化、逻辑知识似乎不可避免。 因此, 本书更适合大学三年级以上的理工科本科生和研究生,以及具有类似背景的对机器学习感兴趣的人。

获取渠道:https://book.douban.com/subject/26708119/

《神经网络与深度学习》(Neural Networks and Deep Learning)

作者:迈克尔·尼尔森

比起一本学术书,《神经网络与深度学习》 更倾向于是一本手册。作者迈克尔·尼尔森就职于著名创业孵化器 Y Combinator。他曾在 TED 大会上呼吁科技成果要公开。这本书也是一本免费的电子书,主要介绍了「神经网络」与「深度学习」两个概念,通俗易懂,用大量的例子解释了深度学习中的相关概念和基本原理,适合于抽两三天的功夫来细品慢嚼。

获取渠道:

英文版:http://neuralnetworksanddeeplearning.com/index.html

中文版:http://www.tensorfly.cn/home/

《统计学习方法》

4-6

作者:李航

统计数学是机器学习的地基之一,而这本《统计学习方法》就全面系统地介绍了统计学习的主要方法,特别是监督学习方法。作者从自然语言处理的角度,每章介绍一种方法。叙述从具体问题或实例入手,并附有习题。作者李航博士是华为诺亚方舟实验室的首席科学家,他用我们自己的语言写出来的机器学习教程,文从句顺,比内容虽好但翻译拗口的书看起来要更易理解,入门了解这个领域最合适不过。

获取渠道: https://book.douban.com/subject/10590856/

「脑算不过机算」

Metacademy

4-7

创始人:Colorado 

Metacademy 是一个优秀的开源平台,可以把它看作是人工智能和机器学习界的维基百科。许多专业人员共同在这个平台上编写维基文章。Metacademy 的独特之处在于,它把所有的知识点搭建成了一个巨大的技能树,只要你跟着它的指引一步步探究下去,渐渐地你就能形成你的知识图谱。就算你还不清楚你要学什么,Metacademy 还提供课程指引和学习路径地图,带你轻松上路。

Bonus:神经网络框架的选择

众多的神经网络框架:Caffe、Torch、Tensorflow、MXnet、Keras……到底选哪个呢?OpenAI 的科学家 Andrej Karpathy 给出了他的评价:

  • 特征提取或者在已知的模型上进行微调用 Caffe
  • 在已经训练好的模型上进行更加复杂的应用用 Torch
  • 自己写各个网络层用 Torch
  • 大量的使用 RNNs 的话用 Theano 或者 Tensorflow
  • 大规模的模型训练,或者并行的模型训练用 Tensorflow

Andrej Karpathy 对目前大火的 Tensorflow 最新的评价是:「我希望 TensorFlow 能标准化我们的代码,但它是低层面的,所以我们在其上面的层上分道扬镳了。」这大概就是手动再见的意思吧。如果你还在纠结,可以看一下「机器之心」最新编译的 BEEVA Labs 数据分析师 Ricardo Guerrero Gomez-Ol 近日在 Medium 上发表了一篇文章,其中作者盘点了目前最流行的深度学习框架。

「学不下去,刷帖也要刷机器学习!」

Tensorfly

4-8

Tensorfly 是谷歌基于DistBelief进行研发的第二代人工智能学习系统 ——TensorFlow 的中文社区,提供从新手入门到进阶实操的步步指引和优质的中文资源。

KDnugget

4-9

囊括数据分析、大数据、数据挖掘、机器学习和深度学习大杂烩信息站。KDnugget 以订阅方式,向订阅者定期推送关于机器学习的工具、新闻动态、最新观点、学习教程、学术动态、课程更新甚至是求职消息。总之,没事刷两下,总有新发现。

机器之心

4-10

机器之心」应该是国内最知名的报道关于人工智能、机器人、神经认知科学等前沿科技的科技媒体了。高水平的行业采访、高质量的编译、定期的学术资源整理、入门的科普教程……总之,无论你处于机器学习的哪个「段位」,英文读的头疼了,想看看中文内容,「机器之心」是个不错的选择。

cover1


您正在阅读 OFFLINE Issue 43《极简机器学习入门》,成为离线会员,您将收到每周一期电子杂志,完整阅读会员专享内容。

评论

发表评论

电子邮件地址不会被公开。 必填项已用*标注

一个图灵小测试 *