雷锋网按:这里是,油管Artificial Intelligence Education专栏,原作者Siraj Raval授权雷锋字幕组编译。
原标题 Learn Machine Learning in 3 Months
翻译 | 杨丽 廖颖 字幕 | 凡江 整理 | 廖颖 编辑 | 吴璇
到目前为止,我收到最多的问题,就是怎样入门机器学习。为此,我制定了一个三个月的学习指南来帮助你们,更好地从入门级新手变成机器学习的精通者。
同时,为了那些仅能利用闲余时间来学习的人——不管是工作党,还是学生党,我都会用视频进行讲解。如果你能全心全意投入学习,就可以事半功倍地达成效果。
首先,我们先来看看 DeepMind 招聘页面。每每提到发布的人工智能算法, DeepMind 都称得上是世界领先的机构。我们来看一下研究工程师职位。这个职位描述所需要负责的是团队的一部分,需要负责AlphaGo,Deep Q Network 和 WaveNet。它们每一个在 AI 领域都具有革命性。
AI 的最低要求是具有计算机科学学士学位,或是精通 Python,机器学习和算法设计相关领域的人才。在符合以上优先条件者中,不需要具备博士学位或发表一大堆论文。
如果我们要创建一个饼图来理解机器学习的必要性,它是这样分布的:其中35%是线性代数,25%是概率论和统计学,15%是微积分,另外的15%是算法及其复杂性,最后的10%就是数据预处理知识。
根据这些要求,我们可以围绕着这张图建立我们自己的课程。我将这门课程划分为三个月。第1个月主要讲数学和算法复杂性,第2个月讲机器学习,第3个月讲最受欢迎的深度学习。
在开始之前我想说的是,你每天的任务之一就是跟上节奏。
这里是我推荐一些学习资源:
-
第一个推荐的,就是我的YouTube频道,我会把AI方面的内容发布在这里。每周不间断,点击订阅按钮,可以通知你发布了新的内容。
-
如果你还没有没关注,还有一个选择,就是下一个是 MachineLearning。无论是致力于机器学习的学者,还是企业人才,都会在这里分享他们的发现。
-
另外,Twitter也是一个未被充分利用的资源。Twitter就像一个学习养料,如果你使用得当,就可以向厉害的人学习。滚动Twitter页面,它不像大多数社交平台那样鱼龙混杂。事实上它可以丰富你的知识,机器学习研究员喜欢使用这个平台来进行一些非常好的学术争论。我关注的研究员有 Ilya Sutskever,Trent Mcconaghy Andrej Kappathy,Andrew Trask,Pieter Abeel,Chirs Olah,Nando De Freitas等。
-
而Hacker News 是另一个必备的网站,网站对新闻选择很谨慎,只有最好的观点和论据才能置顶。
以上所有的资源都是基于视频的,通过使用视频和简短的网络文本形式可以学得更好。而仅仅使用纯文本的方式,记录下一个个的公式,却没有实际应用,效果不佳。
第一个月:数学
现在开始,进入第一个月的学习——数学。我们将从大多数机器学习的组成——线性代数开始。麻省理工公开课中最受欢迎的课程就是Gillbert Strang教授的线性代数课程。在YouTube的播放列表中有35个视频可以进行观看,如果时间紧张,可以2倍速观看每一个视频,甚至3倍速。
观看的时候要做笔记,记录并不是必要的,只是为了巩固所学。这样可以使学习更有效率。研究表明,通过手写笔记,可以提高大脑保存所学概念的能力。
然后就是微积分。 3Blue1Brown 频道有一个很棒的播放列表叫做微积分的本质,他教你微积分的方式会让你觉得微积分就像自己发明的一样。
学习概率和统计时,edX(麻省理工和哈佛大学联手创建的开放在线课堂平台)有一门很好的课程叫做“科学的不确定性”,你也可以在edX上找到一门很好的算法设计和分析课程。由U penn教授执教,每一门课程发布一周。
我们还得练习加速学习。所谓的加速学习就是每天不间断学习2到3小时,要像海绵一样,以更快的速度观看视频,看视频的同时做笔记。在每个星期结束时,完成一个项目,最好是比较难的项目,这样有利于提升完善自己。 这些项目都有一页简介,可以在网上找到。学习仅仅是把数据下载到你的大脑中,你可以使用工具来加速这一过程。
第一周 线性代数:https://ocw.mit.edu/courses/mathematics/18-06-linear-algebra-spring-2010/
第二周 微积分:https://www.youtube.com/playlist?list=PLZHQObOWTQDMsr9K-rj53DwVRMYO3t5Yr
第三周:https://www.edx.org/course/introduction-probability-science-mitx-6-041x-2
第四周 算法:https://www.coursera.org/courses?languages=en&query=Algorithm%20design%20and%20analysis
第二个月:机器学习
到第二个月的机器学习,有3个播放列表可以观看学习——数据科学中的 python,智能数学 和 Tensorflow 的介绍。看一下Udacity机器学习课程的免费介绍,制作得相当好。接下来的两个星期,你可以选择一些很棒的机器学习项目去完成,利用python编写自己的代码。有了好的编译思想就可以用github链接的形式来帮助大家。这个会帮助你了解何时使用特定的机器学习模型以及它是如何在特定的使用案例应用中工作的。
另外,我也建议参加一个非正式的比赛——这是一个好的方法去学习,同时还可以挣钱。通常需要进行分类,能分类出某种类型的问题,某种机器学习模型,这种模型一般是顾问提供给公司的高薪机器学习模型。通过自己建立模型,可以学得更好。
我建议一周选择两个项目从头开始学习,这会为你提供机器学习的实践经验,包括优化数据预处理,学习类型数据分割和模型评价。这些都是将海绵模式转换成代码。许多的数据科学的艺术,在于你做的用于解决特定问题的大量微观决策。这是练习微观决策的很好的机会,同时可以评估每一个的结果。
scikit-learn是一个非常简单的框架,能快速实现一些机器学习模型。你会发现,在完成一个任务的过程当中,你会问自己同样的问题——如何最好地进行数据分割?什么是最好的参数?……
月底的时候,你应该给自己最后一个项目,那就是简单梯度下降算法代码。这是机器学习中最常用的优化策略。如果你可以从头开始编码,那么一切都会变得更容易。
第一周
-
数据科学中的 python https://www.youtube.com/watch?v=T5pRlIbr6gg
-
介绍Tensorflow https://www.youtube.com/watch?v=2FmcHiLCwTU
第二周
Udacity机器学习 https://eu.udacity.com/course/intro-to-machine-learning–ud120
第三、四周
机器学习项目 https://github.com/NirantK/awesome-project-ideas
第三个月:深度学习
进入第3个月,深度学习是一种特定的算法,即神经网络算法。这种算法需要给定大量的数据和强大的计算能力,它的效果和时间都优于其它算法,这就是为什么它如此受欢迎。
看看我在YouTube上对深度学习课程的介绍,看一下Fast.AI的课程——有36小时高质量课程是免费的。在过去两周里,仅仅实现了在深度学习应用里实现深度学习应用。期间,你的github上应该至少有5-10个项目涉及到机器学习和深度学习。你可以从简单的感知器学习到最先进的模型,它们的差异通常只是在结构上的一些小的调整。现在深层学习空间拥有丰富的技术文献,其中一些好东西都是免费的。
3个月之后,不管是你机器学习领域工作的工程师,或是开了一家咨询公司,还是开发出自己的基于 AI 的产品,都应该有足够的信心运用你所学的知识。不要告诉自己,我学不会或者我不够聪明。记住,学习是一个漫长的过程,不管你有多大的年纪,从哪里来,你都可以实现这个目标。借助互联网的力量,你可以在这个领域产生影响。
如果你不喜欢我的学习计划,那就自己制定一个吧。做最适合你自己的事情,最好是让一个朋友和你一起同步学习,这样就能彼此监督鼓励,而不半途而废。只要给自己一个积极的心理暗示,就不会轻易放弃。
人工智能将覆盖每一个行业,改变它对人类的意义。不管你是否理解它,不管你支持那一边,这一切都发生得十分迅猛。 开始你的学习之旅吧,我在这里等大家。
第一周 深度学习介绍 https://www.youtube.com/watch?v=vOppzHpvTiQ
第二周 Fast.AI的深度学习 http://course.fast.ai/
第三、四周 我Github上的深度学习实例 https://github.com/llSourcell?tab=repositories
视频原址 https://www.youtube.com/watch?v=Cr6VqTRO1v0
更多文章,关注雷锋网 雷锋网(公众号:雷锋网)
添加雷锋字幕组微信号(leiphonefansub)为好友
备注「我要加入」,To be an AI Volunteer !
。
原创文章,作者:ItWorker,如若转载,请注明出处:https://blog.ytso.com/129520.html