这里是,油管Artificial Intelligence Education专栏,原作者Siraj Raval授权雷锋字幕组编译。
原标题 How to Read a Research Paper
翻译 | 王飞 J叔 字幕 | 凡江 整理 | 林尤添
无论是对于机器学习,密码学,分布式一致性,还是网络学科,阅读文献都是一门艺术。为了真正理解计算机科学某个主题下作者的观点,我们必须了解所在子领域当前的研究现状。虽然我们很容易赞同那些被众人追捧的观点,但是在评价中保持批判性以及中立思维,是一项我们应该掌握的能力,博士生在研究生阶段会被针对性地培养这种能力。自己也可以通过持续的耐心,练习来培养这种能力。
一、我为什么要读论文
大多数人的阅读动力来源于自己所设立的目标。这个目标可以是更深入了解激活函数或者也许是利用了注意力机制的概率模型,一旦有了目标,达到这个目标的阅读方法会很容易想出来。沉迷于机器学习论文繁杂的数学演算并不是追求的目标,你的精力应该放在你想要实现的目标之上。
二、读论文的三步骤
第一步,浏览整篇论文,大致了解它的内容。如果标题听起来很有意思并且是相关的,就可以继续阅读。接着读摘要,摘要起着简要介绍论文成果的作用,人们可以将其作为一个概览。然后开始浏览论文剩下的部分,这个时候需要仔细读介绍,然后读小节及子小节的标题,但是这样会忽略掉一些东西,主要忽略数学部分。注意不需要在这个时候读太多数学的部分。最后阅读结尾处的结论和引用文献。在这一步中我们需要假设这些数学演算是正确的,第一步的目的主要是能够理解作者的目的,论文的主要贡献,论文尝试解决的问题。一旦完成了这一步,可以去看看其他人对这篇论文的看法,然后把自己的想法和他们的作比较。总的来说,第一步的目的是确保这篇论文值得我继续花时间去分析研究它。
第二步, 这一步就需要我们读第二遍论文,这次需要读得更加细致,最好边读边做笔记。在通读了全文之后,尝试去充分地理解论文中出现的数学演算。接下来读文中所有有价值的图形图像描述,确保自己能够充分的理解算法。很多时候,作者会通过因式分解得到一个方程,我们在这一步中应该尽量去避免这类分析。当读到论文实验的部分时,就需要对实验结果进行评估,确保实验室是否可重复,支持结论的证据是否足够。在github很可能会有与之相关的代码可供使用,把这些代码下载下来阅读,然后试着去编译和运行代码来重现结果,代码中的注释或许能够帮助我们进一步理解论文。尽量在网络上寻找相关资源来帮助我们解释这篇文章,一篇受欢迎的文章,一般情况下网上应该有人已经做过解读了,这会让我我们更容易找到核心要点。
第三步,主要涉及数学方面的东西,在这一步中注意力主要放在真正弄懂每一个数学细节上。最好在纸上独立解下方程,可以利用维基百科来理解一些数学概念,如相对熵。如果自己感觉足够好,可以试着利用论文中,描述的超参数设置和方程来通过程序实现论文。
三、一定要积极寻求帮助
阅读论文并不容易,没有人能够做到很快地读完并理解复杂方程的一系列操作,要点是要永不放弃,化沮丧为动力,就能搞懂这篇论文,掌握这个主题,并对它游刃有余。当你构建起自己的知识体系的时候,这些会变得更加容易。最后不要羞于寻求帮助,网上有很多围绕机器学习最新研究的团体和社区,通过发布自己的问题来接触研究者,实际上,通过向你解释,以便你能明白,实际上帮了他们一个忙,因为所有的科学家都需要更多的经验来解释复杂的话题。
推荐的学习网站:
https://www.reddit.com/r/MachineLearning/
https://www.elsevier.com/connect/infographic-how-to-read-a-scientific-paper
https://www.quora.com/How-do-I-start-reading-research-papers-on-Machine-Learning
https://www.quora.com/How-do-I-start-reading-research-papers-on-Machine-Learning
https://machinelearningmastery.com/how-to-research-a-machine-learning-algorithm/
http://www.sciencemag.org/careers/2016/03/how-seriously-read-scientific-paper
更多文章,关注雷锋网
添加雷锋字幕组微信号(leiphonefansub)为好友
备注「我要加入」,To be a AI Volunteer !
雷锋网雷锋网(公众号:雷锋网)
。
原创文章,作者:ItWorker,如若转载,请注明出处:https://blog.ytso.com/129487.html