Reddit 网友票选 2018 最佳论文(附阅读技巧)

https://mp.weixin.qq.com/s/dQxbmSHouyAx13LxDKl8kQ

by 超神经

读论文这件事,对深入了解细分领域的技术和难题来说,重要性毋庸置疑。 

2018 年也出现了很多优质的论文,比如各大*学术会议上的获奖论文,我们今天盘点的是 Reddit 网友心中那些 2018 帮助过他们的论文。

Reddit 网友:这篇论文我投一票

@beezlebub33 推荐论文:
《Large-Scale Study of Curiosity-Driven Learning》
大规模的好奇驱动学习研究
https://pathak22.github.io/large-scale-curiosity/

Reddit 网友票选 2018 最佳论文(附阅读技巧)
推荐理由:
这篇文章的重要性体现在,它无需好的奖励机制,就在很多游戏中实现了优异的性能。重要的是它学会了通过预测去玩游戏,能辨别违反期望的行为,能够去探索未知的领域。这可能是 AI 以后发展的方向:自我监督、无标签数据、会预测、好奇心、具有内动力等等。

人们还没有足够的时间去创造出有监督训练集,并且给这些数据集定义矩阵。但如果,给 AI 提供原始数据,并且它可以学习该系统的时空演变的内部表示,那么您可以通过定义目标,最终用 AI 将它实现。

@YBuzzinGA 推荐论文:
《Learning Unsupervised Learning Rules》
学习无监督学习法则
https://arxiv.org/abs/1804.00222.

Reddit 网友票选 2018 最佳论文(附阅读技巧)
推荐理由:
这篇文章是关于使用无监督学习来完成一些任务,它的特点在于,模型正在学习如何自己学习。

元学习是一个关键领域,学习那些学习规则会让 AI 去理解自己,并且去改善自己。如果你可以教一台计算机如何学习了解自己,那么我们就有可能实现飞跃。

@breadwithlice 推荐论文:
《Phrase-Based & Neural Unsupervised
Machine Translation》
基于短语和无监督神经机器翻译
https://arxiv.org/abs/1810.04805v1

Reddit 网友票选 2018 最佳论文(附阅读技巧)
推荐理由:
这篇文章里,仅使用单语料库,就能将完成翻译,而且不需要任何映射,字典或并行数据。
论文里使用了一种反向翻译技术,从A转换为B时,然后将B转换为A,这么做大大改善翻译器,然后切换A和B,这个结果令人惊喜!

@kartayyar 推荐论文:
《Pre-training of Deep Bidirectional Transformers
for Language Understanding 》
语言理解中深层双向法的预训练
https://arxiv.org/abs/1809.10756

Reddit 网友票选 2018 最佳论文(附阅读技巧)
推荐理由:
我喜欢它的地方:
很棒的创新理念,他们使用的遮蔽方法是非常有创意的。

他们用很简单的语句就说清楚了他们的核心理念。
在Github上有代码可重现的结果。
能够处理了多项不同的任务。

@ndha1995 推荐论文:
《An Introduction to Probabilistic Programming》
概率规划导论
https://arxiv.org/abs/1809.10756
Reddit 网友票选 2018 最佳论文(附阅读技巧)
推荐理由:
这是我在2018年最喜欢的论文。

作者对概率规划进行了全面而严谨的介绍,并在最后一章中,介绍了最近关于深度神经网络,和概率规划相结合的研究 。

读论文的硬核建议

就算知道了厉害的论文,除了喊着哇,真厉害,那怎么样才能看懂它们呢? 

首先还是想清楚你的动机,主动地想要探索和被动的完成任务,效果和体验就会完全不同了。我们找到了一些硬核建议,嗯,就帮你们到这了。

批判性地阅读

这是一个很重要的态度。不要盲从作者的观点。相反,要去怀疑和求证。 

什么是批判性阅读?尝试着去提出问题。如果作者试图解决某个问题,他们是否正确的解决了?有没有作者没有考虑到简单方案?解决方案有哪些局限性(包括作者没注意到或明确承认的)? 

Reddit 网友票选 2018 最佳论文(附阅读技巧)

作者的假设是否合理?鉴于假设,论文的逻辑是否明确合理,或者推理中是否存在缺陷? 

如果作者提供数据,他们的数据能不能来证实他们的论点,他们是收集数据的路径是否合理?那他们解释数据的方式呢?换用其他数据会更好吗? 

创造性地阅读

批判性地阅读一篇论文难度系数不是最高,因为毁坏比构建更容易。而创造性的阅读就涉及更难,更积极的思考。 

比如:本文有哪些很好的想法?这些想法是否有其他应用程序或扩展?它们能被进一步推广吗?是否存在会带来重大差异的改进?如果自己进行相关的探究,接下来会做些什么呢? 

在阅读论文时做笔记

许多人都在读论文时记录笔记。这个方法是很不错的,用你喜欢的方式,把想到的任何问题或批注,统统记录下来。试着去找到作者的关键点。

Reddit 网友票选 2018 最佳论文(附阅读技巧)
大受好评的康奈尔笔记法

标记那些最重要或看似有问题的数据。这样的标记有助于理解论文,同时还也有助于之后的回顾。

在第一次阅读之后,
尝试用一两句话来总结论文

几乎所有优秀的论文都在提出一个具体问题的答案。如果你能简洁地描述一篇论文,你可能已经弄懂了到了作者的工作,包括他们想要解决的问题和最终的答案。一旦您专注于主要想法,再回过头去概述论文,就能更深入的了解具体细节。

实际上,如果用一两句话总结论文很容易,那么可以来尝试另一种方法,列出三个或四个要点大纲来总结主要思想。 

如果可能,
将论文与其他作品进行比较

总结论文是尝试确定论文科学贡献的一种方法。但要真正掌握科学价值,你必须将论文与该领域的其他作品进行比较。去弄清楚这些想法是新颖的,还是以前出现过?

值得一提的是,科学研究呈现的方式有多种。比如一些论文只提出新的想法,而其他人去实施验证,并展示其工作方式;还有一些人将之前想法结合在一起,并在一个新颖的框架下整合起来。了解该领域的其他工作可以帮助你更好的了解论文的价值。 

超神经小百科

无监督学习 Unsupervised learning

机器学习可以分为监督式学习、无监督式学习和半监督式学习。

无监督学习是不为训练集提供对应类别标识的学习方法。适用于有数据集但无标签的情况。

无监督学习中使用的数据是没有标记过的,而训练中也不知道输入数据对应的输出结果是什么。没有受到监督式增强 (告诉它何种学习是正确的)。

无监督学习只能默默的读取数据,自己寻找数据的模型和规律,比如聚类(把相似数据归为一组)和异常检测(寻找异常)。

无监督式学习的目的是去对原始资料进行分类,以便了解资料内部结构。其特点是仅对此种网络提供输入范例,而它会自动从这些范例中找出其潜在类别规则。当学习完毕并经测试后,也可以将之应用到新的案例上。

Reddit 网友票选 2018 最佳论文(附阅读技巧)

上一篇:Readit News for Mac(Reddit新闻阅读工具)v2.7激活版


下一篇:我从GitHub上看到了编程语言八年变迁史 | Reddit 30.7k