如何阅读paper

2024.11.06二编

多读解决一切问题~


2024.9.6下午,我开始干啃《Chameleon Hashing and Signature》这篇文章;十分钟之后,感觉头顶冒烟了~

如果单单阅读 Abstract 和 Introduction 部分,虽然可以快速领会文章的大意,但是其内容对读者的提升同样巨大

故总结了几篇高推荐文章,作为今后论文阅读的指导

论文获取:

  • 询问导师和同门
  • Google Scholar运用合适的关键词收集30篇左右论文(高引用量论文优先收集)
  • 高引论文的参考文献

论文如何阅读:

一篇期刊论文,主要分成三个部分。

  1. Abstract:

这篇论文的:主要贡献、方法特色与主要内容。

只看 Abstract 和 Introduction 判断篇论文的重点和你的研究有没有直接关联,从而决定要不要把它给读完

  1. Introduction:

功能:介绍问题的背景和起源,交代前人在这个题目上已经有过的主要贡献,说清楚前人留下来的问题,以及在这个背景下这篇论文想解决的问题和它的意义。

对初学的学生而言,从这里可以了解以前研究的概况。先把跟你题目可能相关的论文收集个 30~40篇,每篇都只读Abstract 和 Introduction,而不要读 Main Body(本文),只在必要时稍微参考一下后面的 Illustrative examples和 Conclusions,直到你能回答下面这四个问题:

  • (2A)在这领域内最常被引述的方法有哪些?
  • (2B)这些方法可以分成哪些主要派别?
  • (2C)每个派别的主要特色(含优点和缺点)是什么?
  • (2D)这个领域内大家认为重要的关键问题有哪些?有哪些特性是大家重视的优点?有哪些特性是大家在意的缺点?这些优点与缺点通常在哪些应用场合时会比较被重视?在哪些应用场合时比较不会被重视?

问题是,你怎么去找到这最初的30~40篇论文?有一种期刊论文叫做review paper,专门在一个题目下面整理出所有相关的论文,并且做简单的回顾。你可以在搜寻 Compendex 时在 keywords 中加一个review而筛选出这类论文。然后从相关的数篇review paper 开始,从中根据 title 与 Abstract 找出你认为跟你研究题目较相关的30~40篇论文。

通常只要你反复读过该领域内30~40篇论文的Abstract 和 Introduction,你就应该可以从Introduction的评论中回答(2A)和(2B)这两个问题。尤其要记得,当你阅读的目的是要回答(2A)和(2B)这两个问题时,你一定要先挑那些 Introduction写得比较有观念的论文念(很多论文的Introduction 写得像流水帐,没有观念,这种论文刚开始时不要去读它)。假如你读过30~40篇论文的 Abstract 和 Introduction之后,还是回答不了(2C),先做下述的工作。

你先根据(2A)的答案,把这领域内最常被引述的论文找齐,再把他们根据(2B)的答案分成派别,每个派别按日期先后次序排好。然后,你每次只重新读一派的 Abstract 和 Introduction(必要时简略参考内文,但目的只是读懂Introduction内与这派有关的陈述,而不需要真的看懂所有内文),照日期先后读 ,读的时候只企图回答一个问题:这一派的创意与主要诉求是什么?这样,你逐派逐派地把每一派的Abstract 和 Introduction 给读完,总结出这一派主要的诉求 、方法特色和优点(每一篇论文都会说出自己的优点,仔细读就不会漏掉)。

其次,你再把这些论文拿出来,但是只读Introduction,认真回答下述问题:每篇论文对其它派别有什么批评?然后你把读到的重点逐一记录到各派别的“缺点”栏内。

通过以上程序,你就应该可以掌握到(2A)、(2B)和(2C)三个问题的答案。这时你对该领域内主要方法、文献之间的关系算是相当熟稔了,但是你还是只仔细读完Abstract 和 Introduction而已,内文则只是笼统读过。

这时候,你已经掌握到这领域主要的论文,你可以用这些论文测试看看你用来搜寻这领域论文的 keywords 到底恰不恰当,并且用修正过的 keywords 再搜寻一次论文,把这领域的主要文献补齐,也把原来30~40篇论文中后来发现关系较远的论文给筛选掉,只保留大概20篇左右确定跟你关系较近的文献。如果有把握,可以甚至删除一两个你不想用的派别(要有充分的理由),只保留两、三个派别(也要有充分的理由)继续做完以下工作。

然后你应该利用(2C)的答案,再进一步回答一个问题(2D):

  • 这个领域内大家认为重要的关键问题有哪些?
  • 有哪些特性是大家重视的优点?
  • 有哪些特性是大家在意的缺点?
  • 这些优点与缺点通常在哪些应用场合时会比较被重视?
  • 在哪些应用场合时比较不会被重视?

然后,你就可以整理出这个领域(研究题目)主要的应用场合,以及这些应用场合上该注意的事项。

最后,在你真正开始念论文的 main body 之前,你应该要先根据(2A)和(2C)的答案,把各派别内的论文整理在同一个档案夹里,并照时间先后次序排好。然后依照这些派别与你的研究方向的关系远近,一个派别一个派别地逐一把各派一次念完一派的 main bodies。

  1. Main body(含simulation and/or experimental examples):

在你第一次有系统地念某派别的论文 main bodies 时,你只需要念懂:

  • (3A)这篇论文的主要假设是什么(在什么条件下它是有效的),并且评估一下这些假设在现实条件下有多容易(或多难)成立。愈难成立的假设,愈不好用,参考价值也愈低。
  • (3B)在这些假设下,这篇论文主要有什么好处。
  • (3C)这些好处主要表现在哪些公式的哪些项目的简化上。至于整篇论文详细的推导过程,你不需要懂。除了三、五个关键的公式(最后在应用上要使用的公式,你可以从这里评估出这个方法使用上的方便程度或计算效率,以及在非理想情境下这些公式使用起来的可靠度或稳定性)之外,其它公式都不懂也没关系,公式之间的恒等式推导过程可以完全略过去。假如你要看公式,重点是看公式推导过程中引入的假设条件,而不是恒等式的转换。
  • (3D)这一派主要的缺点有哪些。

但是,在你开始根据前述问题念论文之前,你应该先把这派别所有的论文都拿出来,逐篇粗略地浏览过去(不要勉强自己每篇或每行都弄到懂,而是轻松地读,能懂就懂,不懂就不懂),从中挑出容易念懂的 papers,以及经常被引述的论文。然后把这些论文按照时间先后次序依序念下去。记得:你念的时候只要回答(3A)、( 3B)、(3C)三个问题就好,不要念太细。

这样念完以后,你应该把这一派的主要发展过程,主要假设、主要理论依据、以及主要的成果做一个完整的整理。其次,你还要在根据(2D)的答案以及这一派的主要假设,进一步回答下一个问题:(3D)这一派主要的缺点有哪些。最后,根据( 3A)、(3B)、(3C)、(3D)的答案综合整理出:这一派最适合什么时候使用,最不适合什么场合使用。  

当你是生手的时候,你要评估一个方法的优缺点时,往往必须要参考它Examples。但是,要记得:老练的论文写作高手会故意只 present 成功的案例而遮掩失败的案例。所以,simulation examples and/or experiments 很棒不一定表示这方法真的很好。你必须要回到这个方法的基本假设上去,以及他在应用时所使用的主要公式(resultant equations)去,凭自己的思考能力, 并且参考(2C)和(2D)的答案,自己问问看:当某某假设在某些实用场合上无法成立时,这个方法会不会出什么状况?猜一猜,预测一下这个方法应该会在哪些条件下(应用场合)表现优异,又会在哪些条件下(应用场合)出状况?根据这个猜测再检验一次simulation examples and/or experiments,看它的长处与短处是不是确实在这些examples 中充分被检验,且充分表现出来。

那么,你什么时候才需要弄懂一篇论文所有的恒等式推导过程,或者把整篇论文细细读完?NEVER!你只需要把确定会用到的部分给完全搞懂就好,不确定会不会用到的部分,只需要了解它主要的点子就够了。


Reference:

一文教你如何快速高效阅读Paper(硕士生版)