Daily Blogging — DS — Break 1–5

배우는 자(Learner Of Life)
13 min readOct 2, 2020

--

논문을 읽고 요약하기

# 논문, #요약

Arxiv.org에서는 무료로 논문들을 열람할 수 있다.

오늘 한일:

그동안 숱하게 논문을 읽어보라는 조언을 들었다. 그만큼, 논문을 읽고 내용을 이해한 후, 그것을 구현해 내는 능력이 중요하다는 것이 일반적인 데이터 사이언티스트들의 견해이다.

그렇지만, 대학 때 이후(사실 대학시절에도) 논문을 거의 다루지 않았기에, 어떻게 논문을 읽고 요약을 할 수 있을지 감이 잡하지 않아. 인터넷을 서핑하면서 “논문을 읽고 요약하는 방법"에 대한 팁을 좀 찾아보았는데, 정말 감사하게도 WikiHow(1)라는 곳에서 굉장히 좋은 내용을 발견할 수 있었다. 그래서 오늘은, 내가 여기서 배운 내용을 나만의 방식으로 블로그에 정리하려고 한다.

논문을 요약하는 과정에는 일단 크게 3가지로 나눌 수 있는데, 첫 번째로 논문을 읽기, 두 번째로 초안을 계획하기, 마지막으로 초안을 쓰면서 계속 고쳐나가 완성하는 것이다.

1. 논문 읽기

1–1. 초록(abstract) 읽기

초록은 논문에서 가장 먼저 접할 수 있는 부분이다. 많은 사람들이 초록과 요약을 구분하기 힘들어 하는데, 요약은 말 그대로 논문의 중점들만을 담은 글이지만, 초록은 논문의 연구에 대한 그만큼의 깊은 내용은 없고, 순전히 읽는 사람이 원하는 내용을 담고 있는지를 평가하기 위해서이다. 초록을 읽어보면, 읽는 사람은 이 논문을 계속 읽어야 하는지, 아니면 계속 읽는 것이 시간 낭비가 될지 알 수 있다는 것이다. 연구 목적의 논문들은 매우 전문적이고 깊은 내용을 담고 있기 때문에, 그 논문이 담고 있는 관련 참조물들까지도 같이 읽을 수 있어야 좀 더 깊게 내용을 이해할 수 있다. 이 때문에, 읽는 사람이 정말 자신의 목적에 맞는 글인지를 평가할 수 있어야, 추가적으로 그 안에 있는 수많은 다른 참조물들을 읽을 수 있는 동기부여가 생긴다.

논문을 정했으면, 이 초록 부분을 먼저 읽어보자. 과연 선택한 논문이 나의 연구 목적에 부합하는지를 이 부분을 읽고 결정할 수 있다. 글을 읽기도 전에 읽을 필요가 있는지를 말해주는 부분이 있다는 것이 정말 친절하지 않은가? 그래서 초록은 쓸떼없는 부분이라고 할 수 없다. 사실 매우 중요한 논문의 한 부분이다.

1–2 내용(본문) 이해하기

선택한 논문이 초록 심사를 통과했다면, 이제는 본격적으로 논문의 본문을 읽어야 한다. 내용을 이해하는데 있어 무엇보다 중요한 것은 저자가 말하고자 하는 것 즉, 논문의 주제와 그에 대한 분석이 어떻게 이루어 졌는지를 이해할 수 있어야 한다. 좀 더 세부적으로 이야기 하자면, 아래와 같은 요구사항들에 대한 답을 할 수 있어야 한다.

  • 논문의 주제가 왜 중요한가?
  • 논문이 주제에 대한 적절한 답변을 제시하는가?, 그 이유는 무엇인가?
  • 논문의 주요 쟁점, 인용자료 및 데이터 등을 활용하여 전체적인 분석을 요약하라.

위에 대한 답을 할 수 있다면, 중심 내용을 이해했다고 볼 수 있다.

1–3 결론으로 넘어가라

본문을 이해했다면, 바로 결론으로 넘어가, 논문에서 제시된 연구가 어떻게 결론이 나는지를 확인하라. 본문을 이해하기 힘들다고 하면, 먼저 결론부터 보아도 좋다. 결론이 전체 논문에 대한 주제를 더 명확하게 해 줄 수 있기 때문이다. 본문의 복잡한 쟁점들과 내용들이 어떠한 결론으로 이르는지를 본다면, 좀 더 전체적인 그림을 명확하게 이해할 수 있다.

1–4 논문의 주요 쟁점 및 저자의 입장을 이해하라

처음 논문을 읽을 때, 논문의 중심 내용을 파악하는데 집중하라. 읽으면서 주요 내용들을 메모하는 것도 좋은 방법이다. 논문의 첫 두 문단에 각별히 주의를 기울여 읽자, 이 부분에서 논문의 중심 주장이 드러날 가능성이 높기 때문이다. 주제에 대한 논문의 주장이 무엇인지 이해하고, 그에 대한 중심 쟁점들과 근거들을 파악한다. “가설(hypothesis)", “결과(results)", “기존에는(typically)", “일반적으로(generally)", 또는 “분명하게도(clearly),” 등 중심 주장과 관련된 문장이 포함할 수 있는 단어들에 주의를 기울이자.

또한 논문의 빈 공간에 주요 내용들을 적거나, 읽으면서 밑줄을 치는 것도 좋다. 중요한 것은, 논문의 전체적인 주제과 연결될 수 있는 주요 내용들을 계속해서 인지하는 것이다.

1–5 논점/쟁점을 파악하기

논문의 계속 된 부분들을 읽어보면서, 저자가 논하고자 하는 주요 내용들을 기억하라. 저자가 제시하는 주요한 개념들에 집중하고, 그것들이 저자의 중점 주장과 연결되는지를 항상 생각하라. 논문의 각기 다른 중심 부분들은 주로 각 부분에서 부제목을 달고 있거나, 논문의 전개에서 중요한 특정 단계를 가리킬 가능성이 높다. 이러한 부분들에 대한 제목은 주로 굵은 글씨체로 써져있으며, 다른 부분들보다 텍스트 사이즈가 더 큰 편이다.

논문의 중점들을 파악하는데 성공한다면, 굳이 각 단어에 모두 집중하면서 읽을 필요는 없다. 중요한 것은 논문의 중점들과 그들이 왜 논문의 일부를 차지하고 있는지(왜 중점적인지)를 파악하는 것이다.

1–6 메모하기

능동적으로 읽는 효율성은 매우 중요하다. “능동적 읽기”란, 단순히 읽어가는 것 뿐만 아니라, 읽으면서 각 부분의 부제목에 기반하여 중요한 부분들을 밑줄치거나 표시, 또는 기록하면서 읽는 것을 말한다. 이러한 능동적인 태도는, 논문을 전체적으로 이해하기 위해서 반복적으로 읽어야 하는 수고를 덜어준다. 서론(introduction), 본문에서 이야기하는 방법론(methodology), 결과(research results) 및 결론(conclusions), 또한 참조(references)등 논문의 각 세부 부분에서, 논문의 중심 내용과 관련되는 문장들을 표시하거나 기록한다.

2. 초안 계획하기

2–1. 전체적인 논문의 연구에 대한 간단한 요약을 쓰자

논문 전체의 전개에 대해 간단한 자신만의 요약을 먼저 써보자. 초안이기 때문에 완벽할 필요는 없다. 논문을 한번 읽은 상태에서, 전체적인 요약을 자신이 알고 있는대로 써보자. 논문의 결론에 이르기까지의 과정을 자신의 언어로 묘사해보자. 어떠한 형태로 연구가 진행되었는지에 대한 정보와 방법론에 대해 써본다. 아직 이 단계에서는, 그렇게 자세한 내용을 담을 필요는 없다. 읽고 나서 자신이 이해하는 내용을 빠르게 한번 써보면, 어떠한 용을 중점으로 요약해야 하는지에 대한 감을 잡을 수 있을 것이다.

2–2. 논문의 어떤 부분이 가장 중요한지 결정하라

어떤 부분이 논문의 중점 내용 또는 부분이라고 생각하는가? 아마도 전체적인 논문의 주장을 뒷받침하는 근거들일 것이다. 이러한 부분들은 요약에서 반드시 다루어져야 한다. 연구에 대한 이론적인 배경이나 가정들을 설명하라. 또한 저자의 가설과 이를 증명하기 위해 어떠한 과정으로 연구를 진행했는지에 대해 명확하게 요약해보자. 통계적인 또는 수학적인 결과가 있다면 간단히 요약하고, 주장을 뒷받침하는 데이터에 대한 해석이 있다면 포함시켜야 한다.

2–3 요약에서 사용하면 좋을, 중심 내용들과 관련된 단어들을 찾는다.

논문에서 다루어진, 중심 내용들과 관련된 키워드들을, 될 수 있는한 모두 요약에 넣어야 한다. 만약 이러한 용어들이 이해가 가지 않는다면, 의미를 별도로 찾아볼 수 있어야 한다. 다른 사람이 잘 모를 법한 용어라고 해도, 저자의 주장에 관련이 깊다면, 반드시 요약에 포함되어야한다. 또한 그들의 의미 역시, 다른 이들이 이해할 수 있도록 설명할 수 있어야 한다.

요약이기 때문에, 간결함이 중요하다. 요약은 논문만큼 길어서는 안된다. 요약의 목적은 논문 전체의 연구에 대한 간략한 묘사이다. 달리 말하자면, 특히 해당 분야의 연구에 관심이 많은 사람들이 대상 독자이다. 그들은 논문이 자신들의 연구목적을 위해, 나중에라도 읽어 볼 만한 것인지를 요약본을 통해 판단하게 된다.

요약본의 길이는 각 주요 내용마다 하나의 문단을 가져가도록 하며, 최소 500개에서 최대 1000개 이상의 단어(영어기준)를 벗어나지 않도록 한다. 대부분의 논문 요약본들은 이 기준에서 크게 벗어나지 않는다.

3. 요약본을 쓰기

3–1. 서론(introduction): 주제에 대한 중심 질문으로 부터 시작

저자의 주제에 대한 중심 질문을 명확하게 하는 것으로 부터 서론에 대한 요약을 시작하라. 저자는 논문에서 연구의 중심 내용과, 연구의 목적 등에 대해 다루었을 것이다. 저자가 증명하고자 하는 중심 논증을 자신만의 언어로 요약해보자. 만약 요약할 만한 것이 없다고 느낀다면, 논문의 중심 의문이 어떻게 그것을 증명하고 시험하는 과정으로 변화하는지에 주목하자. 그 것이 아마 논문 전체에 대한 내용일 수 있다.

3–2 방법론(Methodology): 저자가 자신의 주장을 위해 사용한 방법

저자가 자신의 주장을 뒷받침하기 위해 사용한 도구와 방법들을 이야기 하자. 저자가 어떻게 첫 실험, 또는 첫 데이터를 가지고 자신의 결론에 도달했는지에 대해 요약해보자. 오직 결과적인 데이터만을 요약하며, 그 데이터가 정확히 어떠한 과정을 통해 얻어졌는지를 요약할 필요는 없다.

3–3 결과(Results): 저자가 자신의 실험을 통해 얻은 데이터

저자가 자신의 실험 결과 얻어진 데이터를 통해 무엇을 말하려고 하는지를 요약하자. 아래와 같은 질문들에 대한 대답으로써 요약을 할 수 있다. 중요한 것은, 요약본이 반드시 연구의 시발점인 저자의 의문을 담고 있어야 하며, 결과와 결론, 그리고 그 결론이 어떻게 얻어졌는지를 간략하게 설명할 수 있어야 한다는 것이다.

  • 저자가 본래의 목적을 달성하는데 성공했는가?
  • 저자의 연구를 통해 얻어진 결론은 무엇인가? 그리고 그 의미는 무엇인가?

3–4 연결: 모든 것은 논문의 주제와 연결되어야 한다.

요약본에서 무엇보다도 중요한 것은, 각 부주제들 사이의 연결성이다. 그 어떤 것도 논문의 주제와 관련이 없다면, 요약본에 있을 자리는 없다. 그만큼, 요약본의 모든 내용은 하나의 방향을 가리켜야 한다. 요약본의 목적을 다시 상기하자면, 독자에게 논문의 중심 주장을 간략하게 알리는 것이다. 이를 위해서 저자의 주장에 대한 논거를, 어려운 논문의 언어보다는, 자신만의 언어로 쉽게 표현해야 한다. 논문을 읽으면서 명확하지 않은 점들이나 가정들에 간략한 정보를 추가적으로 제공하여, 최대한 논문의 중심 내용을 분명하고도 간결하게 설명해야 한다.

4. 추가적인 팁:

  • 자신만의 언어로 요약을 해야 하지만, 자신의 언어로 저자의 주장을 비틀어서는 안된다. 요약본은 데이터에 대한 자신의 해석을 넣는 것이 아니라, 저자의 중심 주장을 다른 이들에게 간략하게 알리는 것이다. 물론, 논문을 처음 요약할 때에는 쉽지 않게 느껴질 수 있다. 이를 위해서, “나는(I)”등 1인칭의 시점을 가진 단어를 쓰지 않도록 하자.
  • 논문에서 저자가 말한 내용을 그대로 인용(direct quotation)하지말자, 이는 당신의 요약본을 약해보이게 할 수 있다. 만약 어느 정도 인용이 필요하다면, 자신만의 언어로 다른 말로 바꾸어(paraphrasing) 표현한다. 직접적으로 저자의 말을 인용하기 보다, 논문의 중심 내용을 자신의 언어로 표현한다고 생각하고 쓴다. 이때, 주의할 것은, 자신의 언어로 표현할 때, 본래 주장의 의미와 의도를 왜곡하지 않아야 한다.
  • 1인칭 또는 2인칭 대명사의 사용을 자제한다. “나(I), 나의(my), 너(you), 너의(your), 우리(we), 우리의(our), 우리를(us)” 등등의 단어를 말한다. 이러한 단어들은 편향적이어서, 객관성을 유지하기 힘들게 한다. 객관적인 글의 톤을 유지하기 위해서 오직 3인칭의 객관적인 단어들을 사용한다.
  • 객관성을 유지한다. 자신의 언어로 표현할 때, 저자의 주장을 비난하거나 자신의 의견을 넣지 않는다.
  • 현재 시점(present tense)의 언어를 사용한다. 영어에서는 이러한 시점을 일관성있게 유지하는 것이 중요한데, 아무리 연구가 오래전에 이루어졌더라도, 요약본에서는 지금 그 내용을 다루는 것임을 기억하자. 예를 들어, “저자는 A가 B였다고 주장했었다. 그의 실험 결과 A와 B의 성질이 같게 나왔었기 때문이다.(The author pointed that A was B, as A seemed to show identical characteristics as those of B, according to his experiment.)” 는 과거에 형태이다. 이러한 문장을 다음과 같이 현재형으로 표현한다. “저자는 A가 B라고 주장했다. 그의 실험 결과 A와 B의 성질이 같게 나왔기 때문이다.(The author points that A is B, as A seems to show identical characteristics as those of B, according to his experiment.)” 이런식으로 일관된 현재 시점의 언어를 사용한다. 영어에서는 이러한 일관된 시점의 문법을 사용하는 것이 매우 중요하다.
  • 항상 고쳐라. 논문 뿐만 아니라 역사상 모든 형태의 훌륭한 문헌들은, 초안을 잘 작성했다기 보다는 수많은 수정을 통해 나왔다. 자신이 작성한 것에 확신이 들지 않는다면, 주저하지 말고 논문으로 돌아가 자신이 작성한 내용과 논문의 내용이 같은 지를 항상 점검하라. 자신의 언어로 풀어낸 저자의 논증이 논문의 논리적인 흐름과 일치해야 한다. 잘 요약된 논문은 그 어떤 독자에게도 간결한 논문의 리뷰가 될 수 있으며, 그 분야에 관심이 있는 잠재적인 독자들이 보았을 때, 그 논문을 나중에 라도 읽어보고 싶다는 생각을 하게 만들 것이다.
  • 논문의 제목은 “(이탤릭채의 논문 제목)에 대한 요약 [Summary of (article name italicized)]” 이 가장 좋다. 무엇을 요약하는지 제목으로 부터 직관적으로 알 수 있기 때문이다. 여기서 이탤릭채(italicized)를 강조한 이유는, 요약본이 이미 존재하는 특정 문헌에 대해 다루는 것이기 때문이다.
  • 논문의 특정 내용을 가장 강조(highlight)하고 싶다면, 논문에서 지금 이 “4.추가적인 팁" 리스트의 방식처럼 불릿된 내용들(bullet points)을 주목하라. 아마도 이 리스트 부분에 연구 중 발견한 가장 흥미롭거나 중요한 사실이 기록되어 있을 것이다.

5. 가장 중요한 점:

  • 요약본의 각 문단 즉, 논문의 각 부분에 대한 요약은 500–1000개의 단어 범위(영어기준)을 넘지 않도록 한다.
  • 요약본은 반드시 저자의 의문을 포함하고, 저자가 어떻게 해서 자신의 결론/결과에 이르렀는지를 설명할 수 있어야 한다.
  • 요약본의 목적은 저자의 중심 주장에 대해 독자들에게 간략한 리뷰를 해 주는 것이다.
  • 저자의 논증을 자신의 언어로 표현하고, 논문을 읽으면서 채워지지 않은 의문이나 이해가가지 않는 가정들에 대해서는 추가적으로 간결한 설명을 통해 보완한다.
  • 요약본에 필요한 내용은 모두 있어야 한다, 그러나 가능한한 짧을 수록 더 좋다!

앞으로 할일:

오늘은 논문을 읽고 요약하는 방법에 대한 글을 썼다. 논문 하나를 요약하는데 이렇게나 알아야 할 것이 많다는 것이 놀랍다. 하긴, 논문이 특정한 주제에 대해 답을 하기 위해 수십개의 서적으로부터 관련 내용을 가져와 잘 조합하여, 고작 몇 페이지에 담아내야 하는 것이기 때문에 그럴지도 모른다. 나는 보통 논문을 읽으면서, 그 논문만 가지고는 정확하게 저자의 의도를 읽어내기 쉽지 않다라는 느낌이 많이들었는데, 아마도 그건 내가 그 논문이 참조한 수많은 다른 문헌들을 보지 않았기 때문이라고 생각한다. 그렇다, 그렇게 몇페이지 되지 않는 짧은 논문을 이해하려면, 수백 페이지나 되는 다른 자료들을 읽어보아야 한다. 물론, 그렇지 않은 경우도 있을 수 있으나, 대체적으로 그 분야의 전문가가 아니라면, 논문에서 말하는 여러가지 용어들에 대해 추가적으로 찾아보려는 노력을 하지 않으면 안된다. 그만큼, 논문을 제대로 읽고 이해하는데에도 상당한 노력이 소모된다. 그러니 특정 논문의 내용을 다른 이들에게 간략하게 알린다는 건 얼마나 힘든 작업인지 상상할 수 있다. 나 먼저 논문을 이해하지 못하면 안되기 때문이다.

오늘 이렇게 긴 글을 쓰면서도, 아직 내가 많이 부족하다는 것을 느낀다. 논문을 읽는 다는 것이 이렇게나 복잡하고 노력이 많이 필요할 줄이야. 마음 같아서는 빨리 논문을 하나 정해서 조금이라도 읽어보는 것을 시작하고 싶다. 그렇게 해서 그 논문과 관련된 다른 참조 자료들도 볼 수 있는 습관을 들이고 싶다. 지금이라도 시작해야 앞으로 논문이 주어졌을 때를 대비하여, 조금이라도 더 논문 읽기와 친해질 수 있지 않을까? 새삼 석/박사 학위를 가진 선생님들을 포함한 전 세계의 모든 대학원생들이 대단하다고 느끼는 요즘이다.

참조:

(1) https://www.wikihow.com/Summarize-a-Journal-Article

--

--

배우는 자(Learner Of Life)

배움은 죽을 때까지 끝이 없다. 어쩌면 그게 우리가 살아있다는 증거일지도 모른다. 배움을 멈추는 순간, 혹은 배움의 기회가 더 이상 존재하지 않는 순간, 우리의 삶은 어쩌면 거기서 끝나는 것은 아닐까? 나는 배운다 그러므로 나는 존재한다. 배울 수 있음에, 그래서 살아 있음에 감사한다.