데이터 과학 유망주의 매일 글쓰기 — 캡스톤 프로젝트 3주차 — 1
기획서를 쓸 때 주의할 것
# 기획서
오늘 한일:
오늘은 기획서를 대폭 수정했다. 프로젝트를 진행하다보니, 전체적인 그림이 조금 다르게 그려져서이기도 했고, 조금 더 설득력 있는 가설과 분석 기법들이 생각나기도 했기 때문이다.
중간 중간 기획서를 쓸 떼 주의할 점들에 대해 가이드를 받았는데, 오늘은 그 점들을 요약하는 글을 쓰면 어떨까하는 생각이 들었다. 이전에는 기획서를 쓸 때 포함해야할 내용에 대해 다루었다면, 오늘은 기획서를 쓸 때 작성할 내용에 대해 주의할 점들을 요약하려고 한다. 내가 기획서를 쓰면서 피드백을 받아왔던 점들을 정리하여, 다음에는 조금 더 좋은 기획서를 쓸 수 있도록 참조하는데 활용할 수 있게 하려는 목적이다.
기획서 쓸 때 주의사항
축약어를 사용할 때는 반드시 원어를 표기하자
예를 들어 교차검증(Cross Validation)이라는 개념이 있는데, 이를 줄여서 “CV”로 표현하기도 한다. 하지만 이렇게 무작정 축약어를 쓰면, 읽는 사람 중 축약어를 모르는 사람들에게는 혼란을 야기하기 쉬우므로, 축약어를 쓸 경우는 처음 쓸 때 원어를 괄호안에 넣어준다. 독자는 이후부터, 축약어가 사용될 때마다 의미하는 바를 명백히 알 수 있게 된다.
- 예: CV(Cross Validation)
일관성을 유지한다
“교차검증”이라는 용어를 한글로 쓴다면, 이후에 갑자기 “Cross Validation”이라는 영문 표현이 나올 때 일관성을 유지하기 힘들고, 글이 정리되지 않아 보일 수 있다. 그러므로 한글 표현을 쓰면 계속 한글 표현을, 영문 표현을 쓰면 끝까지 계속 영문 표현을 써서 일관성을 유지해야한다.
- 나쁜 예: 교차검증은 모델의 성능 개선을 위해 필요하다. Cross Validation은 지나쳐서는 안되는 과정이다.
- 좋은 예: 교차검증은 모델의 성능 개선을 위해 필요하다. 교차검증은 지나쳐서는 안되는 과정이다.
일관성은 포맷에서도 중요한데, 기획서내 글의 정렬, 글씨의 크기, 볼드 표시 등은 동일하게 작성하여야한다. 이는 읽는 사람의 가독성을 위해 매우 중요한 문제다. 리스트화할 내용이 있다면 “-”나 “*” 둘 중 하나를 일관되게 사용하는 것도 중요하다. 글씨의 색깔은 다른 특별한 목적이 없다면 되도록 검정색으로 통일하는 것이 좋다.
불필요한 용어나 일상어를 사용하지 않는다
기획서에 “…”이나 “그리고", “그러나" 같은 접속사는 읽는 사람으로 하여금 글이 잘 읽히지 않게한다. 무엇을 말하려고 하는지는 최대한 짧고 간결해야하며, 불필요한 용어를 줄여 읽는 사람을 최대한 배려한다.
또한, “~함”, “~할 것” 등의 표현 역시 완전한 문장의 형태가 아니므로 명확하지 않게 느껴진다. 되도록 “~하다.”, “~할 것이다.” 등의 동사 형태로 끝내는 것이 더 깔끔하고 일관성 있어 보인다.
- 나쁜 예: 그러나, 데이터의 클래스 불균형이 존재하지 않으므로 따로 샘플링 작업을 거칠 필요가 없음
- 좋은 예: 데이터의 클래스 불균형이 존재하지 않기 때문에, 따로 샘플링 작업을 거칠 필요는 없다.
스스로 이해하지 못한 내용은 과감히 버린다.
기획서에 들어가는 모든 내용은 본인이 설명할 수 있어야한다. 따라서, 그 어떤 내용도 자신이 이해하지 못했다면 들어가지 않아야한다. 물론, 프로젝트의 결과를 예측한 것이 100% 맞지 않을 수 있고, 프로젝트 진행 중 생각한 것과 다른 문제를 안게 될 수도 있지만, 초기 단계에서 프로젝트의 목적과 의의를 분명하게 설명할 수 있어야한다. 그렇게 해야, 프로젝트를 지원하는 사람을 설득하여, 원하는 시간적, 물리적 지원을 얻을 수 있는 가능성이 높아지기 때문이다.
참고자료는 찾아 볼 수 있는 형태로 쓴다.
기획서는 용지로 뽑아내면, 링크를 타고 들어갈 수 없다. 따라서, 상대방이 찾아볼 수 있는 형태로 참고 자료를 제공해주어야한다.
- 나쁜 예: 컴퓨터 월드의 기사 “인공지능의 전망"에 따르면, 인공지능은 우리 곁에 생각보다 매우 가까이 와 있다고한다.
- 좋은 예: [컴퓨터월드, 2020, “인공지능의 전망”]에 따르면, 인공지능은 우리 곁에 생각보다 매우 가까이 와 있다고한다.
오타를 주의한다.
이력서도 오타가 있으면 감점 요인이 되듯이, 기획서도 마찬가지다. 누군가를 설득할 목적으로 쓰는 글에 오타가 있으면, 신뢰를 잃기 쉽다. 기획서를 논문과 같이 생각하라. 그만큼 꼼꼼하게 쓰는 것이 중요한 형태의 글쓰기다.
중복되는 내용은 제거한다.
비슷한 내용을 반복해서 말할 필요는 없다. 이전에도 언급한 것처럼, 기획서는 깔끔하고 간단 명료할 수록 좋다.
- 나쁜 예: 머신러닝을 통해 가설을 증명할 수 있다. 머신러닝을 통해 가설이 유효한지 아닌지 알 수 있다.
- 좋은 예: 머신러닝을 통해 가설을 실험할 수 있다.
스스로 묻고 답하지 않는다.
프로젝트를 기획하는 이유는 내가 확실히 모르거나, 예상한 바를 실험을 통해 확인하기 위함이다. 프로젝트를 통해 답할 질문에 스스로 확신에 찬 답을 한다면, 기획서의 의미가 퇴색된다. 프로젝트를 통해 답하고자 하는 질문은 분명해야하며, 누구나 답을 내릴 수 있을 만큼 매우 간단하지 않아야한다. 프로젝트를 기획하는 이유를 분명히 한다면, 의미있는 질문을 만들어 낼 수 있고, 거기서 더 의미있는 가설을 세울 수 있을 것이다.
- 나쁜 예: 모델의 정확도는 얼마나 나올까? 아마도 모델의 정확도는 80% 이상은 분명히 나올 것이다. 이 것을 가설로 세운다면, 분명히 증명할 수 있을 것이다.
- 좋은 예: 모델의 정확도는 얼마나 나올까? 모델링을 통해 “타깃을 80% 이상의 확률로 예측할 수 있다”는 가설을 세운다. 실제 머신 러닝 모델을 사용하여 이 가설이 유효한지 실험한다.
추측성 어투는 자제한다.
가설을 제외한 모든 부분에서 추측성 어투는 자제한다. 프로젝트의 목적은 내가 확신하지 못하는 것을 실험을 통해 확인하고자 하는 것이다. 그 이외의 것들은 되도록 사실에 바탕해 계획을 세워야한다. 특히, 기획서에 프로젝트를 하는 이유에 대해서는, 사실에 근거한 참조물 등을 활용하여 설득력있게 전달해야한다. 자신의 추측으로 “필요할 것으로 보인다.”등의 어투를 사용하면 사실에 바탕을 둔 것이 아니기 때문에 프로젝트의 목적이 갖는 설득력이 떨어질 수 있다.
- 나쁜 예: 자율주행차는 아마도 인간의 살색을 구분해야 할 것으로 판단된다.
- 좋은 예: [워싱턴포스트, 2016, “자율 주행의 모순"]에 따르면, 자율주행차는 인간의 피부색을 구분할 수 있어야 인간을 인식하고 그에 맞는 대처를 할 수 있다고 한다.
정량화된 용어를 사용한다.
“좀", “더", “많이", “너무" 등등은 정확히 어느 정도의 정량을 말하는 것인지 알 수 없게 한다. 특히 가설을 세울 때는 특정한 기준치를 수치화 해야한다. 그렇게 해야 프로젝트를 통해 하고자 하는 실험이 분명해 질 수 있다.
- 나쁜 예: 딥러닝 모델이 “타깃 데이터를 매우 높은 확률로 예측할 수 있다.”고 가정한다.
- 좋은 예: 딥러닝 모델이 “타깃 데이터를 90%의 정확도로 예측할 수 있다.”는 가설을 세운다.
그외 중요 사항들
그 밖에 기획서를 작성할 때 주의 할 점들은 아래와 같다.
- 실험할 가설/가설을 세우는데 활용한 연관자료/가설에 대한 예상결과를 구분하여 작성한다.
- 프로젝트의 예상 결과물은 실제 볼 수 있는 형태여야한다. 프로젝트 산출물은 무엇이 될지를 분명하게 한다. (Jupyter 노트북, 보고서, 논문 등등)
- 프로젝트에 활용될 분석 방법은 모두 프로젝트 일정/계획에 있어야 한다. 한눈에 들어 올 수 있게 표로 작성하는 것이 좋다. 기획서에는 분석 방법이 명확하고 구체적일 수 있도록한다.
- 전체적으로 내용이 일관되게 연결될 수 있도록 작성한다. SMART기법을 참조하면 좋다.
내일 할일:
오늘은 그동안 프로젝트를 진행한 내용을 바탕으로 그에 맞게 끔 기획서를 대폭 수정했다. 프로젝트를 진행하면서 같이 기획서를 수정하니, 그때 그때 땜빵하는 식으로 하는 듯하게 느껴졌지만, 사실 프로젝트를 처음 기획한 방향에서 전체적인 숲이 예상했던 바와는 다르게 펼쳐지니 기획서를 100% 따라가기 힘든 상황이 많이 발생하는 것도 사실이다. 뉴턴이나 아인슈타인도 여러 실험을 할 때 자신이 생각한대로 매번 되지는 않았을거라고 본다. 그들도 수많은 실험을 거쳐 기록을 수정하면서 자신이 세웠던 가설을 수정하면서 더 가치있고 깊은 실험을 할 수 있었을 것이라 믿는다.
데이터 과학자들은 말 그대로 데이터를 다루는 과학자들이다. 그런만큼, 데이터를 가지고 여러가지 실험을 해야하는 사람들이다. 나는 아직 이 분야에서 새내기인 만큼, 경험도 부족하고 모르는 것도 많아 아무리 그럴듯한 가설을 세워도 그 가설이 처음에는 그렇게 설득력있지 않을 가능성이 높다. 그렇기에 많은 경험을 통해 더 정확하고 분명한 실험을 할 수 있고, 더 나은 가설을 세울 수 있는 것이다. 내가 기획서를 덜 수정하는 유일한 방법은 더 많은 연습과 실험을 통해 경험을 얻는 것이다. 그런 것들이 쌓여 다음에 기획서를 쓸 때, 내가 어떻게 가설을 세워야 한 번에 분명하고 설득력 있는 가설을 세울 수 있을지에 대한 감을 조금씩 얻게 될 것이라고 본다.
그래, 결국 연습과 노력 밖에는 답이 없다. 그래도 그렇게라도 할 수 있다는게 얼마나 다행인가? 노력하면 내가 조금씩 더 발전할 것이라는 사실을 믿어 의심치 않는 것이 어쩌면 가장 좋은 정신적 피난처라는 생각이든다. 내 경험을 통해 쌓인 수많은 데이터를 활용하여, 조금 더 인생에서 확률 높은 실험을 할 수 있는 감을 얻게되기를. 그렇게 내 인생을 조금 더 잘 기획할 수 있기를.
참조:
(1) https://m.post.naver.com/viewer/postView.nhn?volumeNo=16182629&memberNo=9353678