(AI 생성 이미지)
연구논문 작성을 위한 생성형 AI가 범람하고 있다.
문헌 검색 관련 도구들 외에도 논문 원고 작성을 도와주거나 인용 문헌을 추천해주고, 자기 표절을 피하기 위한 패러프레이징 등의 다양한 서비스가 제공되고 있다.
OpenEvidence®는 NEJM과 JAMA Network, National Comprehensive Cancer Network, 그리고 Mayo Clinic Platform 등과 제휴하여 개발된 챗봇형 AI 서비스다. 의학 관련 질문과 작업에 특화된 GPT라고 생각하면 된다. American College of Cardiology나 American Diabetes Association 등 여러 학회와 파트너쉽을 맺고 있다.
OpenEvidence®는 답변마다 참고문헌을 함께 제시하는데, 이때 없는 논문을 지어내는 방식의 환각 현상은 거의 발생하지 않는다. 제시되는 참고문헌이 영향력 높은 저널과 무작위 임상시험 중심이어서 의료 자문 용도론 유용하나, 논문 작성시 인용 문헌을 찾는 용도로는 다소 부족한 면이 있다. 다른 도구들과 병행하는 것을 추천한다. OpenEvidence®는 의료 종사자에 한해 등록 및 무료로 사용이 가능하다.
▷ https://www.openevidence.com
SciSpace는 1회에서 소개했듯이 연구 주제를 입력하면 적절한 아웃라인을 제시하면서 원고 작성을 돕는 AI Writer 기능이 있다. 내가 작성한 문장/문단에 대해 적절한 인용문헌을 추천해주는 Citation Generator(인용 문헌 생성기) 기능도 제공한다. 또한 Agent Gallery 옵션에 들어가면 연구 단계나 분야에 따라 도움 받을 수 있는 AI 에이전트들 역시 사용해 볼 수 있다. 논문 작성 시 우선적으로 사용해보기 바란다. 무료 버전도 제한된 수준으로 대부분의 기능을 사용할 수 있다. 월 $20 프리미엄 구독을 하게 되면 모든 AI도구들의 기능이 제한없이 제공된다.
▷ https://scispace.com
Liner 역시 1회에서 소개했는데 SciSpace와 유사한 인용 추천 등의 기능이 있지만 피어 리뷰를 위한 에이전트가 별도로 존재한다. 이 피어 리뷰 에이전트는 특히 내 원고 안에서 불일치하거나 설명이 부족한 부분을 지적하고 중요한 부분을 체크해 주어 유용하다.
다만 이런 에이전트나 다른 AI 도구들은 내 원고에 대한 리뷰를 받고자 할 때만 써야 하며, 내가 리뷰어로 맡은 원고를 업로드하는 것은 저널 대부분이 금지하고 있으니 유의해야 한다. 내가 리뷰어로 일한다면 내 코멘트에 대한 영문 교정, 문헌 검색 등 제한적인 범위 내에서만 AI도구들을 이용하도록 하자.
▷ https://liner.com
Paperpal 과 Wordvice.ai는 각각 영문 교정 업체인 Editage와 Essay Review에서 개발한 도구다. SciSpace의 AI writer와 유사한 기능도 있지만, 대부분 문법 교정을 위한 Grammar Checker/Proofreader나 Paraphraser, Translator 등 언어 관련 기능에서 강점을 보인다. (Paperpal Help Center)
▷ https://paperpal.com
▷ https://wordvice.ai
이와 유사한 도구 중 DeepL이 있는데 DeepL은 2017년도경부터 기계 번역을 중심으로 발전해 온 도구로, 학술 번역에 빠르고 비교적 정확한 결과물을 생산해서 유용하다. 최근에는 AI를 도입해 영문 교정을 위한 DeepL Write도 제공하고 있다. 세 가지 도구 모두 제한적인 기능으로 무료로 사용 가능하나, 한달에 $6~$10 정도의 금액을 결제 시 거의 무제한 사용이 가능하다.
▷ https://deepl.com
Scite는 이름 그대로 citation(인용)에 특화된 AI이다. 인용문헌 추천이나 내가 사용한 인용문헌이 적절한지 여부를 알려주는 것은 물론, 특정 의견이나 가설에 대해 어떤 논문들이 그것을 뒷받침하거나 반박하는지 등에 대한 정보도 제공한다. Scite는 결제정보 입력 시 7일간 무료 체험을 제공하며 이후에는 매달 $10정도의 가격으로 사용가능하다.
▷ https://scite.ai
만약 ChatGPT나 Claude, Gemini 등 올라운드형 LLM을 이미 잘 사용하고 있다면 적절한 프롬프트를 이용해 위 도구들과 유사한 결과물을 얻을 수 있다.
다만 학술 데이터베이스와 직접 연결이 되어 있지 않은 경우, LLM들의 특성 상 인용문헌 추천 등에서 환각현상이 자주 발생할 수 있겠으나, 논문 작성이나 영문 교정, 피어 리뷰등의 작업은 시도해볼 수 있다.
아래 예처럼 논문 작성에 사용할 때는 내 연구에 대한 배경지식(context)을 충분히 주는 것이 중요하다.
“You are an experienced researcher and scientific writer in [FIELD, e.g., cardiology / molecular oncology / health services research]. I am working on a manuscript about [1–2 SENTENCE SUMMARY OF STUDY]. Study design: [RCT / retrospective cohort / bench experiment, etc.]. Target journal: [JOURNAL NAME or “a Q1 clinical journal in [SUBFIELD]”]. Writing goals: [e.g., clear, concise, IMRAD structure, 3000-word limit, suitable for clinicians]. When helping me, you must adhere to the following rules: (1) Never invent data, methods, or references; (2) Use only the information I provide about my study; (3) Ask clarification questions if something is ambiguous. Acknowledge this setup, then briefly restate your understanding of my project and how you will assist.”
내 연구에 대한 피어 리뷰를 받는데 유용한 프롬프트 예시도 있다. NEJM AI는 최근 호에서 human+AI review 시스템을 도입했는데, 이에 대한 editorial[1]의 supplementary appendix에 이들이 사용한 명령어가 제공되어 있다.
“You are serving as an expert reviewer for NEJM AI, an interdisciplinary journal focused on rigorously evaluating applications of AI in medicine. Please review the attached manuscript and write a concise review with the following sections:
1. Summary. Describe the study briefly in about 4-5 sentences, including clinical relevance, strengths and limitations, rigor, and novelty. 2. Major comments. This section should include 5-10 numbered and ordered limitations of the study, starting from most important. Where possible, integrate a constructive suggestion for the authors to address a limitation. You do not need to do this for every limitation. 3. Minor comments. 4. Overall assessment.
Write concisely, professionally, and in the tone of a rigorous but constructive peer review. After you have prepared the author review, please write very brief comments to the editors of NEJM AI including a final recommendation of either: Encourage Publication, minor revision needed; Encourage Publication, major revision needed; Discourage Publication (not suitable for NEJM AI)”
어떤 AI도구를 사용하든 논문 투고 시 조건은 동일하다. Cover letter와 논문 본문(methods 혹은 acknowledgment)에 어떤 AI 도구를 사용했는지 명시하고, 내용의 사실성에 대한 책임을 저자들이 져야 한다는 것을 인지하며 모든 내용을 꼼꼼히 검토해야 한다.
그리고 연구 및 모든 단계에서 저자들의 판단이 gold standard(가장 정확하고 신뢰되는 기준)가 될 수 있도록 본인 실력을 길러야 할 것이다. 이런 조건이 갖춰진다면 AI 이전 시대에 비해 눈에 띄게 효율성과 수월성이 늘어난 연구 결과물을 받아들 수 있을 것이다.
[1] Arjun K. Manrai, Ph.D., David Ouyang, M.D., Joseph W. Hogan, Sc.D., and Isaac S. Kohane, M.D., Ph.D. Accelerating Science with Human+AI Review. NEJM AI, 2025;2(12); DOI: 10.1056/AIe2501175.
임상의학연구소
임준서 박사
임준서 박사는 서울아산병원 임상의학연구소에서 근무하며, 원내 연구진의 논문 작성과 교정을 지원하고 있습니다. 논문 작성과 게재 및 AI 활용에 대한 풍부한 경험을 바탕으로 연구자들이 보다 효과적으로 연구 결과를 정리하고 발표할 수 있도록 돕고 있습니다. 최신 기술을 접목해 논문의 질을 높이는 방법과 의료 연구에서 AI의 활용 가능성을 뉴스룸 칼럼을 통해 소개할 예정입니다.