Part 2. 프로토콜 작성과 PROSPERO 등록

Part 1에서 연구 질문(PICOS)을 확정했다. 이제 그 질문을 답하기 위한 방법론 전체를 사전에 문서화하고, 공개된 저장소에 등록하는 단계다. 이 파트가 없는 SR은 “사후 조작”으로부터 보호받지 못한다. 결과를 본 뒤 “재미있는” 분석으로 프레이밍을 바꾸거나, 안 나온 결과를 가리거나, 몰래 포함 기준을 조정하는 행위를 차단하는 유일한 장치가 사전 프로토콜이다.

이 파트가 끝나면 당신은 다음을 갖게 된다:

  1. PRISMA-P 2015 체크리스트 27개 항목을 모두 충족하는 프로토콜 문서 (15–25쪽)
  2. PROSPERO 등록 번호 (CRD42025XXXXXX 형식)
  3. 공개 URL에서 접근 가능한 프로토콜
  4. 향후 프로토콜 수정(amendment)을 기록할 버전 관리 체계

2.1 프로토콜이 필요한 이유

“이미 PICOS 다 정했는데 왜 프로토콜을 또 써야 하나?”라는 질문을 신입 대학원생이 자주 한다. 답은 다음 네 가지다.

2.1.1 사후 조작 방지

RCT에서 사전 등록(trial registration)이 필수가 된 것과 같은 이유다. 결과를 본 뒤 분석 방법을 바꾸거나, 원하는 결과만 보고하면 근거 기반 의학의 신뢰성이 무너진다. SR도 마찬가지다.

Tricco et al. (2009)는 기존 완료되었으나 미출판된 SR의 조사에서 음성 결과의 선택적 미출판이 SR에서도 일어남을 보여주었다. PROSPERO 등록은 이 편향을 줄이기 위해 2011년 출범했다.

2.1.2 방법론의 정련

프로토콜 작성 과정에서 질문의 모호함, 측정의 불확실성, 합성 방법의 애매함이 드러난다. “써보니 결정 못한 것이 많더라”는 경험은 거의 모든 저자의 공통 경험이다. 쓰지 않으면 이 문제들이 검색 단계, 스크리닝 단계에서 폭발한다.

2.1.3 팀 합의

프로토콜은 메인 연구자, 보조 연구자, 슈퍼바이저 간의 서면 합의서다. “포함 기준은 이것”, “편향 평가는 이 도구로”, “이 outcome을 primary로” — 이런 결정을 문서화하면 이후 단계에서 “그거 어떻게 하기로 했죠?”로 돌아가는 일이 없다.

2.1.4 출판 시 필수

대부분의 우수 저널(BMJ, The Lancet, Schizophrenia Bulletin, Systematic Reviews 등)은 SR 투고 시 프로토콜 등록 번호를 요구한다. 투고 직전에 등록하는 것은 이미 늦다. PROSPERO는 “검색 시작 후, 데이터 추출 완료 전”까지 등록을 허용하지만, 실제로는 검색 시작 전 등록이 기본이다.

⚡ 주의: 프로토콜 없이 검색을 시작하면 생기는 일

실제 연구실에서 반복 관찰되는 실패 패턴이다:

•       검색 3주차: “어라, FEP를 포함할까 말까?” → 기준 변경 → 이전 2주 스크리닝 재작업

•       스크리닝 5주차: 보조 연구자가 “나는 18세 미만도 포함한 줄 알았다” → 합의 부재로 재스크리닝

•       추출 단계: “primary outcome이 뭐였지?” → 사후적으로 유의한 결과를 primary로 프레이밍 → 투고 시 리뷰어에게 지적당함

•       PROSPERO 미등록 상태로 원고 제출 → 저널이 reject 또는 등록 요구 → 사후 등록은 PROSPERO가 거절

이 모든 실패는 프로토콜이 있었으면 일어나지 않는다.

2.2 PRISMA-P 2015 체크리스트 — 프로토콜의 표준

PRISMA-P (Preferred Reporting Items for Systematic Review and Meta-Analysis Protocols)는 Shamseer et al. (2015)이 개발한 SR 프로토콜 보고를 위한 국제 표준이다. 27개 항목(17개 주요 항목, 하위 항목 포함 시 27개)으로 구성된다.

PROSPERO 등록 양식은 PRISMA-P와 거의 완전히 대응된다. 따라서 PRISMA-P를 먼저 완성하면 PROSPERO 등록이 수월해진다.

2.2.1 PRISMA-P 27개 항목 개요

항목 제목 요구 내용
1a 식별 (Title identification) 제목에 “systematic review” 또는 “meta-analysis” 명시
1b 업데이트 여부 (Update) 이전 SR의 업데이트인지 명시. 업데이트라면 원 SR을 인용
2 등록 (Registration) 등록 계획(PROSPERO 등)과 등록 번호(등록 후)
3a 저자 연락처 (Contact) 연구 책임자의 이름, 소속, 이메일 등
3b 저자 기여 (Contributions) 각 저자의 역할 명시 (CRediT 분류 권장)
4 수정 (Amendments) 프로토콜 수정 이력 기록 방침
5a 연구비 지원 (Sources) 자금 출처. 없으면 “없음”으로 명시
5b 지원 기관 (Sponsor) 지원 기관의 이름과 역할
5c 지원 기관의 역할 (Role) 지원 기관이 SR 설계·실행에 개입했는지
6 배경 (Rationale) SR이 필요한 이유. 기존 연구 상태와 지식 격차
7 목적 (Objectives) PICOS로 구조화된 연구 질문
8 포함 기준 (Eligibility) PICOS에 따른 포함·배제 기준. 보고 특성(언어, 출판 상태)
9 정보원 (Information sources) 검색할 DB, 웹사이트, 수동 검색 계획, 전문가 연락 계획
10 검색 전략 (Search strategy) 최소 1개 DB의 완전한 검색 전략 (제한 포함)
11a 연구 기록 (Study records: data management) 사용할 참고문헌 관리 소프트웨어
11b 선정 과정 (Selection process) 스크리닝 방법, 검토자 수와 독립성, 불일치 해결
11c 데이터 추출 과정 (Data collection) 추출 양식, 검토자 수, 파일럿, 저자 연락 계획
12 데이터 항목 (Data items) 추출할 변수 목록. 가정(assumptions) 명시
13 결과와 우선순위 (Outcomes and prioritization) Primary/secondary/additional outcomes. 각 측정 도구, 시점.
14 편향 위험 평가 (Risk of bias) 사용할 도구 명시, 평가 방법, 검토자 수
15a 데이터 합성 (Data synthesis) 합성 방법 (정량 또는 정성). 메타분석 조건.
15b 추가 분석 (Additional analyses) 하위그룹 분석, 민감도 분석 — 모두 사전 명시
15c 이질성 처리 (Heterogeneity) 이질성이 높을 때의 처리 방침
15d 메타바이어스 (Meta-bias) 출판 편향, 선택적 보고 편향 평가 방법
16 근거 확실성 (Confidence in cumulative evidence) GRADE 또는 대체 도구 사용 계획

💡 팁: PRISMA-P 전체 문서를 참조하라

Shamseer et al. (2015) “Preferred reporting items for systematic review and meta-analysis protocols (PRISMA-P) 2015: elaboration and explanation” BMJ 350:g7647.

이 논문은 각 항목에 대한 상세한 설명과 좋은/나쁜 작성 예시를 포함한다. PRISMA 웹사이트(prisma-statement.org)에서 무료 PDF로 다운로드 가능.

2.3 프로토콜 작성 — 섹션별 상세 가이드

프로토콜은 일반적으로 다음 6개 섹션으로 구성된다. 각 섹션을 어떻게 쓰는지 예시와 함께 본다.

2.3.1 서론 / 배경 (Background)

2–3쪽. 다음 질문에 답한다:

  1. 해당 주제에 대해 현재 알려진 것은 무엇인가? (기존 연구 개관)
  2. 알려지지 않은, 또는 논쟁 중인 것은 무엇인가? (지식 격차)
  3. 이 지식 격차가 왜 중요한가? (임상적이론적 의의)
  4. 이 SR이 격차를 어떻게 메우는가?
  5. 기존 SR이 있다면, 왜 새 SR이 필요한가?
📌 예시: 배경 작성 예시 — CHR 인지 SR

정신증 임상적 고위험군(CHR)은 정신증 발병 전 전구기에 해당하는 상태로, SIPS/SOPS(McGlashan et al., 2010)와 CAARMS(Yung et al., 2005) 진단 기준으로 식별된다. CHR 대상자의 약 15–25%가 2년 내 정신증으로 이행(transition)하며(Fusar-Poli et al., 2020), 조기 개입의 창(window of opportunity)으로 주목받는다.

CHR에서의 인지 기능 손상은 일관되게 보고되어 왔으나, 개별 영역별 손상 크기와 패턴은 연구마다 이질적이다. MCCB(Nuechterlein et al., 2008)와 같은 표준화된 배터리를 사용한 연구, BACS 또는 CANTAB을 사용한 연구, 개별 신경심리 과제를 사용한 연구가 혼재한다.

Fusar-Poli et al. (2012)의 메타분석은 CHR에서 전반적 인지 손상을 보고했으나, 최근 10여 년간 다수의 후속 연구가 출판되었고, 측정 도구별 비교는 체계적으로 이루어진 바 없다. 특히 MCCB 도입 이후의 데이터를 통합하여 영역별·도구별 프로파일을 기술하는 SR이 부재하다.

본 SR은 2000년 이후 출판된 CHR 대상 신경인지 연구를 체계적으로 식별하고, 영역별 손상 효과 크기와 측정 도구별 차이를 기술적으로 합성함으로써 이 격차를 해결하고자 한다.

⚠ 흔한 실수: “교과서식” 배경의 문제

대학원생들이 흔히 작성하는 실패 패턴: “조현병은 전 세계 인구의 약 1%에 영향을 미치는 질환이다. DSM-5는 다음과 같이 정의한다… 원인은 유전적 요인과 환경적 요인의 복합으로 알려져 있다…”

이런 서술은 교과서적이지만 프로토콜 배경으로는 부적절하다. 프로토콜 배경은 “왜 이 SR이 필요한가”를 논증해야 한다. 일반적 질병 개관이 아니다.

규칙: 배경 2–3쪽 중 마지막 1쪽은 “기존 근거의 한계”와 “이 SR의 차별점”에 할애하라.

2.3.2 목적 (Objectives)

Part 1에서 작성한 PICOS 기반 문장형 질문을 그대로 사용한다. 1차 목적과 2차 목적을 구분해 명시한다.

📝 템플릿: 목적 섹션 작성 예시

1차 목적 (Primary objective):

SIPS/SOPS 또는 CAARMS 기준으로 정의된 정신증 임상적 고위험군(CHR) 성인(16–35세)에서, 건강대조군과 비교한 MCCB 7개 영역의 수행 차이(Cohen’s d)를 체계적으로 합성한다.

2차 목적 (Secondary objectives):

•       MCCB 외 측정 도구(BACS, CANTAB, 개별 과제)로 평가된 동일 인지 영역의 효과 크기를 기술한다.

•       측정 도구 간 효과 크기 추정치의 일치도를 평가한다.

•       CHR 진단 기준(SIPS vs CAARMS)에 따른 인지 프로파일 차이를 하위그룹 분석으로 탐색한다.

탐색적 목적 (Exploratory objectives):

•       추적 연구 데이터가 있는 경우, 정신증 이행(transition) 전후 인지 변화를 기술한다.

•       항정신병약 복용 여부에 따른 하위그룹 차이를 탐색한다.

2.3.3 방법 (Methods) — 가장 중요한 섹션

프로토콜 전체의 70–80%가 방법 섹션이다. 이 섹션의 상세도가 SR의 방법론적 엄격성을 결정한다.

2.3.3.1 포함/배제 기준 (Eligibility criteria)

PICOS의 각 요소를 포함 기준과 배제 기준으로 구체화한다. 표 형태로 제시하는 것이 명확하다.

📝 템플릿: 포함/배제 기준 표 예시

 

요소 포함 기준 배제 기준
Population • SIPS/SOPS 또는 CAARMS 기준으로 CHR로 진단된 참여자 • 연령 16–35세 • 임상적으로 평가받은 참여자 • 이미 DSM-5/ICD-10 기준 정신증 발병 • 지적장애(IQ<70) • 뇌손상/뇌질환 과거력 • 현재 심각한 물질 사용장애(DSM-5)
Exposure • CHR 상태 자체 (관찰적 비교) • 중재 연구의 중재 후 측정 결과만 보고한 경우 (baseline 없음)
Comparator • 건강대조군(HC): 정신증 과거력·1차 친족의 정신증 가족력 없음 • 현재 축 I 정신과 장애 없음 • 타 정신과 질환 환자군(조현병, 우울증 등)만을 대조군으로 한 연구 • 정상 대조군이 없는 연구
Outcomes • MCCB 영역별 점수, 또는 • 명확히 MCCB 영역에 매핑 가능한 측정 도구 • CHR군과 HC군의 평균·표준편차 또는 효과 크기 제공 • 결과 보고 없음 또는 초록만 보고 • 영역 매핑이 불가능한 특수 과제만 보고
Study design • 단면 비교 연구 • 종단 연구의 baseline 비교 데이터 • 사례 보고/시리즈(n<10) • 종설, 사설, 의견 • 방법론 논문, 프로토콜 • 동물/in vitro 연구
Publication • 2000년 이후 출판 • 동료심사 학술지 • 영어 또는 한국어 • 학회 초록만 발표 • 미출판 데이터 • 중복 출판

2.3.3.2 정보원 (Information sources)

검색할 모든 정보원을 나열한다. Part 3에서 상세히 다루지만, 프로토콜 단계에서는 최소한 다음을 명시한다:

  • 전자 데이터베이스: MEDLINE (via PubMed), Embase (via Elsevier/Ovid), PsycINFO (via APA/EBSCOhost), Cochrane CENTRAL
  • 지역 데이터베이스: KoreaMed, RISS (한국 연구 포함 시)
  • 임상시험 등록소: ClinicalTrials.gov, WHO ICTRP, CRIS(한국)
  • 회색문헌: OpenGrey(현재 아카이브만), ProQuest Dissertations, medRxiv, OSF Preprints
  • 수동 검색: 포함된 연구 및 관련 종설의 참고문헌, 주요 저널의 최근 호
  • 전문가 연락: 해당 분야 저자들에게 미출판 데이터 요청 (선택적)
  • 검색 일자: 최초 검색일, 업데이트 검색일(투고 직전 권장)

2.3.3.3 검색 전략 (Search strategy)

PRISMA-P는 최소 1개 DB의 완전한 검색 전략을 프로토콜에 포함할 것을 요구한다. 보통 MEDLINE(PubMed) 검색식을 예시로 제시한다. 다른 DB의 검색식은 supplementary로 제공한다.

📌 예시: MEDLINE 검색 전략 예시 (간소화된 형태)

((“clinical high risk”[tiab] OR “ultra high risk”[tiab] OR “ultra-high risk”[tiab] OR “at-risk mental state”[tiab] OR “ARMS”[tiab] OR “CHR”[tiab] OR “prodromal”[tiab] OR “attenuated psychotic symptoms”[tiab])  AND  (“neurocognition”[tiab] OR “neurocognitive”[tiab] OR “cognition”[tiab] OR “cognitive function”[tiab] OR “working memory”[tiab] OR “attention”[tiab] OR “processing speed”[tiab] OR “verbal learning”[tiab] OR “executive function”[tiab] OR “social cognition”[tiab] OR “MCCB”[tiab] OR “BACS”[tiab] OR “CANTAB”[tiab])  AND  (“healthy control”[tiab] OR “healthy comparison”[tiab] OR “HC”[tiab] OR “control group”[tiab])  NOT  (“animal”[mesh] NOT “humans”[mesh])  Filters: English[lang] OR Korean[lang]; 2000/01/01:2025/12/31[dp]

주의: 이 검색식은 예시용으로 간소화된 것이다. 실제 검색식은 Part 3에서 (i) MeSH 용어 추가, (ii) 모든 동의어 포함, (iii) 도서관사서 검토를 거쳐 완성된다.

2.3.3.4 연구 선정 과정 (Study selection process)

다음을 구체적으로 기술한다:

  • 사용할 스크리닝 소프트웨어: Rayyan (권장)
  • 1차 스크리닝: Title/abstract. 2명의 독립적 검토자.
  • 2차 스크리닝: Full-text. 2명의 독립적 검토자.
  • 검토자 간 일치도 평가: Cohen’s kappa (사전 기준 κ ≥ 0.6)
  • 불일치 해결: (i) 토론 (ii) 해결 안 되면 슈퍼바이저(제3 검토자) 중재
  • 파일럿 스크리닝: 검색 결과 중 무작위 50편으로 사전 보정
  • 기준 수정이 필요한 경우의 문서화 방침

2.3.3.5 데이터 추출 (Data collection / Data items)

추출할 모든 변수를 목록으로 제시한다. 완전한 데이터 추출 양식은 supplementary로 첨부한다.

최소한 다음 카테고리를 포함한다:

  • 서지 정보: 제1저자, 발행년도, 저널, 국가
  • 연구 설계: 단면/종단, 모집 방식, 연구 기간
  • 참여자 특성: CHR 진단 기준(SIPS/CAARMS), 연령 M(SD), 성별 분포, 교육 수준, 인종/민족, 약물 상태, 동반이환
  • 표본 크기: CHR군 n, HC군 n, 연구 완료자 수
  • 결과 측정: 측정 도구, 영역별 점수, 평균표준편차 (또는 중앙값·IQR), 효과 크기 (보고된 경우)
  • 재원/이해상충: 연구비 출처, 저자의 이해상충 선언

데이터 추출 절차:

  • 사용할 양식: 구조화된 Excel 템플릿 또는 Covidence/SRDR+
  • 파일럿 추출: 무작위 5편으로 양식 검증
  • 이중 추출: 2명의 독립적 추출자. 전체 또는 최소 20% 샘플링 + 일치도 확인
  • 불일치 해결: 토론 → 슈퍼바이저 중재
  • 원저자 연락: 결측 데이터가 있을 시 이메일 (2회, 4주 간격)

2.3.3.6 결과와 우선순위 (Outcomes and prioritization)

Primary, secondary, exploratory outcomes를 명확히 구분하고, 각각에 대해 측정 도구, 측정 단위, 해석 방향을 명시한다.

📝 템플릿: Outcomes 섹션 작성 예시

Primary outcome:

•       CHR군 대비 HC군의 MCCB 7개 영역(처리속도, 주의/경계, 작업기억, 언어학습, 시각학습, 추론·문제해결, 사회인지) 표준화 차이(Cohen’s d 또는 Hedges’ g). 음의 값은 CHR군의 저하를 의미.

Secondary outcomes:

•       MCCB 외 측정 도구(BACS, CANTAB, 개별 신경심리 과제)로 평가된 동일 7개 영역의 효과 크기.

•       측정 도구별 효과 크기 추정치의 일치도 (동일 연구에서 2개 이상 도구 사용 시).

•       CHR 진단 기준(SIPS vs CAARMS)에 따른 효과 크기 차이.

Exploratory outcomes:

•       추적 연구에서 정신증 이행 전후 인지 변화(pre-post Cohen’s d, 이용 가능한 연구만).

•       항정신병약 복용 여부에 따른 효과 크기 차이.

•       평균 연령·교육 수준과 효과 크기의 연관(meta-regression 대신 기술적 탐색).

2.3.3.7 편향 위험 평가 (Risk of bias assessment)

Part 0에서 언급했듯, 연구 설계에 맞는 도구를 선택한다. 본 예시 SR(관찰 비교 연구)에서는:

  • 주 도구: Newcastle-Ottawa Scale (NOS) — 단면/코호트 연구용
  • 또는: JBI Critical Appraisal Tool for Analytical Cross-Sectional Studies
  • 이유 있는 경우: QUIPS (예후 연구에 가까운 추적 데이터 포함 시)
⚡ 주의: Newcastle-Ottawa Scale의 한계

NOS는 가장 널리 사용되지만 중요한 한계가 있다. Hartling et al. (2013) 등은 NOS의 검토자 간 신뢰도가 낮고, 항목이 모호하다고 보고했다.

권장: NOS를 사용하더라도 (i) 자체 매뉴얼을 작성해 각 항목의 판정 기준을 사전에 명확화하고, (ii) 파일럿 평가로 검토자 간 보정을 수행하라.

대안: ROBINS-E (관찰연구의 인과 추론용, 2024 업데이트)가 더 엄격한 선택지이지만 학습 곡선이 가파르다.

편향 평가 절차:

  • 2명의 독립적 평가자. 불일치는 토론 → 슈퍼바이저 중재.
  • 전체 연구에 대해 수행 (샘플링이 아님).
  • 결과 시각화: robvis 패키지(traffic light plot).
  • 합성 단계에서 편향 평가 결과를 어떻게 반영할지 명시 (민감도 분석에서 고편향 연구 제외 등).

2.3.3.8 데이터 합성 (Data synthesis)

본 튜토리얼이 다루는 SR은 메타분석을 포함하지 않는다. 대신 SWiM (Synthesis Without Meta-analysis) 가이드라인 (Campbell et al., 2020, BMJ)을 따른다.

합성 방법을 다음과 같이 명시한다:

  1. 구조화된 표로 연구 특성 요약 (characteristics table)
  2. Outcome별로 결과를 표와 forest plot 형태로 제시 (메타분석 없이도 forest plot은 시각적으로 유용)
  3. 효과 크기의 방향과 크기를 기준으로 그룹화 (effect direction plot)
  4. 이질성 분석: 임상적(진단 기준, 연령), 방법론적(측정 도구), 통계적(일관성 여부)
  5. 하위그룹 분석: 진단 기준별, 측정 도구별, 약물 상태별 (사전 선언)
  6. 민감도 분석: 고편향 연구 제외, 대표본 연구만 포함 (사전 선언)

메타분석을 하지 않는 이유를 명시해야 한다:

본 SR은 메타분석을 계획하지 않는다. 그 이유는 다음과 같다: (i) 포함될 연구들의 측정 도구가 MCCB, BACS, CANTAB, 개별 과제 등으로 매우 이질적이며, 동일 영역을 측정하더라도 도구 간 비교 가능성이 제한적이다. (ii) CHR 진단 기준(SIPS vs CAARMS)이 연구마다 다르며, 이는 임상적 이질성의 주요 원천이다. (iii) 대상 연구들의 통계적 이질성(I²)이 높을 것으로 예상된다. 따라서 Campbell et al. (2020)의 SWiM 가이드라인에 따라 구조화된 서술적 합성을 수행한다.

2.3.3.9 근거 확실성 평가 (Confidence in evidence)

GRADE (Grading of Recommendations Assessment, Development and Evaluation)가 표준이다. 메타분석이 없어도 GRADE를 적용할 수 있다 (GRADE working group, 2024).

GRADE의 5개 downgrade 요인:

  • 연구 편향 (risk of bias)
  • 비일관성 (inconsistency)
  • 간접성 (indirectness)
  • 부정확성 (imprecision)
  • 출판 편향 (publication bias)

관찰연구는 GRADE에서 “low”에서 출발한다. 3개 upgrade 요인(large effect, dose-response, plausible confounding that would reduce the effect)이 있을 시 상향 가능.

프로토콜에 다음을 명시한다:

  • GRADEpro GDT 소프트웨어 사용
  • 2명의 평가자 + 불일치 시 토론
  • Outcome별로 별도 평가
  • Summary of Findings (SoF) 표로 결과 제시

2.3.4 윤리 / 공개

프로토콜에는 다음을 포함한다:

  • 윤리심사: SR은 원저 환자 데이터를 다루지 않으므로 대부분 IRB 면제. 단, 기관 정책 확인 필요.
  • 이해상충 선언: 저자 개인 및 기관 차원
  • 연구비 출처와 역할
  • 데이터 공유 계획: 추출 데이터, 분석 코드 (권장: OSF 저장소)
  • 결과 보고 계획: 저널 투고, 학회 발표 계획

2.4 PROSPERO 등록 — 실전 가이드

PROSPERO (International Prospective Register of Systematic Reviews)는 영국 York 대학의 CRD(Centre for Reviews and Dissemination)가 운영하는 국제 SR 프로토콜 등록부다. 2011년 출범. 2025년 현재 20만 건 이상의 SR이 등록되어 있다.

2.4.1 PROSPERO의 범위와 자격

다음 조건을 만족해야 등록 가능하다:

  • 주제: 건강, 사회복지, 복지, 공중보건, 교육, 범죄사법, 국제 개발 (최소 1개의 건강 관련 outcome 포함)
  • 단계: 검색을 이미 시작했을 수 있으나, 데이터 추출이 완료되지 않은 상태
  • 언어: 등록 양식은 반드시 영어 (원 프로토콜은 다른 언어여도 됨)
  • 유형: SR, rapid review, umbrella review 등
  • 배제: Scoping review, 일반 narrative review는 등록 불가 (scoping은 OSF 등 대안)
⚡ 주의: PROSPERO 등록의 타이밍

등록 가능 시점: “검색을 시작한 후, 데이터 추출이 완료되기 전까지”

권장 시점: 검색 시작 전. 이상적으로는 프로토콜 완성 직후.

금기: 데이터 추출이 끝난 뒤 등록. PROSPERO는 이를 “사후 등록”으로 판단해 거절할 수 있다.

현실: 실제로는 데이터 추출 시작 후 등록하는 경우도 많다. 그러나 스크리닝 시작 전 등록이 방법론적으로 가장 올바르다.

2.4.2 PROSPERO 계정 생성

URL: crd.york.ac.uk/PROSPERO/

  1. 상단 메뉴의 “Join” 클릭
  2. 이메일, 소속 기관, 이름 등 기본 정보 입력
  3. 계정 활성화: 이메일 확인 링크 클릭 (최대 24시간 소요)
  4. 로그인 후 “Register a review” 선택
💡 팁: 이메일 선택의 중요성

PROSPERO 계정은 이메일에 귀속된다. 대학 이메일은 졸업 후 사용 불가능할 수 있으므로, 장기 접근 가능한 개인 이메일 사용을 권장한다.

다만 기관 이메일이 요구되는 경우도 있으니 확인하라. 가장 안전한 방식은 기관 이메일로 등록하되, 졸업 전 이메일을 업데이트하는 것이다.

2.4.3 등록 양식의 필수 항목 (40개 문항)

PROSPERO 등록 양식은 40개 항목으로 구성된다. 22개가 필수, 18개가 선택이다. 필수 항목을 섹션별로 본다.

섹션 A: 식별 정보 (필수 5개)

  • Review title: 작업 제목. 50단어 이하. PICOS 구조 반영.
  • Original language title: 원어 제목 (영어가 아닌 경우)
  • Anticipated or actual start date: 예상 또는 실제 시작일
  • Anticipated completion date: 예상 완료일
  • Stage of review at time of this submission: 등록 시점의 단계

섹션 B: 저자 정보 (필수 3개)

  • Named contact: 연락 담당자 (주저자 또는 교신저자)
  • Named contact email: 이메일
  • Named contact address: 소속 주소

섹션 C: 연구 질문과 방법 (필수 대부분)

  • Review question(s): 연구 질문. PICO/PICOS 구조로.
  • Searches: 검색할 DB 목록 + 검색 기간 + 언어 제한
  • URL to search strategy: 완전한 검색 전략의 URL (OSF 등)
  • Condition or domain being studied: 연구 대상 질병/분야
  • Participants/population: 참여자 정의 (포함·배제)
  • Intervention(s), exposure(s): 중재 또는 노출
  • Comparator(s)/control: 비교군
  • Types of study to be included: 연구 설계 포함/배제
  • Context: 맥락 (예: 임상 환경, 지역)
  • Main outcomes: 주요 결과 변수 (측정 도구 포함)
  • Additional outcomes: 추가 결과 변수
  • Data extraction: 추출 방법과 프로세스
  • Risk of bias: 편향 평가 방법
  • Strategy for data synthesis: 합성 전략
  • Analysis of subgroups: 하위그룹 분석 계획

섹션 D: 기타 (필수 2개)

  • Type and method of review: SR, rapid review 등
  • Dissemination plans: 결과 공개 계획

2.4.4 양식 작성의 실전 팁

💡 팁: 각 문항의 글자 제한과 권장 분량

•       Review title: 최대 50단어, 보통 15–25단어로 작성

•       Review question: 최대 250단어, 보통 100–150단어

•       Searches: 최대 400단어, DB 목록과 기간 기술

•       Participants/population: 최대 400단어, 포함·배제 기준 상세화

•       Main outcomes: 최대 400단어, 측정 도구와 시점 포함

•       Data synthesis: 최대 500단어, 메타분석 여부·조건·대안 기술

각 문항은 PRISMA-P 항목과 대응된다. 프로토콜 문서를 먼저 완성하면 PROSPERO 양식은 해당 내용을 압축해 복사·붙여넣기만 하면 된다.

2.4.5 제출과 심사

양식 완성 후:

  1. “Submit” 버튼 클릭
  2. 제출 후 자동으로 PDF 초안이 생성된다
  3. CRD 스태프의 심사가 시작된다 (2–6주 소요)
  4. 이메일로 심사 결과 통지

심사 결과는 3가지 중 하나다:

  • Approved (승인): 등록 번호 CRD42025XXXXXX 발급. 즉시 공개.
  • Revisions requested (수정 요청): 특정 항목 재작성 요청. 30일 이내 수정 제출.
  • Rejected (거절): 범위 외, 또는 데이터 추출이 이미 완료되었다고 판단될 시.

2.4.6 PROSPERO의 흔한 거절/수정 요청 사유

⚠ 흔한 실수: PROSPERO 거절/수정 요청의 주요 사유

•       범위 부적합: Scoping review를 SR로 등록 시도. → 해결: PRISMA-ScR 기반으로 OSF에 등록

•       연구 질문이 너무 넓거나 모호: PICOS 구조가 불명확. → 해결: Part 1로 돌아가 재구성

•       연구 질문이 임상적으로 중요하지 않음: CRD 기준 “health-related outcome” 불충족. → 해결: 임상 연관성 명시

•       검색 전략의 부재: 최소 1개 DB의 완전한 검색식이 없음. → 해결: Part 3의 PubMed 검색식을 미리 완성

•       합성 방법 불명확: “narrative synthesis”만 쓰고 방법 미기술. → 해결: SWiM 참조, 구체적 방법 기술

•       하위그룹 분석 미선언: “필요시 수행”은 수용되지 않음. → 해결: 구체적 하위그룹 사전 선언

•       데이터 추출이 이미 완료됨: 시간 선상 타임라인이 불일치. → 해결: 스크리닝 이전 단계에 등록

•       중복 등록: 동일/유사 SR이 이미 등록됨. → 해결: 차별점을 명시적으로 추가

2.4.7 등록 후 관리

등록이 완료되면 다음을 유지한다:

  • 프로토콜 변경 시: PROSPERO 로그인 후 “Update” 기능으로 수정. 변경 이력이 공개됨.
  • SR 완료 시: “Completion status”를 “Completed”로 변경하고 출판 정보 업데이트.
  • 중단/포기 시: “Withdrawn”으로 표시하고 사유 기록.
  • 출판 후: DOI와 출판 정보를 PROSPERO 레코드에 추가.
⚡ 주의: Zombie review 방지

Schiavo (2019)는 PROSPERO에 등록만 되고 영원히 완료되지 않는 “zombie review”를 경고한다. 등록 후 장기간 방치되면 해당 주제의 다른 연구자들이 “이미 SR이 진행 중”으로 오인해 연구를 회피한다.

대안: 매 6개월마다 진행 상황을 업데이트하거나, 더 이상 진행하지 않을 경우 “Withdrawn”으로 처리하는 습관을 들이라.

2.5 프로토콜 수정 (Amendments) 관리

프로토콜이 공개되었다고 해서 변경이 금지되는 것은 아니다. SR을 진행하다 보면 불가피한 수정이 생긴다. 중요한 것은 수정을 투명하게 문서화하는 것이다.

2.5.1 허용되는 수정 vs 의심받는 수정

✓ 허용되는 수정 ✗ 의심받는 수정
검색 전에 이루어진 수정 (PROSPERO update) 결과를 본 뒤 이루어진 수정
예비 검색에서 연구 수가 예상과 달라 범위 조정 (스크리닝 시작 전) Primary outcome이 유의하지 않아 secondary를 primary로 재지정
새로운 평가 도구(예: ROBINS-E 출시)에 맞춰 방법론 업데이트 “충분한 연구가 있어” 포함 기준을 사후 좁힘
언어 제한의 실제 실행 가능성을 고려해 조정 특정 유의한 결과 연구를 포함/배제하기 위한 기준 조정

2.5.2 수정 문서화 방법

모든 수정은 다음을 기록한다 (PRISMA 2020 항목 24c):

  1. 수정 일자
  2. 수정 내용 (변경 전/후)
  3. 수정 사유
  4. 수정을 결정한 사람 (연구팀 합의? 슈퍼바이저 결정?)
  5. 수정이 PROSPERO에도 반영되었는지 여부
📝 템플릿: 프로토콜 수정 기록지 템플릿

 

# 일자 변경 내용 사유 PROSPERO 반영
1 2025-03-15 언어 제한에 일본어 추가 중요 연구 3편이 일본어. 공저자 중 번역 가능자. Yes (2025-03-16)
2 2025-04-02 편향 평가 도구: NOS → ROBINS-E ROBINS-E 2024 업데이트가 더 엄격. 슈퍼바이저 권고. Yes (2025-04-03)

2.6 최종 산출물 — Part 2 완료 시

Part 2가 끝나면 다음을 모두 갖게 된다:

2.6.1 문서 산출물

  1. 완성된 SR 프로토콜 (Word/PDF, 15–25쪽)
  2. Supplementary 1: 포함/배제 기준 상세 표
  3. Supplementary 2: 완전한 검색 전략 (최소 1개 DB)
  4. Supplementary 3: 데이터 추출 양식 템플릿
  5. Supplementary 4: 편향 평가 도구 (사용 예시 포함)
  6. Supplementary 5: 저자 기여 선언 (CRediT)
  7. 프로토콜 수정 기록지 (향후 수정 이력용)

2.6.2 등록 산출물

  1. PROSPERO 등록 번호 (CRD42025XXXXXX)
  2. PROSPERO 레코드 공개 URL
  3. (선택) OSF 프로젝트 URL (보조 자료 저장)

2.6.3 팀 합의 산출물

  1. 팀 역할 분담 문서 (메인/보조/슈퍼바이저)
  2. 커뮤니케이션 계획 (주간 미팅, 진행 보고 주기)
  3. 일정 계획 (단계별 마일스톤)

2.7 Part 2 종료 체크포인트

✔ 체크포인트: 자기 평가 체크리스트

프로토콜 완성도

☐ PRISMA-P 2015의 27개 항목 모두 작성됨.

☐ 배경 섹션이 “왜 이 SR이 필요한가”를 명확히 논증.

☐ 포함/배제 기준이 표 형태로 명확히 제시됨.

☐ 최소 1개 DB의 완전한 검색 전략이 포함됨.

☐ Primary/secondary/exploratory outcomes가 명확히 구분됨.

☐ 연구 설계에 맞는 편향 평가 도구가 선택됨.

☐ 합성 방법(SWiM)이 구체적으로 기술됨.

☐ 하위그룹 분석, 민감도 분석이 사전에 선언됨.

☐ GRADE 또는 대체 도구 사용 계획 기술됨.

PROSPERO 등록

☐ PROSPERO 계정이 생성되고 이메일 인증 완료됨.

☐ 등록 양식 40개 항목 중 필수 22개 모두 작성됨.

☐ 제출 후 심사 결과를 받음 (Approved / Revisions / Rejected).

☐ 등록 번호(CRD42025XXXXXX)를 받음.

☐ 공개 URL에서 레코드가 확인됨.

팀 합의

☐ 모든 공동 저자가 프로토콜을 읽고 동의함.

☐ 저자 기여(CRediT)가 명시되고 동의됨.

☐ 주간 미팅 일정과 진행 보고 방식이 정해짐.

☐ 슈퍼바이저가 프로토콜 전체에 서명/동의함.

Part 2 주요 참고문헌

Booth, A., Clarke, M., Dooley, G., et al. (2012). The nuts and bolts of PROSPERO: an international prospective register of systematic reviews. Systematic Reviews, 1, 2.

Campbell, M., McKenzie, J. E., Sowden, A., et al. (2020). Synthesis without meta-analysis (SWiM) in systematic reviews: reporting guideline. BMJ, 368, l6890.

Chang, S. M., & Slusky, J. (2012). Debunking myths of protocol registration. Systematic Reviews, 1, 4.

GRADE Working Group. (2024). GRADE handbook. https://gdt.gradepro.org/

Hartling, L., Milne, A., Hamm, M. P., et al. (2013). Testing the Newcastle Ottawa Scale showed low reliability between individual reviewers. Journal of Clinical Epidemiology, 66(9), 982–993.

Moher, D., Shamseer, L., Clarke, M., et al. (2015). Preferred reporting items for systematic review and meta-analysis protocols (PRISMA-P) 2015 statement. Systematic Reviews, 4, 1.

Page, M. J., Shamseer, L., & Tricco, A. C. (2018). Registration of systematic reviews in PROSPERO: 30,000 records and counting. Systematic Reviews, 7, 32.

Schiavo, J. H. (2019). PROSPERO: an international register of systematic review protocols. Medical Reference Services Quarterly, 38(2), 171–180.

Shamseer, L., Moher, D., Clarke, M., et al. (2015). Preferred reporting items for systematic review and meta-analysis protocols (PRISMA-P) 2015: elaboration and explanation. BMJ, 350, g7647.

Sideri, S., Papageorgiou, S. N., & Eliades, T. (2018). Registration in the International Prospective Register of Systematic Reviews (PROSPERO) of systematic review protocols was associated with increased review quality. Journal of Clinical Epidemiology, 100, 103–110.

Sterne, J. A., Hernán, M. A., Reeves, B. C., et al. (2016). ROBINS-I: a tool for assessing risk of bias in non-randomised studies of interventions. BMJ, 355, i4919.

Tricco, A. C., Pham, B., Brehaut, J., et al. (2009). An international survey indicated that unpublished systematic reviews exist. Journal of Clinical Epidemiology, 62(6), 617–623.