Part 1. 답할 수 있는 질문 만들기

Part 0에서 당신이 수행하려는 것이 SR임을 확인했고, 팀과 경로도 정했다. 이제 본격적인 첫 단계다. SR 전체의 품질을 결정하는 가장 중요한 단계이며, 또한 가장 시간을 많이 투자해야 하는 단계다. 경험 많은 SR 저자들은 종종 “전체 작업 시간의 20–30%를 질문 개발에 쓴다”고 말한다. 반면 신입 대학원생들은 이 단계에 하루 이틀 투자하고 바로 검색으로 넘어간다. 이 차이가 6개월 뒤의 품질 차이를 만든다.

이 파트가 끝나면 당신은 다음을 갖게 된다:

  1. PICOS 프레임워크로 명시된 구체적 연구 질문
  2. 선행 SR 존재 확인 결과와 “우리 SR이 왜 필요한가”의 정당화
  3. 연구 질문의 범위가 현실적임을 보여주는 예비 scoping 검색 결과
  4. 슈퍼바이저의 승인을 받은 최종 연구 질문

 

1.1 좋은 연구 질문의 조건

좋은 SR 질문은 단순히 “흥미로운” 질문이 아니다. 좋은 질문은 다음 여섯 가지 조건을 만족한다.

1.1.1 FINER 기준 + 2가지 추가 기준

임상 연구 질문 평가의 고전적 기준은 FINER (Hulley et al., 2013)이다. SR에는 여기에 2가지를 추가해야 한다.

기준 의미 SR 맥락에서의 해석
F — Feasible 실행 가능한가? 충분한 수의 연구가 존재하는가? 접근 가능한 DB에서 검색 가능한가? 팀의 자원(시간, 인력, 언어 능력)으로 감당 가능한가?
I — Interesting 흥미로운가? 당신과 슈퍼바이저에게만이 아니라, 해당 분야 독자에게도 의미 있는 질문인가?
N — Novel 새로운가? 동일 질문의 최근 SR이 존재하지 않는가? 존재한다면 당신이 무엇을 추가할 수 있는가 (새 근거, 다른 집단, 다른 결과)?
E — Ethical 윤리적인가? SR에서는 대체로 문제가 되지 않지만, 취약 집단(아동, 자살 시도자) 연구 포함 시 고려.
R — Relevant 의의가 있는가? 답이 임상 실무, 정책, 향후 연구에 영향을 미칠 수 있는가?
+ Answerable 답할 수 있는가? 현재 존재하는 연구로 실제 답이 도출 가능한가? (너무 새로운 주제이면 NULL 결과만 나올 수 있음)
+ Specific 구체적인가? PICOS의 각 요소가 명확히 정의되는가? 범위가 너무 넓지도 좁지도 않은가?

1.1.2 “너무 넓지도 좁지도 않게” — 골디락스 원칙

Harris et al. (2013)이 강조한 핵심 원칙이다. 질문이 너무 넓으면 수천 편이 걸려 감당할 수 없고 결과도 너무 이질적이어서 의미 있는 합성이 불가능하다. 너무 좁으면 포함 연구가 2–3편만 남아 SR이 성립하지 않는다.

📌 예시: 범위 조정의 실제

❌ 너무 넓은 질문: 조현병 환자의 인지 기능은 어떠한가?

    → 문제: “조현병” 범주가 너무 넓음. “인지 기능”도 영역이 너무 많음. 결과 측정이 제각각. 연구 수 수천 편.

❌ 너무 좁은 질문: SIPS 기준 CHR 한국인 대학생에서 3-back 과제의 정확도는 어떠한가?

    → 문제: 한국인 + 대학생 + 3-back 과제 + 정확도로 한정하면 해당 연구 0–2편.

✓ 적절한 질문: SIPS/SOPS 또는 CAARMS로 정의된 CHR 성인(16–35세)에서 건강대조군과 비교했을 때 작업기억 과제 수행의 손상 크기(effect size)와 측정 도구별 양상은?

    → 이유: 모집단(SIPS/CAARMS CHR), 비교군(건강대조군), 결과(작업기억 수행)가 구체적이면서, 측정 도구와 지역은 열어둠. 예상 포함 연구 수 30–80편으로 적절.

1.1.3 “답할 수 있는”의 진정한 의미

“Answerable”은 단순히 “데이터가 있다”는 뜻이 아니다. 다음 세 가지를 모두 요구한다:

  • 충분한 근거의 존재: 최소 10편 이상의 관련 원저연구가 존재한다 (작은 SR의 하한선). 10편 미만이면 scoping review 또는 연구 부족에 대한 논평(commentary)이 더 적절.
  • 측정 가능한 결과: 결과 변수가 명확히 조작적으로 정의되어 있으며, 대부분의 연구에서 비교 가능한 형태로 보고된다.
  • 해석 가능한 합성: 포함될 연구들의 이질성이 너무 크지 않아, 통합된 결론을 도출할 수 있다. (너무 다양한 측정 도구, 너무 다른 집단 → 합성 불가)
⚠ 흔한 실수: “흥미로운 가설”에서 출발하는 오류

대학원생이 자주 저지르는 패턴: “CHR에서 사회인지 결손이 후기 transition을 예측할 것이다”라는 가설이 흥미롭다고 판단하고, 이를 뒷받침하는 SR을 설계하려 한다.

문제: SR은 가설 검증 연구가 아니다. SR은 “현재 근거가 무엇을 말하는가”를 기술하는 연구다. 당신의 가설이 틀렸다는 결과가 나와도 그것이 정답이다.

따라서 질문은 “A가 B를 예측하는가?”의 형태로 중립적으로 쓰라. “A가 B를 예측한다는 근거가 있는가?”가 아니다. 전자는 증거 중립적이고, 후자는 편향된 프레임이다.

1.2 연구 질문 프레임워크 — PICO를 넘어서

가장 잘 알려진 프레임워크는 PICO다. 그러나 모든 SR 질문이 PICO에 맞는 것은 아니다. 연구 유형에 따라 다른 프레임워크가 적합하다. 잘못된 프레임워크 선택은 포함 기준과 검색 전략 전체를 잘못 설계하게 만든다.

1.2.1 프레임워크 선택 매트릭스

프레임워크 구성 요소 적용 대상
PICO Population / Intervention / Comparison / Outcome 중재 효과 SR (RCT 기반). 가장 표준적. 예: “CHR에서 omega-3 vs 위약의 transition 감소 효과”
PICOS PICO + Study design 연구 설계를 명시적으로 제한할 때 (예: RCT만 포함). PRISMA와 PROSPERO에서 권장.
PICOT PICO + Time frame 추적 기간이 중요한 예후/장기 효과 연구. 예: “CHR에서 2년 추적 후 transition”
PECO Population / Exposure / Comparison / Outcome 위험 요인, 병인, 환경적 노출 연구 (관찰연구). 예: “CHR에서 대마초 사용 vs 비사용의 transition 위험”
PEO Population / Exposure / Outcome 비교군이 불필요한 유병률/발생률 연구. 예: “FEP 환자의 자살 시도 유병률”
PIRD Population / Index test / Reference test / Diagnosis 진단정확도 SR. 예: “조현병 진단에서 PANSS vs SCID의 일치도”
PFO Population / Prognostic Factor / Outcome 예후 인자 SR. 예: “CHR에서 음성 증상이 transition의 예후 인자인가”
SPIDER Sample / Phenomenon of Interest / Design / Evaluation / Research type 질적 연구 또는 혼합연구. 예: “CHR 환자의 진단 경험에 대한 질적 연구”
CoCoPop Condition / Context / Population 유병률 연구의 JBI 권장 프레임워크. PEO의 변형.

 

💡 팁: 프레임워크 선택 가이드

다음 순서로 결정하라:

•       ① 당신의 질문이 “X가 Y에 어떤 영향을 미치는가?”의 형태인가? → PICO/PICOS (중재) 또는 PECO (노출)

•       ② 당신의 질문이 “X의 빈도/유병률은 어떠한가?”의 형태인가? → PEO 또는 CoCoPop

•       ③ 당신의 질문이 “X가 Y를 얼마나 정확히 식별하는가?”의 형태인가? → PIRD

•       ④ 당신의 질문이 “X를 가진 사람의 미래 Y를 예측하는 인자는?”의 형태인가? → PFO

•       ⑤ 당신의 질문이 “사람들이 X를 어떻게 경험/인식하는가?”의 형태인가? → SPIDER

결정이 어렵다면 슈퍼바이저와 논의하라. 프레임워크 선택은 이후 모든 것을 결정한다.

1.2.2 PICOS 각 요소의 구체적 작성법

본 튜토리얼의 예시 SR은 관찰연구 기반이지만, 설명의 편의를 위해 PICOS 프레임워크를 사용한다. 각 요소를 어떻게 구체적으로 작성하는지 단계별로 본다.

P (Population/Participants) — 누구를 대상으로 하는가?

단순히 “조현병 환자”가 아니라 다음을 명시해야 한다:

  • 진단 기준: DSM-5? DSM-IV? ICD-10? ICD-11?
  • 진단 도구: SCID? MINI? 임상적 진단? 자가 보고?
  • 하위 집단: 초발 정신증(FEP)? 만성? 약물 저항성(TRS)? CHR?
  • 연령 범위: 16–35세? 성인만? 청소년 포함?
  • 성별: 제한 없음? 특정 성별만?
  • 동반 이환: 제외 조건(예: 약물 남용, 지적장애, 신경학적 질환)?
  • 약물 상태: drug-naive? 약물 복용 중? 특정 약물 사용자 제외?
  • 지역/문화: 제한 없음? 특정 지역? 언어?
  • 설정: 외래? 입원? 지역사회? 연구 모집?
⚡ 주의: 정신증 스펙트럼의 진단 이질성 — 결정적 쟁점

정신증 관련 SR에서 가장 흔한 방법론적 문제다. 다음을 사전에 결정하지 않으면 스크리닝 단계에서 혼란이 발생한다:

•       조현병만 포함? 또는 “조현병 스펙트럼”(schizoaffective, schizophreniform 포함)?

•       초발 정신증(FEP)이라면: ‘first episode psychosis’, ‘first episode schizophrenia’, ‘early psychosis’의 정의 차이를 어떻게 처리할 것인가?

•       CHR이라면: SIPS, CAARMS, BSIP, SPI-A 중 어느 기준을 허용할 것인가? 여러 기준을 섞어도 되는가?

•       “UHR”(ultra-high risk)과 “CHR”(clinical high risk)은 동의어인가? “ARMS”(at-risk mental state)는? 시대/지역별 용어 변천을 어떻게 처리할 것인가?

권장: 가장 포괄적 기준으로 포함하되, 사전 등록된 하위그룹 분석으로 각 기준별로 결과를 재검토한다.

I (Intervention) 또는 E (Exposure) — 무엇을 연구하는가?

중재 SR의 경우 다음을 명시한다:

  • 구체적 중재: 약물명, 용량, 기간? 심리치료의 유형(CBT-p, family intervention)?
  • 전달 방식: 개별? 집단? 온라인? 대면?
  • 기간/강도: 최소 기간? 회기 수?
  • 제공자: 자격(정신과의사? 임상심리사? 간호사?)?

노출 SR(PECO)의 경우:

  • 노출의 조작적 정의: 대마초 사용 “있음/없음”? 빈도? 기간? 시작 연령?
  • 노출 측정 방법: 자가 보고? 소변 검사? 임상 면담?
  • 노출 시점: 현재? 평생? 최근 1년?

관찰연구 기반 SR(예후, 병인)에서는 Exposure 대신 Prognostic Factor 또는 Variable of Interest를 사용한다.

C (Comparison/Comparator) — 무엇과 비교하는가?

비교군 설정은 종종 가장 어려운 결정이다.

  • Active comparator: 다른 치료와 비교 (예: CBT-p vs TAU, olanzapine vs risperidone)
  • Placebo/Sham: 위약 또는 sham 치료
  • Treatment as Usual (TAU): 통상 치료 (단, TAU의 내용은 국가/기관마다 다름에 유의)
  • Waiting list / No treatment: 심리치료 연구에서 흔히 사용
  • Healthy controls (HC): 관찰연구에서 환자군 vs 건강대조군 비교
  • 비교군 없음: 유병률 연구 등에서는 비교군이 없을 수 있음 (이 경우 PEO 사용)
⚠ 흔한 실수: 비교군 정의의 모호함

“control group”이라고만 쓰면 안 된다. TAU의 정의는 연구마다 천차만별이다. 어떤 연구의 TAU는 주 1회 외래 방문이고, 다른 연구의 TAU는 월 1회 전화 상담이다.

해결: (i) 포함 기준에서 비교군 유형을 명시적으로 나열한다. (ii) 데이터 추출 시 각 연구의 TAU/control 내용을 구체적으로 추출한다. (iii) 합성 단계에서 비교군 유형별로 하위그룹을 구분한다.

O (Outcome) — 무엇을 측정하는가?

Outcome은 SR의 심장이다. 여기가 모호하면 이후 모든 단계가 흔들린다.

먼저 결과를 계층적으로 구분하라:

  • Primary outcome (1차 결과): 1–2개. SR의 주된 결론이 달려 있는 결과. 사전에 명시적으로 선언.
  • Secondary outcomes (2차 결과): 3–5개 내외. 보조적으로 보고할 결과.
  • Exploratory outcomes (탐색적 결과): 사후에 추가된 결과. 결과 해석에 보조적으로 사용하되, 결론은 여기서 도출하지 않음.

각 outcome에 대해 다음을 정의하라:

  • 조작적 정의: 정확히 무엇을 측정하는가?
  • 측정 도구: 허용할 도구의 목록 (예: PANSS, BPRS, SOPS)
  • 측정 시점: baseline? endpoint? 특정 추적 기간?
  • 결과 형식: 연속변수? 이분변수? 사건-시간(time-to-event)?
  • 단위: effect size, 평균 차이, 비율, hazard ratio?
💡 팁: Core Outcome Set 활용

여러 질환에 대해 COMET initiative (comet-initiative.org)가 권장하는 Core Outcome Set(COS)이 정의되어 있다. 정신증 분야에서도 schizophrenia, psychosis에 대한 COS가 개발되어 있다.

가능하면 COS의 결과 변수를 primary outcome으로 선택하라. 이는 (i) 학계 합의를 반영하고, (ii) 다른 연구와 비교 가능성을 높이며, (iii) 리뷰어에게 정당성을 설득하기 쉽다.

정신증 관련 COS 예시: Keeley et al. (2016)의 schizophrenia COS, PsychoCORE initiative.

S (Study design) — 어떤 연구 설계를 포함할 것인가?

연구 설계 제한은 질문의 성격에 따라 결정된다.

질문 유형 권장 연구 설계
중재 효능(efficacy) RCT (1차 선택), 준실험 연구 (RCT 부족 시 보완)
중재 효과(effectiveness)/안전성 RCT + 관찰연구 (실제 임상 환경 반영)
유병률/발생률 단면연구, 코호트
예후/자연사 전향적 코호트 > 후향적 코호트 > 사례-대조
병인/위험 요인 코호트, 사례-대조, 단면연구
진단정확도 단면 진단 비교 연구
환자 경험/인식 질적 연구 (현상학, 주제 분석 등)
증상 프로파일/특성 단면 비교 연구 (환자군 vs 대조군)

배제할 설계도 명시하라:

  • 사례 보고(case report), 사례 시리즈(case series, 보통 n < 10): 정량적 합성 부적합
  • 종설(review), 사설(editorial), 의견(opinion): 원저연구가 아님
  • 회의 초록(conference abstract): 동료심사 부족, 선택적 포함 고려
  • 동물 연구, in vitro 연구: 인간 대상 SR이면 배제
  • 프로토콜 논문: 결과가 없음

1.3 예시 SR — PICOS 작성 실제

본 튜토리얼 전체를 관통하는 예시 SR의 PICOS를 단계별로 완성해 보자.

📌 예시: 예시 SR의 PICOS — 최종 버전

연구 질문 (문장형):

SIPS/SOPS 또는 CAARMS 기준으로 정의된 정신증 임상적 고위험군(CHR) 성인(16–35세)에서, 건강대조군과 비교할 때, 표준화된 신경인지 평가에서 어떤 인지 영역에 유의한 수행 저하가 나타나며, 효과 크기는 영역별·측정 도구별로 어떻게 다른가?

 

P (Population):

•       진단: SIPS/SOPS (attenuated positive symptoms, BLIPS, genetic risk and deterioration) 또는 CAARMS 기준을 만족하는 CHR

•       연령: 16–35세

•       배제: DSM-5 기준 정신증 이미 발병한 자, 지적장애(IQ<70), 뇌질환·두부외상 과거력, 현재 심각한 물질 사용장애

•       약물 상태: 항정신병약 복용 여부 제한 없음 (하위그룹 분석에서 구분)

•       지역/언어: 제한 없음

 

I/E (Exposure — 관찰연구이므로 노출로 해석):

•       CHR 상태 자체가 “노출” (CHR vs 건강대조군의 비교)

 

C (Comparator):

•       건강대조군(HC): 정신증 과거력·가족력 없음 (1차 친족)

•       연령·성별·교육 수준 매칭이 이상적이지만 필수는 아님 (하위그룹 분석에서 다룸)

 

O (Outcomes):

  • Primary: MATRICS Consensus Cognitive Battery(MCCB)의 7개 영역(처리속도, 주의/경계, 작업기억, 언어학습, 시각학습, 추론·문제해결, 사회인지) 수행의 CHR vs HC 효과 크기(Cohen’s d 또는 Hedges’ g)

  • Secondary: MCCB 외 도구(BACS, CANTAB, 개별 과제)로 측정된 동일 영역의 효과 크기, 측정 도구 간 일치도

  • Exploratory: 추적 연구에서 transition 이행 전후 인지 변화, 약물 상태에 따른 차이

 

S (Study design):

•       포함: 단면 비교 연구, 종단 코호트의 baseline 비교 데이터

•       배제: 사례 보고·시리즈(n<10), 종설, 사설, 방법론 논문, 동물 연구, 프로토콜 논문

•       언어: 영어 또는 한국어 (연구팀 처리 가능 범위)

•       출판 기간: 2000년 이후 (SIPS/CAARMS 표준화 이후)

1.4 질문 개발의 실제 프로세스

지금까지는 “완성된” 질문을 제시했지만, 실제로 이 질문에 도달하기까지 여러 차례의 수정이 필요하다. 실전 프로세스를 단계별로 본다.

1.4.1 1단계: 초기 아이디어 (말로 표현)

슈퍼바이저에게 말로 할 수 있는 한 문장짜리 관심사에서 출발한다.

“CHR 환자들 인지기능이 어떤지 보고 싶어요.”

이 시점에서는 아무것도 구체적이지 않다. 다음 단계로 넘어간다.

1.4.2 2단계: 예비 scoping 검색 (2–5일)

본격 SR을 시작하기 전에 예비 검색을 수행한다. 목적은 “이 주제에 SR이 가능한가”를 판단하는 것이다.

수행 방법:

  1. PubMed에서 단순 키워드로 검색 (예: “clinical high risk psychosis cognition”)
  2. 상위 20–30편의 초록을 빠르게 훑는다
  3. 핵심 리뷰 논문 2–3편을 찾아 읽는다
  4. PROSPERO에서 기존 등록된 SR을 검색한다
  5. Cochrane Library에서 기존 Cochrane 리뷰를 확인한다
  6. Epistemonikos(epistemonikos.org)에서 기존 SR을 확인한다

이 단계에서 확인할 것:

  • 관련 연구가 대략 몇 편 있는가? (10편? 100편? 1000편?)
  • 주로 어떤 연구 설계가 사용되는가?
  • 주요 측정 도구는 무엇인가?
  • 이 분야의 핵심 저자와 연구 그룹은?
  • 최근의 SR이 존재하는가?
  • 기존 SR과 차별화할 여지가 있는가?
⚡ 주의: 예비 검색 ≠ 본 검색

예비 scoping 검색은 본 검색과 엄격히 구별되어야 한다. 예비 검색은 질문 개발을 위한 정찰이며, 공식 SR 기록에 포함되지 않는다.

그러나 주의: 예비 검색에서 본 검색으로 넘어갈 때 편향이 생길 수 있다. 예비 검색에서 본 “유리한” 결과에 끌려 질문을 좁히거나 넓히지 마라. 예비 검색의 유일한 목적은 실행 가능성과 범위 판단이다.

1.4.3 3단계: PICOS 초안 작성

예비 검색 결과를 바탕으로 PICOS를 처음 써본다. 이 초안은 완벽할 필요 없다. 부족한 부분이 드러날 것이다.

P: CHR I/E: (CHR 자체) C: 건강대조군 O: 인지 수행 S: 비교 연구

이 초안에서 다음을 스스로 물어라:

  • “CHR”이 무엇인지 구체적으로 정의되어 있는가? → No
  • “인지 수행”이 구체적인가? → No, 영역도구가 불명확
  • “건강대조군”의 기준은? → 매칭 여부 불명확

1.4.4 4단계: 1차 수정 (슈퍼바이저 검토)

초안을 슈퍼바이저에게 보여주고 피드백을 받는다. 슈퍼바이저가 검토할 때 자주 지적하는 것들:

  • “이 진단 기준으로 좁히면 몇 편이 남는가? 예비 검색에서 확인했는가?”
  • “이 질문은 이미 기존 SR이 있지 않은가? 차별점이 무엇인가?”
  • “결과 측정 도구가 너무 다양하면 합성이 가능한가?”
  • “연령 범위를 왜 16–35세로 잡았나? 근거는?”
  • “약물 상태를 어떻게 처리할 것인가?”

1.4.5 5단계: 2차 예비 검색 — 범위 확인

수정된 PICOS로 다시 예비 검색을 수행해 실행 가능성을 구체적으로 확인한다.

📌 예시: 예상 포함 연구 수 추정

PubMed에서 다음 검색식을 시험해 본다:

(“clinical high risk” OR “ultra high risk” OR “at-risk mental state”) AND (cognition OR neurocognition OR “working memory” OR attention)

결과: 약 800편. 이 중 관련 연구는 대략 20–30% → 160–240편. 최종 포함 30–80편 예상.

판단: 실행 가능하다. 단 스크리닝에 상당한 시간이 소요될 것이므로 보조 연구자가 필수.

1.4.6 6단계: 최종 PICOS + 문장형 질문

PICOS를 최종 확정하고, 이를 한 문장의 명확한 연구 질문으로 변환한다.

문장형 질문은 PROSPERO 등록서와 논문 초록에 사용된다. 다음 조건을 만족해야 한다:

  • 한 문장 (50–80단어 수준)
  • P, I/E, C, O가 모두 포함됨
  • 중립적 어조 (가설 주도가 아님)
  • 전문용어는 정확히 사용하되 과도하지 않게

예시 SR의 문장형 질문:

SIPS/SOPS 또는 CAARMS 기준으로 정의된 정신증 임상적 고위험군(CHR) 성인(16–35세)에서, 건강대조군과 비교할 때, 표준화된 신경인지 평가(MCCB 우선, 기타 도구 포함)에서 어떤 인지 영역에 유의한 수행 저하가 나타나며, 효과 크기는 영역별·측정 도구별로 어떻게 다른가?

1.5 선행 SR 확인 — 필수 단계

PRISMA 2020과 PROSPERO 모두 선행 SR 확인을 요구한다. 동일한 질문의 최근 SR이 이미 존재한다면 새 SR은 자원 낭비이며, 두 가지 선택지가 있다: (i) 기존 SR의 업데이트, 또는 (ii) 명확히 차별화된 새 질문 수립.

1.5.1 어디를 검색할 것인가

최소 다음 5곳을 검색한다:

데이터베이스/저장소 URL 내용
PROSPERO crd.york.ac.uk/PROSPERO/ 진행 중·완료된 SR 프로토콜. 출판 전 SR도 확인 가능.
Cochrane Database of Systematic Reviews cochranelibrary.com Cochrane SR(최고 품질 표준). 분야별 검색.
Epistemonikos epistemonikos.org 전 세계 SR 메타검색 엔진. Cochrane, PubMed, Embase 통합.
PubMed (SR filter) pubmed.ncbi.nlm.nih.gov Filter: “Systematic Review” 선택. 최근 5–10년 제한.
Joanna Briggs Institute (JBI) jbi.global 간호·보건 분야 SR 저장소.

1.5.2 선행 SR 발견 시 대응

선행 SR이 발견되면 다음을 체계적으로 평가한다:

  1. 출판 연도: 최근 2–3년 이내인가?
  2. 방법론적 질: AMSTAR-2로 대략 평가
  3. PICOS 일치도: 당신의 질문과 얼마나 겹치는가?
  4. 포함 연구 수와 최신 근거: 최근 출판된 중요 연구를 포함했는가?
  5. 한계: 저자가 명시한 한계가 당신의 새 SR로 해결 가능한가?
💡 팁: 기존 SR과의 차별화 전략

기존 SR이 있어도 다음 방식으로 새로운 SR을 정당화할 수 있다:

•       Update (업데이트): 최근 3년 이상 지났고 새 연구가 다수 출판됨

•       Different population (다른 집단): 기존이 RCT만, 당신은 관찰연구 포함

•       Different outcomes (다른 결과): 기존이 transition만, 당신은 인지 영역별 분석

•       Different methodology (다른 방법론): 기존이 narrative synthesis, 당신은 structured SWiM

•       Different scope (다른 범위): 기존이 특정 측정 도구만, 당신은 도구 간 비교 포함

•       Language expansion (언어 확장): 기존이 영어만, 당신은 한국어 포함

중요: PROSPERO 등록서와 프로토콜에 이 차별점을 명시적으로 기술해야 한다.

 

⚠ 흔한 실수: “차별점”의 자기기만

기존 SR이 있음에도 자기 SR을 정당화하기 위해 억지 차별점을 만드는 경우가 많다. 예: “기존 SR은 2019년에 출판되었고 우리는 2024년에 하므로 업데이트다.” 그러나 2019년 이후 새 연구가 5편 미만이면 실질적 업데이트가 아니다.

자문: (i) 기존 SR의 결론이 내 연구로 실질적으로 바뀔 가능성이 있는가? (ii) 내 연구가 없다면 임상가가 여전히 기존 SR로 충분한가? 답이 “기존 SR로 충분”이면 새 SR은 자원 낭비다.

대안: 기존 SR의 한계에 대한 methodological commentary, 또는 다른 주제로 전환.

1.6 이 단계의 산출물

Part 1을 마치면 다음 문서가 완성되어야 한다. Part 2(프로토콜 작성)의 직접적 입력으로 사용된다.

1.6.1 산출물 1: 연구 질문 워크시트

다음 항목을 모두 포함한 1–2쪽 문서.

항목 내용
연구 제목 (초안) 50자 이내. PICOS의 핵심 요소 반영.
문장형 연구 질문 한 문장, 50–80단어 수준. PICOS 요소 모두 포함.
P (Population) 진단 기준, 연령, 배제 조건, 약물 상태, 지역, 설정 명시
I/E (Intervention/Exposure) 구체적 정의, 강도, 기간, 전달 방식
C (Comparator) 비교군 유형 열거. 매칭 요구 여부.
O (Outcomes) Primary (1–2개) + Secondary (3–5개) + Exploratory. 측정 도구, 시점, 형식.
S (Study design) 포함/배제할 설계, 출판 기간, 언어.
FINER 평가 각 기준별 짧은 자기평가 (한 문장씩).
선행 SR 확인 결과 검색한 DB 5곳, 발견된 유사 SR 목록, 차별점 기술.
예비 검색 요약 사용한 검색식, 예상 연구 수, 실행 가능성 판단.
슈퍼바이저 승인 슈퍼바이저 서명 + 날짜.

1.6.2 산출물 2: 선행 SR 검색 기록

Excel 또는 표 형식으로 다음을 기록:

  • 검색 날짜, DB, 사용한 키워드
  • 발견된 관련 SR의 서지 정보 (저자, 연도, 제목, 저널)
  • 각 SR의 간단한 AMSTAR-2 평가 (선택적)
  • 각 SR 대비 당신 SR의 차별점 한 문장

1.7 Part 1 종료 체크포인트

✔ 체크포인트: 자기 평가 체크리스트

질문의 질

☐ PICOS(또는 적절한 프레임워크)의 각 요소를 구체적으로 작성했다.

☐ FINER 기준을 모두 충족한다.

☐ 질문이 한 문장으로 명확히 서술 가능하다.

☐ Primary outcome이 1–2개로 제한되어 있다.

☐ 질문이 가설 주도가 아니라 중립적 어조다.

☐ 예상 포함 연구 수가 10–100편 범위에 있다.

방법론적 적합성

☐ 질문 유형에 맞는 프레임워크(PICO/PECO/PIRD 등)를 선택했다.

☐ 질문 유형에 맞는 연구 설계를 포함·배제 기준으로 정했다.

☐ 진단 이질성(특히 정신증 스펙트럼)에 대한 처리 방침을 결정했다.

☐ 결과 측정 도구의 다양성에 대한 처리 방침을 결정했다.

선행 SR 확인

☐ PROSPERO, Cochrane, Epistemonikos, PubMed, JBI를 모두 검색했다.

☐ 유사 SR이 발견되었다면 차별점이 실질적이고 정당하다.

☐ 차별점이 프로토콜에 기술 가능한 수준으로 명확하다.

승인

☐ 슈퍼바이저가 PICOS와 문장형 질문을 승인했다.

☐ 보조 연구자(들)가 질문을 이해하고 동의했다.

 

⚡ 주의: 체크포인트의 엄격한 운영

Part 1의 체크포인트는 형식적으로 통과시키지 마라. 여기서 애매하게 넘어간 것이 Part 3(검색), Part 4(스크리닝), Part 7(합성)에서 반복적으로 발목을 잡는다.

슈퍼바이저는 최소 한 번의 대면 또는 화상 미팅에서 PICOS를 직접 검토하고 서명해야 한다. 이메일 승인은 권장되지 않는다 — 대면 미팅에서 미처 생각하지 못한 허점이 드러나는 경우가 많다.

1.8 다음 파트 예고

Part 2에서는 완성된 연구 질문을 바탕으로 공식 프로토콜을 작성하고 PROSPERO에 등록한다. 구체적으로:

  • PRISMA-P 2015 체크리스트 27개 항목의 작성 가이드
  • PROSPERO 등록 실제 과정 (계정 생성, 양식 작성, 심사 대응)
  • 포함/배제 기준의 구체화
  • 사전 선언해야 하는 하위그룹 분석과 민감도 분석
  • 프로토콜 amendment 관리 (PRISMA 2020 항목 24c)
  • PROSPERO 거절 사유와 재제출 전략

Part 1에서 만든 PICOS가 Part 2 프로토콜의 핵심 입력이 된다. 따라서 Part 1의 체크포인트를 완전히 통과한 뒤에 Part 2로 넘어가라.

 

Part 1 주요 참고문헌

Cooke, A., Smith, D., & Booth, A. (2012). Beyond PICO: the SPIDER tool for qualitative evidence synthesis. Qualitative Health Research, 22(10), 1435–1443.

Eriksen, M. B., & Frandsen, T. F. (2018). The impact of patient, intervention, comparison, outcome (PICO) as a search strategy tool on literature search quality: a systematic review. Journal of the Medical Library Association, 106(4), 420–431.

Fusar-Poli, P., Salazar de Pablo, G., Correll, C. U., et al. (2020). Prevention of psychosis: advances in detection, prognosis, and intervention. JAMA Psychiatry, 77(7), 755–765.

Harris, J. D., Quatman, C. E., Manring, M. M., Siston, R. A., & Flanigan, D. C. (2013). How to write a systematic review. American Journal of Sports Medicine, 42(11), 2761–2768.

Higgins, J. P. T., Thomas, J., Chandler, J., et al. (Eds.) (2023). Cochrane Handbook for Systematic Reviews of Interventions, version 6.4. Chapter 2: Determining the scope of the review and the questions it will address.

Hulley, S. B., Cummings, S. R., Browner, W. S., Grady, D. G., & Newman, T. B. (2013). Designing Clinical Research (4th ed.). Lippincott Williams & Wilkins. [FINER criteria]

Keeley, J. W., Reed, G. M., Roberts, M. C., et al. (2016). Developing a science of clinical utility in diagnostic classification systems. American Psychologist, 71(1), 3–16.

McGlashan, T. H., Walsh, B. C., & Woods, S. W. (2010). The psychosis-risk syndrome: Handbook for diagnosis and follow-up. Oxford University Press. [SIPS/SOPS]

Moons, P., Goossens, E., & Thompson, D. R. (2021). Rapid reviews: the pros and cons of an accelerated review process. European Journal of Cardiovascular Nursing, 20(5), 515–519.

Munn, Z., Stern, C., Aromataris, E., Lockwood, C., & Jordan, Z. (2018). What kind of systematic review should I conduct? A proposed typology and guidance for systematic reviewers in the medical and health sciences. BMC Medical Research Methodology, 18, 5.

Richardson, W. S., Wilson, M. C., Nishikawa, J., & Hayward, R. S. (1995). The well-built clinical question: a key to evidence-based decisions. ACP Journal Club, 123(3), A12–A13. [원조 PICO]

Yung, A. R., Yuen, H. P., McGorry, P. D., et al. (2005). Mapping the onset of psychosis: the Comprehensive Assessment of At-Risk Mental States. Australian and New Zealand Journal of Psychiatry, 39(11–12), 964–971. [CAARMS]