에 의해

네이선 아우영

—

2026. 5. 27.

눈덩이 표집: 정의, 과정 및 주요 사례

네이선 아우영

시니어 회계사 at EY

회계학 학사 학위를 취득하고, 회계학 석사 과정을 완료했습니다.

링크드인

눈덩이 표집(Snowball sampling)은 연쇄 반응처럼 추천을 통해 연구 참여자를 찾아내는 방법입니다. 공식적인 명단이 존재하지 않는 미등록 이주민이나 희귀 질환 환자 등 숨겨진 집단을 연구할 때 매우 실용적이고 종종 필수적인 방법입니다.

이 가이드에서는 눈덩이 표집의 작동 원리와 다양한 유형, 그리고 이를 활용하기 위한 명확한 단계를 설명합니다. 또한, 이 방법 복합적인 강점과 중요한 한계점, 그리고 연구자가 연구 결과의 신뢰성을 확보하기 위해 반드시 다루어야 할 필수적인 윤리적 문제도 함께 다룹니다.

눈덩이 표집이란 무엇이며 왜 사용되는가

눈덩이 표집은 현재 참여자에게 자신의 지인 중에서 다음 참여자를 찾아달라고 요청하는 방식으로 작동합니다. 일종의 연쇄 반응입니다. 일반적인 연구 방식으로는 사실상 보이지 않는 일부 집단을 연구할 때 이 방법은 필수적입니다.

표집할 원본 명단이 존재하지 않는 경우가 많기 때문입니다. 미등록 노동자, 폐쇄적인 커뮤니티의 일원, 혹은 매우 좁은 분야의 전문가를 연구할 때가 바로 그렇습니다.

눈덩이 표집의 정의 및 방법론에서 설명하듯이, 기존 학술 연구 데이터 수집 방법으로 모집단에 접근할 수 없을 때 이 방법이 실용적인 대안이 됩니다.

여러분은 "씨앗(seeds)"이라고 불리는 몇 명의 초기 접촉자로 시작합니다. 이들이 다른 사람을 추천하고, 추천된 사람들이 또 다른 사람들을 추천합니다. 언덕 아래로 굴러 내려갈수록 커지는 눈덩이처럼, 추천의 파도가 거듭될 때마다 표본의 크기는 커집니다.

이 기법은 다음과 같이 불리기도 합니다:

네트워크 표집(Network sampling)
추천 표집(Referral sampling)
연쇄 추천 표집(Chain-referral sampling)

이 기법은 사회학, 심리학, 공중 보건 등의 분야에서, 특히 프로젝트의 초기 탐색 단계에서 자주 사용됩니다.

눈덩이 표집 과정의 작동 방식

개인적인 네트워크에 의존하지만, 눈덩이 표집은 마음대로 진행하는 것이 아닙니다. 따라야 할 명확한 단계별 절차가 있으며, 이러한 단계를 건너뛰는 것은 흔히 발생하는 오류입니다.

일반적인 진행 과정은 다음과 같습니다:

1단계: "씨앗(Seeds)" 찾기. 타겟 모집단의 기준에 부합하는 소수의 초기 참여자(보통 3~5명)를 식별하고 모집하는 것으로 시작합니다.

2단계: 첫 번째 파도의 데이터 수집하기. 더 넓은 범위의 데이터 수집의 일환으로 인터뷰나 설문조사를 통해 이 씨앗들로부터 정보를 수집합니다. 이때 결정적으로, 각 참여자에게 연구 자격이 있는 다른 지인을 추천해 달라고 요청합니다.

3단계: 추천을 통해 표본 확장하기. 초기 씨앗들이 추천한 사람들이 두 번째 파도가 됩니다. 그런 다음 그들에게 다시 추천을 받아 세 번째 파도를 만들고, 이 과정을 반복합니다.

4단계: 중단 시점 결정하기. 새롭고 유용한 정보가 더 이상 나오지 않거나(포화 상태라고 함) 미리 정해둔 표본 크기에 도달할 때까지 이 순환을 계속합니다. Researcher.Life에 기술된 바와 같이, 많은 연구에서는 표본의 사회적 동질성이 너무 높아지는 것을 방지하기 위해 3~4회 추천 파도 이후에 종료합니다.

5단계: 적절한 관점으로 분석하기. 얻은 데이터는 탐색적이고 맥락이 풍부한 정보로 해석됩니다. 결과가 더 넓은 모집단을 통계적으로 대표하지 못한다는 점을 처음부터 인지하고 있어야 합니다.

이러한 단계들과 그 시사점에 대한 구조적인 분석은 연구자들이 실제 연구에서 이 방법을 어떻게 적용하는지 요약한 단계별 눈덩이 표집 과정을 참고하세요.

실제 연구 예시: 특정 틈새 분야의 소프트웨어 개발자에 대한 연구를 예로 들어보겠습니다. 연구자들은 관련 디렉토리를 찾을 수 없었습니다.

그들은 링크드인에서 몇 명의 연락처로 시작하여 인터뷰를 진행한 뒤, "이런 종류의 업무를 하는 다른 사람을 알고 계신가요?"라고 물었습니다. 새로운 연락 하나하나가 다른 연락으로 이어졌습니다.

이는 이 방법의 핵심 진실을 보여줍니다. 일부 집단의 경우 데이터베이스나 무작위 선택이 아니라 신뢰와 개인적 네트워크를 통해서만 접근할 수 있다는 점입니다.

알아야 할 눈덩이 표집의 유형

눈덩이 표집은 단 한 가지 방법만 있는 것이 아닙니다. 어떤 유형을 선택하느냐에 따라 사람들을 얼마나 빨리 찾는지, 누구를 찾는지, 그리고 어떤 편향이 개입되는지 등 모든 것이 달라집니다.

선형 표집(Linear sampling): 일렬 종대

여기서는 단일 사슬을 구축합니다. A가 B를 추천하고, B가 C를 추천하는 방식입니다. 좁고 통제된 경로입니다.

매우 독특한 특성을 가진 찾아내기 힘든 소규모 집단에 적합합니다.
넓은 범위 대신 더 깊고 집중적인 연결을 얻게 됩니다. 유용하지만, 이 방식으로는 많은 사람을 찾기 어렵습니다.

지수형 표집(Exponential sampling): 뻗어나가는 나무

대부분의 사람들이 사용하는 전형적인 방식입니다. 한 사람이 여러 사람을 추천하고, 추천받은 각 사람도 다시 여러 사람을 추천합니다. 표본 크기가 매우 빠르게 폭발적으로 늘어날 수 있습니다.

확실한 장점은 속도와 규모입니다.
큰 단점은 무엇일까요? 참여자들이 서로를 아는 경향이 있다는 것입니다. 다양한 집단 대신 끈끈하게 결합된 소외 집단만 얻게 될 수 있습니다. 빠르지만 공동체에 대한 매우 좁은 시각만을 보여줄 위험이 있습니다.

응답자 주도 표집(RDS, Respondent-driven sampling)

공중보건 연구자들은 종종 이처럼 보다 구조화된 접근 방식을 사용합니다. 이는 편향 문제를 보완하기 위해 고안되었습니다.

참여자들은 동료를 모집하는 대가로 소정의 보상을 받습니다.
연구자들은 통학 통계 공식을 사용하여 결과를 가중치 분석함으로써, 인맥이 넓은 사람들이 과도하게 표집되는 현상을 교정합니다. Cambridge University Press 등의 연구에 따르면, RDS는 실행하기 더 복잡하지만 숨겨진 모집단에서 더 나은 정확도를 목표로 합니다.

방대한 방법론적 논의는 응답자 주도 표집의 고급 통계적 고려 사항을 다루는 응답자 주도 표집 통계 분석 에 설명되어 있습니다.

눈덩이 표집의 장점

이 방법은 특히 공식 명단에 없는 사람들을 다룰 때 명확하고 실용적인 이점이 있습니다.

질적 연구 상황에서 특히 유용합니다. 연구가 질적 접근 방식에 적합한지 양적 접근 방식에 적합한지 확실하지 않다면, 질적 연구와 양적 연구 같은 자료가 눈덩이 표집이 가장 효과적인 영역을 명확히 파악하는 데 도움이 될 수 있습니다.

공식 조사망 밖에 있는 사람들에게 닿기 이것이 이 방법을 사용하는 주된 이유입니다. 숨겨져 있거나 낙인이 찍혔거나, 단순히 찾기 힘든 인구 집단에 대해서는 표준 설문조사가 작동하지 않습니다.

불법 약물 사용에 대한 연구.
서류 미비 이주 노동자가 포함된 연구.
매우 희귀한 질환을 앓고 있는 코호트 구축. 발송할 주소를 알 수 없다면 공식적인 초대장은 무용지물입니다. 신뢰할 수 있는 추천이야말로 작동하는 유일한 열쇠입니다.

비용이 적게 들고 빠름 비싼 메일링 리스트, 광고 예산, 복잡한 스크리닝 프로토콜이 필요하지 않습니다. 모집 시스템이 커뮤니티 자체에 내장되어 있습니다. 사회적 관계망이 핵심적인 역할을 수행하므로 비용과 시간을 모두 절약할 수 있습니다.

예를 들어 Nova Southeastern University의 연구에서는 공식 협회에 소속되어 있지 않은 비전문가들을 효율적으로 찾기 위해 이 접근 방식을 사용했습니다.

넓은 이해가 아닌 깊은 이해를 위한 도구 눈덩이 표집은 질적 연구에 자연스럽게 들어맞습니다. 목표가 풍부한 인터뷰, 상세한 사례 연구, 또는 그 다음 질문으로 무엇을 던져야 할지 알아내는 것이라면 이 방법이 적절합니다.

통계적 폭을 양보하고, 누군가의 삶이나 커뮤니티의 현실을 진정으로 이해하는 데 필요한 깊이를 얻는 방식입니다.

눈덩이 표집의 한계와 편향

이러한 실용성에도 불구하고, 이 방법은 연구 결과를 약화시킬 수 있는 심각한 결함을 지니고 있습니다. 눈덩이 표집은 비확률 표집 방법으로, 일반화할 수 있는 통계 모델보다는 특정 연구 패러다임에 부합합니다. 표본 추출틀이 확보된 경우에는 확률 표집 방법이 보다 대표성 있는 결과를 얻기 위한 표준적인 경로입니다.

이 넓은 맥락을 탐색 중이라면 연구 패러다임에서 서로 다른 방법론이 연구 설계를 어떻게 규정하는지에 대한 유용한 배경지식을 얻을 수 있습니다.

모두가 서로를 알고 있음 가장 큰 문제는 네트워크 편향입니다. 사람들은 자연스럽게 배경, 가치관, 사교 범위가 자신과 비슷한 사람을 추천합니다. 여러분의 표본은 대표 단면이 아니라, 겹치는 사회적 군집의 연속일 뿐입니다.

활동가 한 명으로 시작하면 대체로 동료 활동가 집단을 얻게 됩니다.
임원 한 명으로 시작하면 대체로 다른 임원들을 얻게 됩니다. 결국 전체 모집단이 아니라 단일 네트워크를 연구하게 될 뿐입니다. 이 내재된 편향은 흔히 이 방법의 결정적인 약점이 됩니다.

결과를 일반화할 수 없음 눈덩이 표집은 비확률 표집법입니다. 무작위 선택이 없으므로 연구 결과가 통계적으로 더 넓은 집단을 대표한다고 주장할 수 없습니다.

주제를 분류하고 설득력 있는 이야기를 제공하며 경험을 상세히 조사할 수는 있지만, "이 집단에 속한 사람들의 X%가 Y라고 믿는다"고 말할 수는 없습니다. 통계학적으로 지원되지 않기 때문입니다.

윤리적 외줄 타기 지인 추천을 요청하는 과정에서 개인정보 침해와 무언의 압박 문제가 즉각적으로 발생합니다.

참여자는 타인의 이름을 제공해야 한다는 의무감을 느껴 대인 관계에 부담을 가질 수 있습니다.
결속력이 강한 집단 내에서는 익명성이 깨질 우려가 항상 존재합니다. 불법 행위나 질병 낙인처럼 민감한 주제를 다루는 연구의 경우, 이는 결코 사소한 문제가 아닙니다. 연구 자체를 중단시킬 수 있는 핵심 윤리적 과제입니다.

눈덩이 표집 vs 기타 표집 방법

표집 방식을 선택하는 것은 장단점의 균형을 맞추는 일입니다. 다음은 핵심적인 측면에서 눈덩이 표집을 다른 방식과 비교한 내용입니다.

특징	눈덩이 표집	무작위 표집	편의 표집	층화 표집
유형	비확률	확률	비확률	확률
표본 추출틀	필요 없음	필요함	필요 없음	필요함
가장 적합한 용도	숨겨진 모집단	일반 모집단	접근이 쉬운 집단	구조화된 모집단
편향 위험	높음	낮음	높음	보통
일반화 가능성	제한적임	강함	약함	강함

이 표는 핵심적인 한계를 보여줍니다. 여러분은 통계적 타당성을 희생하고 편향이 발생함을 인정하더라도, 대상에 대한 접근 자체가 주된 문제일 때 눈덩이 표집을 사용하게 됩니다. 다른 방법이 주소조차 찾지 못할 때도 연구의 문을 열어줍니다.

이 방법을 기반으로 연구 결과를 발표할 준비를 하고 있다면, 올바른 저널을 선택하는 것도 중요합니다. 연구를 위한 학술지 선택 가이드는 여러분의 방법론과 적절한 학술 출처를 매칭하는 데 도움을 줄 수 있습니다.

눈덩이 표집을 효과적으로 사용하기 위한 실천 원칙

이 방법이 제대로 작동하려면 고유한 본질적 약점을 보완할 계획이 필요합니다.

한 곳이 아닌 여러 곳에서 시작하기 첫 접촉 대상인 "씨앗"이 모든 것을 좌우합니다. 단 한 사람으로 시작하면 그 사람의 인맥만 관찰하게 됩니다. 대신 공동체의 다양한 영역에서 시작점을 여러 개 찾으세요.

이 단순한 조치가 군집 편향 문제를 완화하고 보다 다양한 표본을 구성할 수 있는 가장 좋은 방법입니다.

언제 멈출지 알기 명확한 계획이 없으면 동일한 특성의 사람들이 계속 모여 모집 과정이 끝없이 흐를 수 있습니다. 데이터 수집 중단을 위한 명확한 기준을 설정해야 합니다.

추천의 단계적인 "파도" 수(예: 3~4회 조사 후 종료)를 제한하십시오.
새로운 인터뷰에서도 더 이상 새로운 사실이 드러나지 않을 때("포화 상태") 멈추십시오. 이를 통해 동일한 인맥 안에서만 맴도는 것을 막을 수 있습니다.

자세히 기록하기 연구의 신뢰성을 지키려면 모집 과정을 아주 세심하게 문서화해야 합니다. 첫 씨앗을 어떻게 선택했는지, 몇 번의 추천 파도가 진행되었는지, 한 사람이 추천할 수 있는 인원수에 어떤 한계를 두었는지, 그리고 왜 중단했는지를 상세히 기록하세요.

이 기록이 본질적인 편향 자체를 해결해 주지는 못하지만, 방법론을 투명하게 만들고 연구 한계를 독자에게 명확히 전달해 줍니다.

다양한 도구 중 하나로 사용하기 눈덩이 표집을 단독으로만 사용하는 것은 바람직하지 않습니다. 다른 접근법과 결합하여 운용하시는 것이 좋습니다.

이를 활용해 설문조사 참여자를 찾아냅니다.
의도적 표집(purposive sampling)과 병행하여 빠진 인구 통계적 관점을 고의적으로 탐색합니다.
공개 온라인 모집을 추가하여 표본을 강화합니다. 혼합적 방법론(mixed-methods)을 쓰면 눈덩이 표집의 깊이 있는 접근성을 넓고도 일정 수준 통제된 데이터 수집 방식과 중화할 수 있습니다.

눈덩이 표집: 다음으로 해야 할 일

타겟 그룹이 쉽게 식별되지 않고 각 단계가 추천에만 의존할 때, 적합한 대상자에게 접근하는 데 어려움을 겪을 수 있습니다. 이것은 제한적으로 느껴집니다. 눈덩이 표집이 연구의 진행을 도와주기는 하지만 편향의 위험 때문에 결과를 신뢰하기가 더 어려워 질 수 있습니다.

핵심은 연구 참여자를 모집하는 방법과 데이터 수집을 멈출 시기를 항상 명확히 정의하는 것입니다. Jenni 같은 도구를 활용하면 방법론 관련 콘텐츠를 구체적인 방식으로 작성하는 데 도움이 되며, 연구 논문의 방법론 섹션을 작성하는 명확한 가이드를 참고하여 여러분의 연구 결정 사항들이 독자에게 명확히 전달되고 주장이 한층 탄탄해지도록 보조할 수 있습니다.