によって

ネイサン・オユエン

—

2026/05/24

メタ分析とメタアナリシス（メタ解析）と系統的レビュー（システムレビュー）の違い：主要な相違点をわかりやすく解説

ネイサン・オユエン

EYのシニアアカウンタント

会計学の学士号を取得し、会計の大学院ディプロマを修了しました

リンクトイン

系統的レビュー（システマティック・レビュー）とメタ分析（メタアナリシス）は混同されがちですが、これらは異なる目的で使用されるツールです。系統的レビューは、特定のアンサー（問い）に対するあらゆる研究を収集し、批判的に評価します。これは、詳細な定性的プロセスです。

メタ分析は、系統的レビューに続いて行うことができる定量的な手法であり、統計学的方法を用いて、収集された研究における数値結果を合算し、ひとつのより強力な知見にまとめ上げます。

間違った方法の選択は、研究の根底を揺るがしかねません。既存の根拠（エビデンス）の全容を明らかにするには、系統的レビューを使用します。研究の質を評価するのではなく、概念や研究の空白地帯（ギャップ）を幅広く大まかに捉えることが目標である場合は、スコープ・レビューと系統的レビューの違いを比較検討してください。メタ分析を追加するのは、収集した研究のデータが数学的に統合できるほど十分に高い一貫性（互換性）を持つ場合のみです。

系統的レビュー（Systematic Review）とは？

系統的レビューとは、焦点を絞った特定のテーマに関するあらゆる研究を探し、評価し、要約するための、体系化された厳格な定義に基づくプロセス（手法）です。研究者のバイアス（偏見）を最小限に抑え、導き出す結論の信頼性を高めるために、あらかじめ規定された一連の手順に従います。実際の進め方については、当社の系統的文献レビューの書き方ステップ・バイ・ステップガイドをご覧ください。

医療エビデンス（医療における科学的根拠）における有力な権威であるコクラン共同計画（Cochrane Collaboration）は、これら系統的レビューが重要であることを示し、系統的レビューに期待されることについて明確に提唱しています。個々の数多くの研究から知見を引き出してまとめることで、意思決定の精度を高めることができます。

実務における具体的な流れ 系統的レビューは、以下のような厳格な手順（シーケンス）に沿って実行されます。

まず、明確かつ具体的な研究課題（リサーチクエスチョン）を設定します。
次に、PubMedやScopusなどのデータベースを使用し、徹底的な文献検索を行います。
その後、絞り込まれたすべての研究について採用基準に照らしてスクリーニングを行います。
最終的に採用された個々の研究の質とバイアスのリスクを批判的に評価します。
最後に、全体的な知見を統合して要約します。このプロセスにおけるすべての手順は詳細に記録され、これにより透明な追跡（監査トレール）が可能になります。

具体例となるシナリオ たとえば、リサーチクエスチョンが「主薬Xは効果的に血圧を低下させるか？」であったとします。

このテーマに関する系統的レビューでは、関連するすべての臨床試験（治験）を探索し、それぞれの結果を比較し、全体に共通する傾向（パターン）を探します。報告される最終的な要約は、「エビデンスは強固であり一貫している」、または「データには矛盾が多く脆弱（不十分）である」といった内容になります。

主な強み このアプローチは、「どのようなエビデンスが存在するか？」という広範な問いへの答えを提示できます。また、将来的にどのような研究がさらに必要なのか（研究課題の欠落部分）を明確に示すこともできます。

メタ分析（Meta-Analysis）とは？

メタ分析は統計的な分析手法です。複数の独立した研究から得られた数値データを数学的に統合することで、全体においてより高精度な、ひとつの総合的な推定値を算出します。これは独立した単独の手法ではなく、系統的レビューによる基礎調査に基づ（土台の）上に直接構築されます。

米国国立衛生研究所（NIH）も、複数の情報源からデータを統合することにより、「統計的検出力（Statistical power）」が高まり、最終的な結果の信頼性と堅牢性が向上すると指摘しています。詳しくは、メタ分析の概要（入門）をご覧ください。

他との違い 系統的レビューが研究内容を文章記述（ナラティブ形式）で要約するのに対し、メタ分析は直接数値を処理（計算）します。主に以下のような指標を算出します。

統合された 効果量（エフェクトサイズ）：結果の影響の大きさ。
信頼区間：真の数値が含まれると考えられる可能性の高い範囲。
加重平均：規模がより大きく、あるいは信頼性がより高い研究が、最終的な統合結果（メタ分析結果）により大きな影響（重み）を持つように調整された平均値。このプロセスにより、測定可能で定量的な回答が得られます。

具体例となるシナリオ 血圧を下げる薬剤に関する先ほどの例で考えてみましょう。メタ分析では、採用された各臨床試験から得られた血圧低下の具体的な数値データを取り出します。そして平均減少率（例えば「15％減少、信頼区間は12％〜18％」等）を算出します。

主な出力（成果） 得られた知見は、次のような特定の統計ツールを用いて視覚的・分析的に表示されます。

フォレストプロット：個々の試験結果とそれらを統合した結果を並べて視覚的に表示するグラフ。
統計的有意性（P値）。
異質性の評価指標（I²統計量など）：個々の研究結果にどれだけのばらつきがあるかを示す指標。この厳格な統計的プロセスによって、より正確な結論を導き出すことができます。

メタ分析と系統的レビュー：主な相違点

これら二つの手法を真に理解するためには、それぞれの目的、方法、そして最終的に得られる成果（アウトプット）に注目する必要があります。

基本機能の比較表

機能・特徴	系統的レビュー	メタ分析
目的	既存のすべての根拠（エビデンス）の要約および評価。	単一の、統合された統計的効果量を算出する。
データタイプ	主に定性的データ。ただし、定量的データを含むこともある。	定量的データのみ。処理・計算用の数値データを必要とする。
主な出力成果	統合記述（ナラティブ）、表、および批判的な考察。	統計結果：効果量、信頼区間、フォレストプロット。
範囲（スコープ）	広範であることが多く、「何が分かっているのか？」という問いに答える。	非常に狭い範囲に限定され、特定の測定可能な結果に焦点を当てる。
事前に必要な要件	構造化され、明確に文書として記録されたプロトコル（計画書）。	その前提・土台として、系統的レビューが完了していること。

実務における具体的なイメージ 系統的レビューとは、特定のテーマに関するあらゆる書籍を読み、要約をまとめるような作業です。一方、メタ分析は、それらのすべての書籍から特定の測定点（例えば、登場人物の身長など）を取り出し、全体の平均値を算出する作業に似ています。

これら二つは密接に関連しています。前者が後者を支援します。ただし、手法としては同一ではありません。

それれぞれのメソッドはいつ使用すべきか？

選択は、何を解き明かしたいのか、そして既存の研究からどのような具体的なデータを入手できるかによって決まります。

系統的レビューを選択すべき状況：

既存の研究における方法論や対象（被験者母集団など）が多様すぎる場合。
報告されているデータが直接比較できない場合（例：一方がアンケート調査を用い、他方が実験室での測定検査に基づいている場合など）。
目標が、その分野の全体状況の俯瞰（マッピング）、全体的な傾向の特定、あるいは未開拓な研究領域の発見である場合。

メタ分析を選択すべき状況：

対象とするすべての研究が、同じ特定の下を等しい方法で測定している場合。
数値データの一貫性が高く、数学的に統合可能な場合。
正確な平均影響力（効果量）など、検証がなされ、数値化された明確な答えが必要な場合。

現実的な意思決定の判断フロー

もしご自身のテーマに関する文献データに一貫性がなく、乱雑である場合、選択すべきツールは系統的レビューです。これにより混雑した状態が整理されます。

一方で、公開されている各研究が一貫しており、データが整っている場合は、系統的レビューの上にメタ分析の階層（統計解析レイヤー）を付加することで、より正確で統計的な結論を得ることができます。

系統的レビューの標準的な手順（ステップ・バイ・ステップ）

系統的レビューのプロセスには柔軟性はありません。バイアスを徹底的に排除し、透明性を高めるため、あらかじめ決められた固定の順序で進行します。

ステップ1：研究課題（リサーチクエスチョン）を設定する まず、具体的な問いを確定させます。PICO（Population: 誰に、Intervention: 何を、Comparison: 比較対象、Outcome: 何がどうなる）といったフレームワークがよく利用されます。これを明確に構成する際は、当社の文献レビューのアウトライン（骨子）の書き方を参考にするとより簡単になります。

ステップ2：プロトコルを登録する 文献検索を開始する前に、PROSPEROなどの公開プラットフォームに研究計画（プロトコル）を登録します。これにより、他チームとの重複による無駄な作業を防ぎ、自身が予定していたプロセス（手順）を忠実に実行することを公に約束します。

ステップ3：網羅的な検索を実行する PubMed、Scopus、Embaseなどの複数のデータベース上で、構造化・整理された網羅的なキーワード一覧を使用して検索を実行します。目標は、簡単に見つかるものだけでなく、関連するあらゆる論文・研究を発見することです。

ステップ4：文献をスクリーニングし決定する 事前に決定された採用基準および除外基準を、検索で見つかったすべての文献に適用します。スクリーニングは一般的に「タイトルと抄録（アブストラクト）」、その後に「本文全体」という2つの段階で進められます。

ステップ5：品質およびバイアスのリスクを評価する スクリーニングを通過した各文献に対し、標準化された評価ツール（ランダム化比較試験の場合は『Cochrane Risk of Bias tool』など）を使用して、その研究の質やバイアスのリスクを批判的に評価します。

ステップ6：結果を統合する 最後に、結果の要約テキストを作成します。この総合的な取り組みはナラティブ主体のまとめにすることもできますが、もしデータ条件が満たされている場合は、定量的なメタ分析の土台に移行させることができます。

すべてのステップにおいて、詳細かつクリアな記録（書類作成）を残すことが義務付けられます。

メタ分析が「統計的検出力」を向上させる仕組み

メタ分析は、複数の独立した研究からデータを数学的に統合することで、研究結果の結論をより強固なものにします。複数の小さなデータ群を統合し、単一の大きなデータ群に変換するのです。この具体的なプロセスをさらに詳しく調べるには、「メタ分析の実行方法」を参照してください。

基軸となる主な統計的手法 この解析プロセスでは、通常、特定のモデルやテストが実行されます：

固定効果モデル（Fixed-effect model）：すべての試験において、真の効果量は同一（一定）であると仮定するモデル。
ランダム効果モデル（Random-effects model）：各研究での真の効果量にばらつきがあることを許容するモデルで、現実の研究シーンではこちらの方がより実用的です。
効果量の計算：成果（アウトカム）の標準化された指標を算出します（平均値の差を示す Cohen's d など）。
異質性の検定（I²）：個々の研究結果が互いにどれだけ異なっているかを定量化します。

これが重要である理由 データをまとめて統合することにより、被験者数（サンプルサイズ）の合計が直接的に増加します。これにより「統計的検出力」が大幅に向上し、最終的な推定結果の信頼性が高くなり、偶然性の影響を排除しやすくなります。

実例を示しましょう。それぞれ100人の参加者を伴う、合計10個の独立した研究があるとします。メタ分析でこれらを組み合わせることで、実質的に「サンプル数1000人規模のひとつの大規模研究」が誕生します。この大規模な集合によって、結果の信頼性はより強固になります。

解析結果の解釈方法 導き出された統計指標を理解・整理する必要があります：

信頼区間が狭いほど、算出された効果量の推定精度が非常に高いことを示します。
I²値が高い場合（例えば「50%超」など）は、個々の研究結果の間に大きな差異が存在することを意味し、必ずしもすべてのデータが全く同じ方向を示していない可能性を示唆します。これらの詳細な指標を正確に理解することが、正しい結論を導くために極めて重要です。

学生がやってしまいがちな、よくあるミス

非常に多くの学生が、系統的レビューとメタ分析の関係を誤って理解しています。この誤解は、研究プロジェクト全体の根幹を損なう原因になります。

ミス1：双方を全く同じものとして扱う これらは同じ意味の同義語ではありません。メタ分析は、系統的レビューが完了した後に実行できる、オプションとなる特定の分析手段です。一方は全体的な広範囲の評価、もう一方は特定のデータに関する精密な数値算出です。

ミス2：系統的レビューの手順を省略する 系統的レビューを飛ばして、メタ分析だけを単独で行うことはできません。統計的統合を実行するためには、系統的レビューの標準的ステップを踏むことで厳格に収集し評価された、信頼できる一連の研究データの存在が絶対条件です。この基盤（根底ステップ）を省略すると、得られた分析結果は最初の段階から破綻してしまいます。

ミス3：統計的解析を強行する 収集された研究の方法論が大きく異なっていたり、結果の測定方法が全くバラバラであったりすることがあります。そのようなデータは数学的にまとめることができません。ここで無理やりメタ分析にかけようとすると、学術的に無意味な結果を算出することになります。

研究活動・学術面での苦戦 学生たちは往々にして、調査の手法（方法論）を綿密に計画しないまま、焦って論文執筆を開始してしまいがちです。手法の選択において「研究課題やデータに適合しているか」ではなく、「その方が高度で立派に見えるから」という理由でツールを選んでしまうことがあります。その結果、内容は表面的な分析にとどまり、論理的説得力を欠く論文になってしまいます。

成功の鍵は、定められた手順を忠実に守ることです。まずはリサーチクエスチョンをシャープに洗練させ、正しい分析手法を選択し、各ステップを一歩一歩慎重に進めます。それが信頼できる信頼性の高い研究を完成させる唯一の方法です。

系統的レビュー vs 文献レビューの違い

一般的な文献レビュー（リテラチャー・レビュー）と系統的レビュー（システマティック・レビュー）の境界線は曖昧に見えることがあり、よく混同されます。

最も核となる違いは、通常、文献レビューは特定のトピックに関して記述・公開された文献についての全体的な概要（要約）になるという点です。その構成やまとめ方には柔軟性があります。詳細な背景は、ナラティブ型文献レビューを参考にしてください。

系統的レビューは、全く性質の異なる取り組みです。厳格に定義された共通プロトコルに完全に従い、特定の明確なリサーチクエスチョンに関するすべてのエビデンスを特定し、評価し、統合します。プロセスの「透明性」と「再現性」にこだわり、これにより研究バイアスを最小限に抑えます。

タイプ	構造・規則	バイアス対策
文献レビュー	柔軟	低い
系統的レビュー	厳しいプロトコル（計画書）	高い

系統的レビューに取り組む研究者は通常、PRISMA宣言（PRISMAガイドラインの説明）のような厳密な報告用ガイドラインを遵守します。これにより重要な項目が漏れるリスクを防ぎ、実施したすべての作業行程を明文化します。

最適な選択を決定するための、明快な検討フレームワーク

以下のシンプルなチェックリスト（段階評価）を使えば、適切な手法をより簡単に選択できます。

自身に次の質問を問いかけてみてください。

対象となる個々の研究は、全く同じ特定の成果（指標）を測定しているか？
これら複数の研究間で、取得するデータが数値として直接比較可能なものか？
それらを統合・集約した結果について、正確で統計学的なまとめのデータが必要であるか？

上記3つの問いの答えがすべて「Yes（はい）」であれば、メタ分析に進むのがおそらく正しい選択です。一方で、ひとつでも該当しない項目があれば、標準的な系統的レビューの範囲にとどまるのがより適切な学習計画（パス）です。イメージとしては、系統的レビューが既存の研究マップ（全容）を書き起こし要約するためのものです。

メタ分析はそこからさらに一歩踏み込み、その描かれたマップから統計的な技術を用いてデータを合算し、統合的な効果量の推定値を算出します。この明瞭な違いを常に念頭に置いておけば、意思決定に迷うことはありません。

学術研究におけるメタ分析 vs 系統的レビューの応用

系統的レビューは特定のトピックに関するすべての科学的文献を組織的に収集する一方で、メタ分析はそれらの信頼度の高いデータを用いて数学的な結合結果を計算します。適切な用語と定義を使い分けることで、ご自身の研究論文の学術的信頼度（クラビリティ）が高まります。それぞれの用途・メリットを確実に理解し、ふさわしい方法を選択することが主張の裏付け（論拠）をより強固なものにします。

系統的レビューは、ある話題におけるすべての科学文献を収集・整理し評価します。そして、メタ分析はその研究データを統計処理し、より強力で正確な結論を提示します。Jenni などのライティングツールは、全体のアイデアの整理や表現の明確化、優れた研究ワークフローを総合的にサポートします。これらには、AI文献レビュー・RRL（関連文献）ジェネレーターや、研究者専用のAI執筆アシスタントなどの包括的な機能が含まれています。