シンセティック・データの科学

シンセティック・レスポンデントは仮説の段階を超え、標準的な手法となりました。Political AnalysisJournal of MarketingPsychology & Marketingの査読論文と、EY、ハーバード大学、MIT Sloan、Qualtricsによる再現研究は、適切に校正されたシンセティック・データが従来の人間データと同等 — 場合によってはそれを上回る — ことを示しています。

95%
EYブランド調査再現の相関
90%
人間のテスト・再テスト信頼性に対して (arXiv 2025)
77%
人間アナリストのテーマを回収 (Journal of Marketing 2025)
主要な発見

EYは1,000のシンセティック・ペルソナでCEOブランド調査を再現

95%
元の調査との相関

プロフェッショナルサービス企業のEYは、年次グローバル・ブランド調査(売上10億ドル超の米国企業のCEOを対象)を二重盲検法で実施しました。一度は従来の方式、もう一度はAaruが構築した1,000のシンセティック・ペルソナで。

シンセティック調査は実調査と95%の相関を示しました。EYはまた、年次グローバル・ウェルス・リサーチ・レポートを1日で再現し、6ヶ月の元調査との中央値で90%以上の相関を達成しています。

— Toni Clayton-Hine、EY CMO. Solomon Partners (2025年9月) より報告。

ケーススタディを読む
査読済み論文

シンセティック・レスポンデントを支える学術的根拠

主要ジャーナルの基礎的論文4編が、適切に校正されたシンセティック・データが厳密に人間の調査回答を再現することを実証しています。

Journal of Marketing
Arora, Chakraborty & Nishimura · 2025 · Vol. 89(2)

マーケティング・リサーチにおけるAI×人間ハイブリッド

AI×人間のハイブリッドは、情報量と一貫性に優れ、深さと洞察において人間のみのデータを超えるデータを生成し、テーマ生成では人間と同等の性能を発揮。LLMハイブリッドは人間アナリストが特定したテーマの77%を回収しました。

DOI: 10.1177/00222429241276529
arXiv
Maier et al. · 2025年10月 · arXiv:2510.08338

セマンティック類似度によるLLMの購入意向再現

57のパーソナルケア製品調査における9,300の人間回答に対して検証し、Semantic Similarity Rating法は人間のテスト・再テスト信頼性の90%を達成。リアルデータとの分布類似度はKolmogorov–Smirnov値で0.85を上回りました。

arXivで読む
Political Analysis
Argyle et al. · 2023 · Cambridge University Press

Out of One, Many: 言語モデルによる人間サンプル模倣

「シリコン・サンプル」を確立した基礎論文。社会人口統計プロファイルで条件付けされたGPT-3が、多様な人間の集団の回答分布を正確に模倣することを実証し、実調査結果を多数の人口層で再現しました。

DOI: 10.1017/pan.2023.2
Psychology & Marketing
Sarstedt, Adler, Rau & Schmitt · 2024 · Vol. 41(6)

消費者・マーケティングリサーチにおけるシリコン・サンプルとLLM

シリコン・サンプリングの正式な学術ガイドラインを確立。研究プロセスの上流(質的事前テスト、パイロット研究、仮説生成)に特に有望と結論。

DOI: 10.1002/mar.21982

科学を実践してみる

ペルソナを生成し、アンケートやインタビューを実施し、シンセティック・レスポンデントが何を明らかにするかをご自身の目で — 数分で。