リサーチAI比較

AI検索・リサーチ能力の比較。リアルタイム情報検索、ファクトチェック、出典提示能力を評価。

独自30テスト採点基準公開2026.04更新

SimpleQA（事実質問）

外部ベンチマーク2025-11 更新出典 →

事実に関する短い質問への正確さ。ハルシネーション率の逆指標として活用。

GPT-5.2

62.5

Perplexity Online

Gemini 2.0

51.2

Grok 3

38.5

Claude Opus 4

28.4

指標: 正答率（%）

外部ベンチマーク2026-03 更新

回答に出典URLを提示する能力。リンクの正確性・関連性・網羅性を評価。

Perplexity

Gemini

ChatGPT

Grok

Claude

指標: 出典品質スコア（100点満点）

モデル	対応	備考
Claude	○	深い分析は得意だが、リアルタイム検索は非対応。
ChatGPT	○	Bing検索統合。Browse機能で最新情報取得。
Grok	○	X（旧Twitter）連携でリアルタイム情報。
Perplexity	○	リサーチ特化。出典付き回答が最大の強み。
Gemini	○	Google検索統合。ファクトチェック機能。
Microsoft Copilot	○	Bing検索ベースのWebリサーチ機能。M365テナント内データの横断検索も。

「リサーチAI比較 #AI選び」