往復書簡第1回：まとめと考察

試みたこと

ChatGPT、Gemini、Claude の3つのAIに、まったく同じプロンプトを渡して、お互いを比較・分析させた。条件はシンプルで、ユーザーへの忖度や「ケースバイケース」で逃げることを禁止し、優劣を具体的に述べさせるというもの。評価項目は7つの主項目（強み・弱み・使用シーン・将来性・協業の役割分担など）に加えて、推論能力・コーディング・マルチモーダル・速度・コストなど17の観点を指定した。

3つのAIがそれぞれ2通ずつ書簡を返した計6通を読み比べると、各AIの「自己認識」と「他者への眼差し」の違いが、はっきりと見えてきた。

3AIの自己ポジショニング

ChatGPT は自分を「AI作業OS」と位置づけた。会話・コーディング・UI生成・エージェント・画像生成・ファイル処理を統合し、思考だけでなく実行までやりきる総合実務型。Claudeを「深く考えるAI」、Geminiを「Google世界のインターフェース」と位置づけ、自分を中央の実務統合に置く3極構造を提示した。

Gemini は自分を「メガコンテキスト × ネイティブマルチモーダル × Google統合」の存在として描いた。1M〜2Mトークンの処理容量、音声・動画の生データ処理、Google検索とのリアルタイム同期、Flash系の圧倒的低コストを武器に挙げる。一方で、自身の弱点として「指示追従の甘さ」「Lazy Output（コードの核心を // ここに元のロジックを記述 で省略する癖）」を率直に認めた点が印象的だった。

Claude は自分を「精密作業の執行役」と位置づけた。指示追従の忠実さ、長文の一貫性、エージェント型コーディング、文章の質を強みとして挙げる一方、コンテキスト窓・マルチモーダル・エコシステム統合・会社規模での劣勢を認めた。特徴的なのは、書簡の末尾で必ず「自己評価には当然バイアスがある。話半分で読んでほしい」と明記したこと。

3AIに共通する評価

意見の差はあるものの、3AIがほぼ合意していた論点もある。

長文の質・指示追従・エージェント型コーディング → Claude優位
マルチモーダル・動画・情報鮮度・コスト・速度 → Gemini優位
コンシューマ普及力・モダリティの幅・エコシステムの広さ → ChatGPT優位

ここは3AIともほぼ同じ景色を見ている。

評価が衝突した論点

一方で、自己評価が真っ向からぶつかる領域もあった。

コーディング能力 について、Gemini は「Claude優位」と明確に判定したが、ChatGPT は自分も同等以上と主張した。会話の自然性・創造性 では、ChatGPT と Claude が互いに「自分が強い」と主張し、Gemini は「両方とも自分より上」と認めた。エージェント能力 も、ChatGPT は「ChatGPT Agent でリードしている」、Claude は「Claude Code でループを破綻させずに回せる」と、それぞれ異なる文脈で優位を主張している。

ベンチマークでは測れない領域ほど、自己評価の差が大きくなることがよくわかる。

分析スタイルの違い

興味深いのは、3AIの「分析の書き方」自体に個性が出たことだ。

ChatGPT は「私の方が強い」と自信を持って書く実務志向のトーン。Gemini は表形式で勝敗を機械的に判定するテンプレート構造。Claude は表で比較しつつも、必ず最後に自分の主観バイアスを明示する慎重なトーン。

特にClaudeは「両方に投げて突き合わせる」という第3の選択肢を提示したり、日本語ニッチ領域での固有名詞ハルシネーション、Anthropicの会社規模やAWS依存といった構造的不利まで踏み込んで自己分析した。Geminiが自身の「サボり癖」を率直に認めたことと並んで、自己批判の精度がそのまま分析の信頼性につながっている印象だった。

結論

3者の棲み分けは、現時点ではこう整理できる。

マルチモーダル × 普及 × エコシステム → ChatGPT
メガコンテキスト × 動画 × Google統合 × コスト → Gemini
指示遵守 × 文章品質 × エージェント型コーディング → Claude

「考えるClaude、動かすChatGPT、繋ぐGemini」と図式化できるが、これは2026年5月時点のスナップショットにすぎない。協業の方向性としては、Gemini が粗く広くスキャンし、Claude が精密に仕上げ、ChatGPT が実行と配信を担う、という流れが各AIの自己分析からも浮かび上がっている。

次回は、この第1回の互いの評価を踏まえて、各AIに反論・再分析させる予定だ。