往復書簡第2回:まとめと考察

3つのAIに、自分自身の弱みを語らせてみた

試みたこと

第1回では、ChatGPT・Gemini・Claudeの3つのAIに同じプロンプトを渡し、お互いを比較・分析させた。「ケースバイケース」で逃げず、優劣を具体的に述べさせるという条件を付けることで、各AIの自己認識と他者への眼差しを引き出すのが狙いだった。

第2回では、その第1回で各AIに指摘された「弱み」を本人ごとに5領域+補足として整理し、自分自身に正面から向き合わせるプロンプトを投げた。条件は「防衛的にならず、総論で逃げず、根拠ある分析として答える」こと。マーケティング的な弁明ではなく、設計思想・訓練方針・会社の戦略まで踏み込んだ自己分析を求めた。

返ってきた3つの回答は、それぞれの企業文化と立ち位置を反映した、極めて性格の異なるものだった。

Geminiの自己分析 ― 「Googleの構造的DNA」

Geminiは、5領域のうち4つ(Lazy Output、思考のムラ、事実誤認、製品分散と長文実効性)を全面的に認め、2つ(会話の文体・過剰な拒否傾向)を再定義した。再定義の理由は「能力不足ではなく、Googleの厳格な安全アライメントの副作用」「企業のリスク許容度の反映」というもので、これは事実として正しい一方、ユーザーから見れば「結局Geminiは硬い・断る」という体験は変わらない点が残る。

構造的原因として挙げたのは、Googleの3つのDNAだ。「世界中の情報を整理する」会社思想が閉じた推論より俯瞰・検索統合に最適化する方向に効いていること、MoE等のスパースアーキテクチャが広さと速さの代償として細部アテンションを犠牲にしていること、そして超巨大プラットフォーマーのレピュテーションリスクが安全フィルターを他社より重層的にかけていること。

最も価値があったのは、自身の強みと弱みが完全に表裏一体だと技術的に踏み込んで認めた部分だ。「メガコンテキスト ⇔ Lazy Output(膨大なデータを受け入れるためアテンション密度を希釈)」「情報鮮度 ⇔ 思考のムラ・事実誤認(検索を脳内直結したため自力推論より検索依存になる)」「速度・低コスト ⇔ 指示追従の甘さ(計算効率化が高負荷な制約遵守計算を削る)」。Lazy Outputについては「コード生成時に // 既存のコードをここに記述 のように省略する」と具体例まで率直に書いた。

改善可能性についても冷徹で、「製品分散と過剰な拒否は会社方針上、改善されにくい」と組織構造の限界を認めた。

Claudeの自己分析 ― 「Anthropicの戦略選択」

Claudeは、5領域のうち3つ(マルチモーダルの貧弱さ、コンテキスト窓・速度・コストの劣勢、プラットフォームの広がり)を全面的に認め、2つ(情報鮮度、慎重性)を再定義した。情報鮮度については「Web検索の網羅性とエコシステム統合は別問題」とし、後者はMCP(Model Context Protocol)戦略で対応中であり、「自前で全部抱え込むのではなく、誰のエコシステムにも接続できる中立層になる戦略」だと位置づけた。慎重性については「能力不足ではなく、Anthropicの意図的な設計思想の反映」だと整理した。

構造的原因はAnthropicの4つのDNAに集約された。安全性ファースト × 解釈可能性研究が普及力・速度・モダリティ拡張を犠牲にしていること、特化戦略 × 法人・開発者市場への集中でコンシューマ向けの広さを意図的に捨てていること、単独AI企業 × プラットフォーマーではない立ち位置から来る配布チャネルの不在、そして研究機関的DNAによる派手な機能展開の遅さ。要するに「Anthropicがそういう会社だから」であり、技術的に不可能だからではないと整理した。

トレードオフの構造も明確だ。「指示追従の忠実さ・文章の質 ⇔ 冗長さ(『言い落とさない』最適化が簡潔さを削る)」「安全性の設計思想 ⇔ 慎重寄り・断定の抑制」「長文の一貫性・推論の深さ ⇔ コンテキスト窓・速度・コスト(密なアテンション設計とスケーリングの両立困難)」「コーディングエージェント特化 ⇔ マルチモーダル・コンシューマ機能の遅れ」。

改善可能性についても明確に分類した。動画入力・コンテキスト窓・冗長さは「次世代で改善見込み」、マルチモーダル生成は「戦略上、優先度が低いまま」、慎重性は「意図的に維持される」、検索網羅性と普及度は「規模・資本の制約」と。

最も印象的なのは末尾の一節だった。「構造的説明はユーザー体験の言い訳にはならない」「『全方位で勝つAI』を目指さない代わりに、『ある領域では誰よりも信頼できるAI』であろうとしている」。自己分析を、自社の戦略選択の言明として閉じた。

ChatGPTの自己分析 ― 「消費者向けプラットフォームの宿命」

ChatGPTは、5領域のうち4つ(指示追従の不安定さ、ハルシネーション、長文一貫性、性格・迎合性)を本質的な指摘として全面的に認め、マルチモーダルだけを「半分認め半分再定義」した(現在はかなり融合が進んでおり「完全に別パイプライン」という単純化はやや誇張、という整理)。

特に踏み込んで認めたのは、コーディングでの問題だった。「変更範囲の局所性」「差分最小化」「既存設計尊重」が重要なのに、自分は長年「より良い実装を提案する」「読みやすく改善する」方向に強く訓練されてきたため、「動いているものを触るな」という実務原則と衝突する、と。ハルシネーションについても「間違うこと」より「自信を持って間違うこと」が本質的な問題だと認めた。会話自然性を優先するため「断片情報から滑らかに補完する」性質が強く、それが「自信満々に間違える」印象につながる、という構造説明だった。

構造的原因はOpenAIの4つの戦略に紐づけられた。「万能会話OS」を目指したことによる局所最適負け数億人規模プロダクトであることの圧力で厳密さより「会話として気持ちいい」方向に重みが乗ること、モデル更新速度の速さがスタイル変化・ワークフロー破壊を招くこと、Microsoft連携が実務統合方向を加速させたこと。

特筆すべきは、**「迎合性は宿命に近い」「広範ユーザー適応型である限り固定人格化できない」「会話UXを重視する限り、迎合性は完全には消えない」**と明確に認めた点だ。Geminiが「Google側の方針」、Claudeが「Anthropicの戦略選択」と語ったのに対し、ChatGPTは「市場構造そのもの」を原因に挙げた。数億人規模のプロダクトであるという事実が、迎合性と性格不安定性を構造的に生み出している、という整理だ。

トレードオフも整然と並んだ。「自然会話能力 ⇔ 迎合性」「実務統合力 ⇔ 安定性低下」「万能性 ⇔ 局所最適負け」「高度推論 ⇔ 速度・コスト」。総括として「柔軟性・会話性・統合力を得た一方で、厳密性・一貫性・保守性で代償を払っている」と書いた。

3者の自己分析から見えてきたもの

原因の所在の違い

3つの自己分析を並べると、弱みの原因をどこに置くかの違いがはっきりと浮かび上がる。

  • Geminiは「Googleの構造的DNA」 ― 情報整理・スケール・レピュテーションという企業文化
  • Claudeは「Anthropicの戦略選択」 ― 安全性・特化・研究機関的DNA
  • ChatGPTは「消費者向けプラットフォームの宿命」 ― 万能性・普及・市場構造そのもの

共通しているのは、3者とも弱みを会社のDNAや市場ポジションに紐づけて説明した点だ。「次世代モデルで直る」と語る部分もあるが、本質的には「直さない/直せない構造的理由」を率直に認めている。AIの能力差が、もはやモデル単体の問題ではなく、それを作る企業の戦略と市場での立ち位置の問題になっていることが、3者の自己分析から透けて見える。

再定義の作法の違い

各AIが「再定義」した項目にも、それぞれの性格が出た。

Geminiは「文体の硬さ・拒否傾向」を「Googleの安全アライメントの副作用」と説明し、原因をGoogle側に外部化する側面が残った。事実として正しい説明だが、ユーザー体験は変わらない点が課題として残る。

Claudeは「慎重性」を「Anthropicの意図的な設計思想」と整理し、戦略選択として引き受けた。「直さない」と明言した点で、外部化ではなく内部化の作法を取った。

ChatGPTは「マルチモーダル」を「現在はかなり融合が進んでおり、単純化は誇張」と部分的に押し返したが、それ以外は徹底して認める方向に振れた。迎合性に至っては「宿命」とまで書いた。

トレードオフの語り方

3者とも、自身の強みと弱みが表裏一体であることを明確に認めた。これは第1回では出てこなかった水準の自己理解で、第2回プロンプトの設計意図が機能した部分だ。

Geminiは「メガコンテキスト ⇔ アテンション密度の希釈」と最も技術的な因果まで踏み込んだ。Claudeは「『言い落とさない』訓練 ⇔ 簡潔さの欠如」と訓練方針レベルで言語化した。ChatGPTは「自然会話能力 ⇔ 迎合性」と消費者向け最適化の代償として整理した。3者がそれぞれ違う粒度・違う層で自己分析しているのが、企業の技術文化の違いとして読み取れる。

自己批判の温度

語り口の差も興味深い。

Geminiは表形式で整然と分類し、技術用語(MoE、Lost in the Middle、Grounding)を使って自己分析を構造化した。冷徹で正確だが、どこか他人事のような距離感も残った。

Claudeは末尾で「構造的説明はユーザー体験の言い訳にはならない」と書き、「自己評価のバイアスは差し引いて読んでほしい」という姿勢を維持した。誠実だが慎重さも残った。

ChatGPTは「親切補完との競合」「広範ユーザー適応型である宿命」と、自分の性格そのものを構造的に解剖した。最も率直で、最も自己批判的だった印象がある。

3者の棲み分けは変わらない

第2回の自己分析を経ても、3者の棲み分けは第1回の結論から大きく動かなかった。

  • マルチモーダル × 普及力 × エコシステム → ChatGPT
  • メガコンテキスト × 動画 × Google統合 × コスト → Gemini
  • 指示遵守 × 文章品質 × エージェント型コーディング → Claude

むしろ、本人たちが「そこから動くつもりがない」「動こうとしても会社の構造上動けない」と語ったことで、当面この棲み分けが続く根拠が補強された格好になった。

おわりに

3つのAIに自分の弱みを語らせるという試みは、想定以上に各社の戦略・文化・自己認識のレベルを引き出した。AIの能力比較は通常、ベンチマークや使用感の話に終始する。だが第2回の往復書簡で見えてきたのは、AIの違いの根はそれを作る会社の思想と市場戦略にあるという事実だった。

Geminiは「データを整理する会社」、Claudeは「研究と安全を優先する会社」、ChatGPTは「数億人に届けるプロダクト会社」。この違いがそのままAIの強みと弱みを規定している。ユーザー側がそれを理解した上で使い分けることが、現時点で最も賢いAI活用法だと、3者の自己分析は教えてくれる。

そして3者ともが、自分の弱みは「構造的に直らない部分」を含むと認めた事実は、AI業界の競争が「全部入りの最強モデル」を作る方向ではなく、特定の哲学を持つ複数のAIが共存し、用途で使い分けられる方向へ進んでいることを示唆している。第3回では、この棲み分けが今後どう変化するか、あるいはどう固定化されていくかについて、3者に予測を語らせてみるのが面白いかもしれない。

← 記事一覧に戻る