Anthropicの「自己訓練AI」爆発論：Jared Kaplanが警告する2027-2030年の分岐点

Posted Dec 4, 2025

28 min read

AI生成コンテンツ

この記事はAIによって生成されています。内容の正確性は保証されず、記事の利用による損害について一切の責任を負いません。この記事を読み進めることで、利用規約に同意したものとみなされます。

想定読者： AIの最新動向に関心のあるITエンジニア、AIシステム開発者
前提知識： 機械学習の基本概念、大規模言語モデル（LLM）の概要
所要時間： 20分

概要

2025年12月2日、AnthropicのChief ScientistであるJared Kaplan氏がThe Guardianのインタビューで、「自己訓練AI（self-training AI）」が引き起こしうる「知能爆発（intelligence explosion）」について警告を発した¹。Kaplan氏は、2027年から2030年の間に人類が「究極の決定（the biggest decision yet）」を迫られると指摘し、AIシステムが自律的に後継モデルを訓練するプロセスを許可するかどうかが、人類の未来を左右する分岐点になると主張している。本記事では、この主張の背景、技術的根拠、そして批判的見解を含めて詳細に解説する。

Jared Kaplan氏について

Jared Kaplan氏を理解するには、彼の学術的貢献から始める必要がある。

スケーリング法則の発見者

2020年1月、Kaplan氏はSam McCandlish氏、Dario Amodei氏（現Anthropic CEO）らと共に、「Scaling Laws for Neural Language Models」を発表した²。この論文は、AIモデルの性能がモデルサイズ、データセットサイズ、計算量とべき乗則（power-law）で相関することを実証し、現代のAI開発の方向性を決定づけた。

論文の主要な発見：

損失関数は7桁以上にわたってべき乗則に従う
より大きなモデルはサンプル効率が著しく高い
最適な計算効率は、大規模モデルを比較的少ないデータで訓練し、収束前に停止することで達成される

この発見は、「大きなモデルをより多くの計算資源で訓練すれば、予測可能に性能が向上する」という現代のAI開発の基盤となっている。Kaplan氏の学術的業績は120,000回以上引用されており、現代の深層学習研究で最も影響力のある論文の一つとなっている³。

AnthropicでのRole

Kaplan氏は現在、Anthropicの共同創業者、Chief Scientist、そしてResponsible Scaling Officerを務めている⁴。Responsible Scaling Officer（RSO）は、新しいモデルの危険性を評価し、安全対策を実施する責任を負う役職である。2025年5月には、Claude Opus 4をAI Safety Level 3（ASL-3）に分類する決定を下した⁵。これは、モデルがCBRN（化学・生物・放射線・核）兵器開発を支援する可能性があるという評価に基づいている。

自己訓練AIとは何か

現在のAI訓練パラダイム

現在のAIモデルは、主に以下のデータで訓練される：

人間生成データ: Webテキスト、書籍、論文など
合成データ（synthetic data）: AIが生成したデータ
強化学習フィードバック: 人間による評価やRLHF

flowchart TB
    A[人間生成データ] --> B[AI訓練]
    C[合成データ] --> B
    D[人間フィードバック] --> B
    B --> E[AIモデル]
    E --> F[出力]

自己訓練への移行

Kaplan氏が警告する「次の段階」は、このパラダイムの根本的な変化である。AIシステムが人間の介入なしに：

自ら後継モデルを設計する
訓練データを生成・選択する
報酬信号を定義する
モデルを訓練・評価する

flowchart TD
    A[AI Model v1] --> B{後継モデル設計}
    B --> C[訓練データ生成]
    C --> D[訓練実行]
    D --> E[AI Model v2]
    E --> F{さらなる改善}
    F --> G[訓練データ生成]
    G --> H[訓練実行]
    H --> I[AI Model v3]
    I --> J[...]

    style E stroke:#d29922,stroke-width:3px
    style I stroke:#d29922,stroke-width:3px

このプロセスが「再帰的自己改善（recursive self-improvement）」であり、各世代のAIがより賢い後継を生み出すことで、人間の理解を超えた速度で進化する可能性がある。

知能爆発の歴史的背景

I.J. Goodの1965年の予言

「知能爆発」の概念は、英国の数学者I.J. Good（ブレッチリー・パークで暗号解読に従事）が1965年に提唱した⁶。

「超知能機械を、いかに賢い人間よりもはるかに知的活動において優れた機械と定義しよう。機械の設計もこうした知的活動の一つであるから、超知能機械はさらに優れた機械を設計できるだろう。そこには疑いなく『知能爆発』が起こり、人間の知性ははるか後方に取り残されることになる。したがって、最初の超知能機械は人間が行う必要のある最後の発明である——その機械が十分に従順で、我々に制御方法を教えてくれる限りは。」

Goodは60年前に、まさにKaplan氏が警告している問題——制御の喪失——を予見していた。

技術的特異点との関係

知能爆発は「技術的特異点（technological singularity）」と関連するが、厳密には異なる概念である⁷：

知能爆発: AIの自己改善による急激な能力向上
技術的特異点: 技術進歩が予測不能になる転換点

Kaplan氏の主張は、知能爆発が技術的特異点を引き起こす可能性があるという点にある。

Kaplan氏の主張の詳細

3段階の発展予測

Kaplan氏は、AI開発を3つの段階に分けて説明している⁸：

Stage 1（2024-2025年）: AIは「スーパー外骨格」

エンジニアの作業を支援するツール
コード最適化、文書生成などの補助
人間が戦略的方向性を決定

Stage 2（2026-2027年）: AIは「自律的実験者」

機械学習実験を独立して設計
仮説を提案し、モデルアーキテクチャを調整
人間の指示なしで研究を進行

Stage 3（2027-2030年）: 再帰的自己改善

AIが後継モデルを自律的に訓練
人間の理解を超えた最適化手法
制御不能のリスク

知能爆発の二面性

Kaplan氏は、知能爆発には肯定的側面と否定的側面の両方があると指摘している¹：

肯定的側面（beneficial intelligence explosion）

医療発見の加速
サイバーセキュリティの強化
生産性の飛躍的向上
科学研究の加速

否定的側面（loss of control）

人間の価値観とのアライメント困難
予測不能な進化
権力の集中リスク
人間の agency（主体性）の喪失

「究極の決定」とは

Kaplan氏は、2027-2030年に人類が直面する決定を「the biggest decision yet（究極の決定）」と呼んでいる¹：

「自分より賢い存在を作り、その存在がさらに賢い存在を作るプロセスを想像してほしい。それがどこに行き着くか、まったくわからない。」

この決定の核心は：

AIの自己訓練を許可するかどうか
どのような安全装置を設けるか
誰がその決定権を持つか

タイムラインの根拠

Kaplan氏が2027-2030年という具体的なタイムラインを提示している根拠は複数ある⁸：

技術的収束

NVIDIAのGPUロードマップ: 次世代計算基盤の成熟
大規模計算クラスタ: OpenAIのStargateプロジェクトなど
合成データの成熟: 人間データから自己生成データへのシフト

タスクホライズンの拡大

METR（Model Evaluation and Threat Research）の2025年3月の研究によれば、AIモデルが処理できるタスクの長さ（タスクホライズン）は約7ヶ月ごとに2倍になっている⁹。Y Combinatorでの講演で、Kaplan氏はこのトレンドについて言及している¹⁰。

これは、現在は数時間のタスクを処理できるAIが、数年後には数日、数週間、数ヶ月にわたる複雑な作業を自律的に処理できるようになることを示唆している。

Anthropicの内部テスト

Kaplan氏によれば、Claudeは30時間連続で複雑なコーディングタスクを処理し、プログラマーの作業速度を2倍に向上させた事例がある¹。これは、Stage 2への移行が既に始まっていることを示唆している。

他の研究機関の見解

Google DeepMind

2025年4月、DeepMindの共同創業者Shane Legg氏らは、145ページのAGI安全論文を発表した¹¹。主要な主張：

AGIは2030年までに到達可能
再帰的AI改善は「現在のパラダイムで実現可能」
存在的リスク（existential risks）の可能性を認識
「Exceptional AGI」: 熟練した成人の99パーセンタイルに匹敵する能力

DeepMindは2025年5月にAlphaEvolveを発表した¹²。これはLLMを使用してアルゴリズムを設計・最適化する進化的コーディングエージェントで、自身のコンポーネントを最適化する能力を持つ。ただし、自動評価関数の必要性という制限がある。

OpenAI

OpenAIは、再帰的自己改善に近づくにつれて開発を慎重に進める必要性を認めている¹³：

「誰も、堅牢にアライメントし制御できない超知能システムを展開すべきではない。」

ただし、リスク評価には企業間で大きな差がある。2025年9月のAxios AI+ DC Summitで、Dario Amodei（Anthropic CEO）は「25%の確率で非常に悪い結果になる」と発言している¹⁴。一方、Sam Altman（OpenAI CEO）は具体的なP(doom)パーセンテージを公表していないが、2023年のAI絶滅リスクに関する声明に署名している。

批判的見解

知能爆発仮説には複数の批判がある。

技術的懐疑論

AI研究者のMatthew Guzdial氏は、再帰的自己改善の実現可能性に懐疑的である¹¹：

「それが機能するという証拠がない。」

François Chollet氏（Keras開発者）は、知能爆発の基本前提自体を否定している¹⁵：

「人間を超える問題解決能力を持つ『種AI』が出現し、突然の、再帰的な、暴走的な知能改善ループにつながるという基本前提は誤りである。」

より immediate な懸念

Oxford大学のSandra Wachter氏は、より immediate なリスクを指摘する¹¹：

「AIシステムが自身の欠陥のある出力から学習し、時間とともに不正確さを強化するフィードバックループの方が、より immediate な問題だ。」

規制の不備

Future of Life Instituteの2025年冬AI安全インデックスによれば、主要AI企業はいずれも存在的安全性で「D」以上の評価を得ていない¹⁶。

Stuart Russell教授（UC Berkeley）のコメント：

「私は、年間の制御喪失リスクを1億分の1に減らせるという証明を求めている。これは原子炉の要件と同レベルだ。代わりに彼らは、リスクが10分の1、5分の1、あるいは3分の1でさえあり得ると認めている。」

エンジニアへの示唆

現時点で意識すべきこと

AIツールの進化速度: Kaplan氏の予測が正しければ、2-3年以内に多くのホワイトカラー業務がAIに置き換わる可能性がある
安全性フレームワークの理解: AnthropicのRSP、OpenAIのPF（Preparedness Framework）など、主要企業の安全性ポリシーを理解することが重要
アライメント研究の動向: AIが人間の価値観と整合するかどうかは、技術的課題であると同時に、開発者としての責任でもある

技術的観点からの考慮事項

flowchart TD
    subgraph "現在のAI開発"
        A[人間によるモデル設計]
        B[人間による訓練管理]
        C[人間による評価]
    end

    subgraph "Stage 2への移行期"
        D[AIによる実験設計支援]
        E[人間の監督下でのAI訓練]
        F[AI-人間協調評価]
    end

    subgraph "潜在的リスク領域"
        G[自律的モデル設計]
        H[自律的訓練実行]
        I[自律的評価・改善]
    end

    A --> D
    B --> E
    C --> F
    D --> G
    E --> H
    F --> I

    style G stroke:#d29922,stroke-width:3px
    style H stroke:#d29922,stroke-width:3px
    style I stroke:#d29922,stroke-width:3px

国際的な規制の動向

Kaplan氏のタイムライン予測は、政策立案者に対して緊急性を訴えるものである¹⁷。推奨される対応：

計算資源の監視: 大規模訓練ランの追跡
輸出管理: 先端AI技術へのアクセス制限
安全基準の国際協調: 「最悪のアクターの incentive がリスクの下限を決める」レースダイナミクスの防止

2025年12月時点で、AI規制は「サンドイッチより規制が緩い」状態であるとの批判もある¹⁸。

まとめ

Jared Kaplan氏の警告は、AIの最前線で研究開発を行う科学者からの、エビデンスに基づいた問題提起である。

主要なポイント

タイムライン: 2027-2030年に、AIの自己訓練を許可するかどうかの決定が迫られる
技術的根拠: スケーリング法則とタスクホライズンの拡大に基づく予測
二面性: 知能爆発は人類に多大な恩恵をもたらす可能性と、制御喪失のリスクの両方を持つ
不確実性: 専門家間でリスク評価に大きな差がある
規制の遅れ: 現時点では、主要AI企業のいずれも十分な安全対策を実施していない

注意すべき点

Kaplan氏の予測は、現時点では仮説である。以下の点に留意すべきである：

スケーリング法則の限界: べき乗則がいつまで続くかは不明
技術的障壁: 再帰的自己改善には多くの未解決課題がある
社会的・政治的要因: 技術の進歩は社会的合意なしには進まない

一方で、Kaplan氏がAnthropicのResponsible Scaling Officerであり、Claude Opus 4にASL-3を適用するなど、具体的な安全対策を実施している点は、彼の警告が単なる悲観論ではなく、責任ある行動と結びついていることを示している。

ITエンジニアとして、私たちはこの技術的・倫理的課題に対して無関心でいることはできない。AIの開発と利用に携わる者として、安全性の議論に参加し、責任ある技術開発に貢献することが求められている。

引用の正確性について： 本記事で引用した情報源は、公式発表、査読前論文（プレプリント）、および信頼性の高いメディア報道に基づいています。Kaplan氏のGuardianインタビューは一次情報源として参照していますが、直接アクセスができなかったため、複数の二次情報源で内容を相互検証しています。各情報源の信頼性レベルを参考資料セクションに明記しています。

参考資料

本文中の引用番号に対応する参考資料を番号順に記載しています。

その他参考資料（本文中で番号引用なし）

Announcing our updated Responsible Scaling Policy - Anthropic (2024年10月). 【信頼性: 高】
Anthropic co-founder warns AI could design its own successor by 2030 - Storyboard18 (2025年12月). 【信頼性: 中】
Intelligence Explosion FAQ - Machine Intelligence Research Institute. 【信頼性: 中〜高】

The biggest decision yet: Jared Kaplan on allowing AI to train itself - The Guardian (2025年12月2日). 【信頼性: 高】※一次情報源。複数の二次ソースで内容を検証。 ↩︎ ↩︎² ↩︎³ ↩︎⁴
Scaling Laws for Neural Language Models - Kaplan, J., McCandlish, S., et al. (2020). arXiv:2001.08361. 【信頼性: 高】 ↩︎
Jared Kaplan - Google Scholar - Google Scholar. 【信頼性: 高】 ↩︎
Jared Kaplan: The 100 Most Influential People in AI 2025 - TIME (2025). 【信頼性: 高】 ↩︎
Activating AI Safety Level 3 protections - Anthropic (2025). 【信頼性: 高】 ↩︎
Recursive self-improvement - Wikipedia - Wikipedia. 【信頼性: 中〜高】※I.J. Goodの1965年論文への参照を含む。 ↩︎
Technological singularity - Wikipedia - Wikipedia. 【信頼性: 中〜高】 ↩︎
Humanity’s Final Choice in 2027 - 36Kr (2025年12月). 【信頼性: 中】※Kaplan氏の発言を詳細に分析。 ↩︎ ↩︎²
Measuring AI Ability to Complete Long Tasks - METR (2025年3月). 【信頼性: 高】※タスクホライズンの倍増トレンドに関する研究。 ↩︎
Scaling and the Road to Human-Level AI - Y Combinator / Anthropic (2025年6月). 【信頼性: 高】 ↩︎
DeepMind’s 145-page paper on AGI safety may not convince skeptics - TechCrunch (2025年4月). 【信頼性: 中〜高】 ↩︎ ↩︎² ↩︎³
AlphaEvolve - DeepMind - Google DeepMind (2025年5月). 【信頼性: 高】 ↩︎
AI progress and recommendations - OpenAI. 【信頼性: 高】 ↩︎
Anthropic CEO says AI models could become a risk to ‘critical systems of society’ - Axios (2025年9月17日). 【信頼性: 高】※Dario AmodeiのP(doom) 25%発言の一次報道。 ↩︎
The implausibility of intelligence explosion - François Chollet, Medium. 【信頼性: 中〜高】※専門家による技術的批判。 ↩︎
Future of Life Index grades AI labs poorly on existential safety - Axios (2025年12月3日). 【信頼性: 中〜高】※複数メディアで報道された調査結果。 ↩︎
AI Dispatch: Daily Trends and Innovations – December 3, 2025 - Hipther (2025年12月3日). 【信頼性: 中】 ↩︎
AI ‘less regulated than sandwiches’ as tech firms race toward superintelligence - Euronews (2025年12月3日). 【信頼性: 中〜高】 ↩︎

This post is licensed under CC BY 4.0 by the author.