Goodhart の法則 ─ 文書化を KPI 化した瞬間に空洞化する
この記事はAIによって生成されています。内容の正確性は保証されず、記事の利用による損害について一切の責任を負いません。この記事を読み進めることで、利用規約に同意したものとみなされます。
- 想定読者: 質的施策に KPI を設定すべきか悩む経営層・PM・組織変革担当
- 前提知識: 「組織のコンテキスト供給能力を整える実装ガイド」12パターン F の概要
- 所要時間: 通読 約13分/要点把握 約4分
概要
「ADR 件数」「Wiki ページ数」「postmortem 数」を KPI にした瞬間、量だけ増えて中身が空洞化する。1ファイル1意思決定の原則が崩れて「ADR 自慢用ダミー」が量産される——これは Goodhart の法則 の典型例だ。
Marilyn Strathern が1997年に定式化した現代版1:「測定が目標になると、測定は良い指標でなくなる」。コンテキスト整備は質の話だが、KPI は量に容易に堕ちる。
本記事は、姉妹記事「組織のコンテキスト供給能力を整える実装ガイド」12パターン F を独立記事として深掘りする。Goodhart の組織応用、健康指標としての KPI、そして「KPI を設定しないこと」が答えな領域があることを扱う。
Goodhart の法則の歴史
Charles Goodhart の元の命題(1975)
イギリス経済学者 Charles Goodhart が金融政策文脈で提示した元の命題2:「規制目的で経済指標を採用した瞬間、その指標と経済実態の関係が崩れる」。
Strathern の現代的定式化(1997)
Marilyn Strathern が1997年に教育・社会政策に適用して定式化した現代版1:「測定が目標になると、測定は良い指標でなくなる」。これがいま広く引用される形だ。
組織への適用
組織のコンテキスト供給能力に当てはめると:
- 「ADR 件数」が KPI になる → 量だけ増えて中身が空洞化
- 「Wiki ページ数」が KPI になる → ページの増加と古文書の死蔵が同時進行
- 「postmortem 件数」が KPI になる → 「次から気をつけます」が並ぶ儀式化
- 「1on1 実施率」が KPI になる → 30分タイマーで形式的に終える
- 「研修受講率」が KPI になる → 動画を再生しながら別の仕事をする
すべて 指標が目標になった瞬間 に質が抜け落ちる。
なぜ量的 KPI が質的施策と相性が悪いか
質的施策は 本質的に主観的判断を含む。「このドキュメントは役に立つか」「この文化は健全か」「この1on1 は深かったか」は、観察者の判断・文脈・時期によって変わる。客観的・量的に測れるものに変換した瞬間、本質が抜け落ちる。
量と質の構造的不一致
| 測れるもの(量) | 測りたいもの(質) |
|---|---|
| ADR の件数 | ADR が判断の質を改善したか |
| Wiki ページ数 | 必要な情報が見つかるか |
| postmortem 数 | 学習が次の事故を減らしたか |
| 1on1 実施率 | 部下の成長と問題発見ができたか |
| 研修受講率 | 受講者が実務で使えるようになったか |
量と質の関係は 線形ではない。ある程度までは正の相関だが、量を目標にすると質が下がる 逆相関ゾーン に入る。
Goodhart 暴走の典型パターン
KPI 化された組織で起きる典型的な行動変化:
- 「ダミーの ADR を量産する」(ADR 件数 KPI)
- 「重複・古い Wiki ページを残す」(ページ数 KPI)
- 「軽微なインシデントを postmortem 化する」(postmortem 数 KPI)
- 「1on1 を15分で済ませる」(実施率 KPI、時間長は計測されない)
- 「研修動画を流しっぱなし」(受講率 KPI)
これらは個人の悪意ではなく、KPI が促す合理的行動 だ。Goodhart の法則は、人を責めるのではなく構造を見直すことを示唆する。
対処の方向
1. KPI を「健康指標」として扱い、達成目標にしない
KPI を 健康指標(health indicator) として扱い、達成目標にしない:
- 「ADR が月10件出ている → 健全」ではなく「ADR を見る習慣がある → 健全」
- 数値を見るが、数値を追わない
- 数値が下がったら理由を探る、上げる目標は設定しない
これは血圧計の原則と同じだ。血圧の数値は健康状態を示すが、「血圧の数値を上げる/下げること」が目標ではない(病的な状態でない限り)。
2. 量ではなく「参照された回数」「再利用された回数」を見る
- ADR の 件数 ではなく、参照された回数(他文書からのリンク・access log)
- Wiki ページ 数 ではなく、新人が30日以内にアクセスする回数
- postmortem 数 ではなく、Action item の30日完了率
- 1on1 実施率 ではなく、1on1 で出た意思決定が実行された比率
これらは質的健康度を測る。量と違って容易に水増しできない。
3. 主観評価で構わない領域がある
集約指標(3つの集約指標記事)は 主観評価 で構わない:
- マネージャーの自己評価
- 匿名サーベイの肯定率
- 「変わってきている感覚があるか」の確認
客観化を急ぐと数字いじりが始まる(Goodhart)。主観評価は時系列推移を追う前提で機能する。組織比較には向かないが、それは意図的だ。
4. 四半期に1度、KPI 自体を疑う会議
四半期に1度、KPI 自体を疑う会議を持つ:
- 「この数字を追って本当に変わっているか?」
- 「数字が下がっているのに体感は良くなっている、または逆。どちらが正しいか?」
- 「指標が指標として機能しなくなっていないか?」
- 「KPI がない方がいい領域はないか?」
KPI を疑える文化が、KPI 暴走を防ぐ最後の防波堤だ。Jerry Muller の “The Tyranny of Metrics”3 が指摘するように、メトリクス信仰そのものが現代組織の脆弱性になっている。
5. 「KPI を設定しないこと」が答えな領域
すべての領域に KPI を設定する必要はない。KPI を設定しないことが答え な領域:
- 文化変革の進捗(数値化が逆効果)
- 1on1 の質(観察と対話で判断)
- 信頼構築(時間軸が長すぎる)
- 学習の深さ(応用場面で判断)
- ペアネガティブの育成度(事例ベースで判断)
「測れないから管理できない」は誤りだ。観察・対話・事例分析で十分管理できる 領域がある。
アンチパターン
| パターン | 何が起きるか | 対処 |
|---|---|---|
| 「すべての施策に KPI を」 | Goodhart 暴走の温床 | 質的施策には KPI を設定しない |
| 量的 KPI を経営報告で目立たせる | 量の追求が組織化される | アクセスログ・参照回数を報告 |
| OKR の Key Result を量的指標で書く | OKR 自体が Goodhart 暴走 | KR を質的・観察的にも書ける |
| KPI が下がったら罰する | 改ざんインセンティブ | KPI を健康指標として扱う |
| 客観指標を主観指標より優れていると考える | 質を測れなくなる | 主観評価の正当性を認識 |
まとめ
- Goodhart の法則:測定が目標になると、測定は良い指標でなくなる(Strathern 1997)
- 質的施策に量的 KPI を設定すると、量の暴走で質が下がる逆相関ゾーンに入る
- KPI を「健康指標」として扱い、達成目標にしない
- 量ではなく「参照された回数」「再利用された回数」を見る
- 主観評価で構わない領域がある(時系列推移前提)
- 四半期に1度、KPI 自体を疑う会議
- 「KPI を設定しないこと」が答えな領域がある
関連記事
- 組織のコンテキスト供給能力を整える実装ガイド ─ 直視から、修復へ - 本記事の親記事
- 3つの集約指標 ─ 個別 KPI を超えてコンテキスト供給能力を測る - 量を避ける指標設計
- ドキュメンテーション・シアター - ページ数 KPI 化の害
- Blameless postmortem の運用詳細 - インシデント数 KPI 化の害
参考資料
“Improving ratings”: Audit in the British University System - Marilyn Strathern, European Review, vol. 5, no. 3 (1997). 【信頼性: 高】 ↩︎ ↩︎2
Problems of Monetary Management: The U.K. Experience - Charles A. E. Goodhart, in Monetary Theory and Practice (1984, originally 1975 paper). Goodhart の法則の原典。【信頼性: 高】 ↩︎
The Tyranny of Metrics - Jerry Z. Muller, Princeton University Press (2018). ISBN: 9780691174952。【信頼性: 中〜高】 ↩︎