Anthropic、AI学習で数百万冊の書籍を物理的に破壊していたことが判明

2025年06月27日

AnthropicがAI学習のため数百万冊の書籍を物理的に破壊していたことが裁判で明らかに
裁判所は破壊的デジタル化プロセスをフェアユースとして認定
海賊版使用については別途12月に裁判が予定されている

SEOの常識を覆す
AIライティングエージェント

プロフェッショナルの業務フローを完全再現するAIの活用で、飛躍的な品質向上とコストダウンの両立。「magicss」でAI時代のSEO＆AIOを実現してみませんか？

今なら 1記事無料で生成可能（カード登録不要）

最短3分で無料体験する

数百万冊の書籍を破壊する大規模なデジタル化作業

AI企業Anthropicが自社のAIモデル「Claude」の学習のために、数百万冊の物理的な書籍を破壊していたことが裁判所の文書で明らかになりました[1]。同社は大量の中古書籍を合法的に購入し、製本を解体して各ページをスキャンした後、元の書籍を廃棄するという破壊的なデジタル化プロセスを採用していました[2]。

この作業は系統的に行われ、製本の除去、ページの切断、そして永続的な破壊を含む大規模な作業でした[2]。Anthropicは主要な小売業者から書籍を大量購入し、希少本は対象外としていました。デジタル化された内容は社内で保管され、再配布は行われていませんでした。

同社は数百万ドルを投じてこの破壊的デジタル化プロセスを実行し、インターネットアーカイブが採用するような非破壊的な手法は使用しませんでした[2]。この手法は、AI学習データの需要に応える業界の実践を反映している一方で、倫理的な懸念も提起しています。

この事例は、AI開発における「データ取得のためなら手段を選ばない」という姿勢を象徴的に示しています。物理的な書籍を破壊してデジタル化する手法は、まるで金鉱から金を抽出するために山を削るような、資源を消費してデータを「採掘」する行為と言えるでしょう。技術的には非破壊的な方法も存在するにも関わらず、効率性を優先して破壊的手法を選択したことは、AI企業の価値観を問う重要な問題提起となっています。

裁判所がフェアユースとして認定した法的根拠

裁判所は、Anthropicの破壊的デジタル化プロセスを「変革的使用」としてフェアユースの範囲内と判断しました[3]。判決では、AI学習のための使用が直接的なコンテンツの複製とは異なる変革的な目的であることが強調されました[4]。

特に注目すべきは、物理的な書籍の破壊が非商業的意図の証拠として引用されたことです[5]。裁判所は、元の書籍を破壊することで、商業的な再配布の意図がないことが明確に示されると判断しました。この判決は、合法的なデータ取得と不正使用を区別する重要な先例となっています。

しかし、作家側はこのプロセスを創作物の「ストリップマイニング（露天掘り）」と批判し、創作者の権利が軽視されていると主張しました[4]。Anthropicは戦略的にGoogle Booksの元幹部を雇用し、同様のフェアユース判例を参考にしたデータ取得戦略を構築していました。

この判決は、AI時代における著作権法の解釈に新たな地平を開いています。物理的破壊が「非商業的意図」の証拠として認められるという論理は、従来の著作権概念を根本から覆すものです。これは、デジタル時代において「所有」と「使用」の境界線が曖昧になっていることを示しています。一方で、この判例がAI企業に「破壊すれば合法」という誤ったメッセージを送る可能性もあり、今後の類似ケースでの慎重な検討が必要でしょう。

海賊版使用問題と業界全体への影響

合法的に購入した書籍の使用については勝訴したものの、Anthropicは海賊版素材の使用について12月に別途裁判を控えています[4]。同社は当初、海賊版素材に依存していましたが、後に合法的な購入方法に移行したとされています[1]。

この事例は、AI業界全体における訓練データ取得の法的不確実性を浮き彫りにしています[5]。同じ地区の異なる判事が相反する判決を下すケースも見られ、AI学習における著作権法の適用について一貫した基準が確立されていない現状が明らかになっています。

業界では、出版社からのライセンス取得を回避しながら、プライベートなデジタルアーカイブを維持する手法が法的に認められたことで、他のAI企業も同様のアプローチを採用する可能性が高まっています[3]。

この判決は、AI業界における「グレーゾーン戦略」の成功例として記録されるでしょう。合法的購入と破壊的デジタル化を組み合わせることで、著作権者への対価支払いを最小限に抑えながら大量のデータを取得する手法が確立されました。しかし、これは創作者エコシステムにとって長期的な脅威となる可能性があります。書籍の物理的価値のみを支払い、その知的価値を無償で利用する構造は、持続可能な創作環境を損なう恐れがあります。