- 元OpenAI CTOのMira Muratiが設立したThinking Machinesがバッチ不変性問題を解決
- 標準モデルが80通りの出力を生成する中、同社技術は1000回の同一入力で完全一致を実現
- 処理速度を犠牲にしながらもAI安全性テストや科学研究分野で高い価値を提供
バッチ不変性がLLM非決定性の根本原因として特定
元OpenAIの最高技術責任者(CTO)であったMira Muratiが設立した新会社Thinking Machinesが、大規模言語モデル(LLM)の非決定性問題において画期的な発見を発表しました[1]。同社の研究チームは、これまでハードウェア関連のエラーが主因とされていたLLMの出力不安定性について、バッチ不変性が根本的な原因であることを突き止めました。
バッチ不変性とは、異なるバッチサイズで処理を行った際に数学的計算結果が一致しない現象を指します。従来のLLMでは、同じ入力データでもバッチサイズの違いによって微妙に異なる結果が生成されることがあり、これがモデルの予測可能性を著しく損なう要因となっていました[1]。Thinking Machinesの発見は、AI業界における長年の技術的課題に対する新たな視点を提供しています。
この発見の重要性は、料理のレシピに例えると理解しやすいでしょう。同じレシピでも、一人分を作る場合と十人分を作る場合で微妙に味が変わってしまうような現象が、LLMでも起きていたのです。Thinking Machinesは、この「分量による味の変化」を防ぐ技術的解決策を見つけたということになります。これにより、AIシステムの信頼性が大幅に向上し、特に医療診断や金融取引など、一貫性が重要な分野での活用が期待されます。
革新的なバッチ不変技術による完全一致の実現
Thinking Machinesが開発したバッチ不変版のLLMコア操作技術は、驚異的な一貫性を実現しています。同社がQwen-3-8Bモデルで実施したテストでは、1000回の同一入力に対して完全に同じ結果を出力することに成功しました[1]。一方、標準的なモデルでは同じテスト条件下で80通りもの異なる出力が生成されており、両者の差は歴然としています。
この技術的突破口は、バッチサイズに関係なく数学的計算の一貫性を保つことで実現されています。従来のLLMでは、処理効率を優先してバッチ処理を行う際に、微細な計算誤差が蓄積されて最終的な出力に影響を与えていました[1]。Thinking Machinesの解決策は、この根本的な問題に対処することで、LLMの信頼性を飛躍的に向上させています。
この成果は、まるで精密時計の製造技術のような革新です。従来のLLMが「だいたい正確な時計」だったとすれば、Thinking Machinesの技術は「原子時計レベルの精度」を実現したと言えるでしょう。特に注目すべきは、この一貫性が単なる偶然ではなく、技術的な設計によって保証されている点です。AI安全性の研究者にとって、同じ条件で必ず同じ結果が得られることは、モデルの動作を詳細に分析し、潜在的なリスクを特定する上で極めて重要な要素となります。
処理速度とのトレードオフが示す技術的現実
Thinking Machinesの技術は高い一貫性を実現する一方で、処理速度の低下というトレードオフが存在します[1]。バッチ不変性を保つための追加的な計算処理が必要となるため、標準的なLLMと比較して動作が遅くなることが確認されています。しかし、この速度低下は特定の用途においては許容可能な範囲とされており、特にデバッグ作業、AI安全性テスト、科学研究分野では精度が速度よりも重視される傾向があります。
同社の技術は、MLOps市場の急速な成長とデータセンターへの大規模投資という業界動向の中で注目を集めています[2]。企業レベルでの生成AI導入が加速する中、一貫性のあるAIシステムへの需要は今後さらに高まることが予想されます。Thinking Machinesの創設は2025年3月以前から業界で話題となっており、Apple社による買収の可能性まで取り沙汰されていました[3]。
この速度と精度のトレードオフは、自動車業界における「スポーツカー対トラック」の関係に似ています。スポーツカーは速いですが荷物をあまり積めません。一方、トラックは遅いですが確実に重い荷物を運べます。Thinking Machinesの技術は「確実性のトラック」と言えるでしょう。現在のAI業界では速度競争が激しいですが、実用的な企業システムでは「速いけれど予測不可能」よりも「少し遅いが確実」な方が価値が高い場面が多々あります。特に法的責任が問われる分野では、この一貫性は金銭的価値以上の意味を持ちます。
まとめ
Mira MuratiのThinking Machinesによる技術的突破口は、LLMの非決定性問題に対する根本的な解決策を提示しました。バッチ不変性の特定と解決により、AI業界は新たな信頼性の基準を手に入れることになります。処理速度の犠牲を伴いながらも、この技術は科学研究、AI安全性、企業での実用化において重要な価値を提供し、今後のAI開発の方向性に大きな影響を与えることが期待されます。
参考文献
- [1] Mira Murati’s Thinking Machines Achieves Major Breakthrough in LLM Nondeterminism
- [2] GenAI’s Silent Partner: The Underappreciated Role of Modern Data Infrastructure
- [3] Archive
*この記事は生成AIを活用しています。*細心の注意を払っていますが、情報には誤りがある可能性があります。