ML不確実性定量化 — 理論と支配方程式
概要
機械学習の予測に「不確実性」があるって、どういうことですか?
CAEでMLサロゲートモデルを使うとき、予測値だけでなく「その予測がどれくらい信頼できるか」を同時に出力することが重要だ。不確実性定量化(UQ)は、予測に信頼区間を付ける技術で、意思決定の信頼性を担保する。
なぜCAEで特に重要なんですか?
安全率の設定や規格適合判定には予測値だけでなく誤差幅が必要だからだ。MLモデルが「この部品の最大応力は200 MPaです」と言うだけでは不十分で、「200 MPa ± 15 MPa(95%信頼区間)」と言えなければ設計判断に使えない。
不確実性の分類
不確実性にも種類があるんですか?
大きく2種類に分けられる。
- アレアトリック不確実性(偶然的不確実性): データ自体に内在するノイズ。測定誤差や製造ばらつきに起因する。データを増やしても減らない
- エピステミック不確実性(認識論的不確実性): モデルの知識不足に起因する不確実性。学習データが少ない領域で大きくなる。データを増やせば減らせる
数式ではどう分離するんですか?
MCドロップアウトやDeep Ensembleを使って分離する。$T$回のフォワードパスの予測を$\hat{y}_t$、各パスの予測分散を$\hat{\sigma}_t^2$とすると、
第1項はモデルパラメータの不確かさに起因する分散、第2項はデータノイズに起因する分散だ。
ベイズ推論の枠組み
ベイズ的なアプローチとの関係を教えてください。
厳密なベイズ推論では、パラメータ $\theta$ の事後分布 $p(\theta|\mathcal{D})$ を求め、予測分布を積分で計算する。
しかしこの積分は解析的に解けないので、MCドロップアウト(ドロップアウトをベイズ近似と解釈)やDeep Ensemble(複数モデルの予測分布で近似)を使う。ガウス過程回帰は自然にこの枠組みに収まるが、大規模データではスケーラビリティが課題になる。
AlphaFoldとCAE——AIが物理を理解する日
2020年、DeepMindのAlphaFoldはタンパク質の3D構造予測を「解決した」と宣言しました。50年来の難問を、物理ベースではなくデータ駆動で解いたのです。CAEの世界でも同様の革命が起きつつあります——PINNやFNOは「方程式を解く」のではなく「解のパターンを学習する」。ただし、AlphaFoldでさえ学習データの範囲外では精度が落ちる。AIは万能ではないことを忘れずに。
各項の物理的意味
- 保存量の時間変化項:対象とする物理量の時間的変化率を表す。定常問題では零となる。【イメージ】浴槽にお湯を張るとき、水位が時間と共に上がる——この「時間あたりの変化速度」が時間変化項。バルブを閉じて水位が一定になった状態が「定常」であり、時間変化項はゼロ。
- フラックス項(流束項):物理量の空間的な輸送・拡散を記述する。対流と拡散の2種類に大別される。【イメージ】対流は「川の流れがボートを運ぶ」ように流れに乗って物が運ばれること。拡散は「インクが静止した水中で自然に広がる」ように濃度差で物が移動すること。この2つの輸送メカニズムの競合が多くの物理現象を支配する。
- ソース項(生成・消滅項):物理量の局所的な生成または消滅を表す外力・反応項。【イメージ】部屋の中でヒーターをつけると、その場所に熱エネルギーが「生成」される。化学反応で燃料が消費されると質量が「消滅」する。外部から系に注入される物理量を表す項。
仮定条件と適用限界
- 連続体仮定が成立する空間スケールであること
- 材料・流体の構成則(応力-歪み関係、ニュートン流体則等)が適用範囲内であること
- 境界条件が物理的に妥当かつ数学的に適切に定義されていること
次元解析と単位系
| 変数 | SI単位 | 注意点・換算メモ |
|---|---|---|
| 代表長さ $L$ | m | CADモデルの単位系と一致させること |
| 代表時間 $t$ | s | 過渡解析の時間刻みはCFL条件・物理的時定数を考慮 |
AI×CAEはまだ発展途上の分野です。 — Project NovaSolverは、機械学習と従来型ソルバーの融合がもたらす可能性を探求しています。
次世代CAEプロジェクト:開発者と実務者をつなぐ
Project NovaSolverは、ML不確実性定量化を含む幅広い解析分野において、実務者の知見を最大限に活かせる環境の実現を探求しています。まだ道半ばですが、共に歩んでいただける方を募集しています。
開発パートナー登録 →