xiangze's sparse blog

機械学習、ベイズ統計、コンピュータビジョンと関連する数学について

チャーン類(特性類)と曲率の関係

長年気になっていたけどはっきりとは理解していなかったことを書きます。

特性類とは多様体(M)に対して計量のとりかた、変換に対して不変になる多項式の係数として定義され、コホモロジー群H^*(M,A) (Aは多項式の係数の体,*は任意の階数)の要素としても特徴づけられます。
係数となる体の種類に応じてEuler類、ポントリャーギン類(実数)、Stiefel-Whitney類,todd類などのものが知られています。
その中でもチャーン類は曲率形式と行列式を使って定義されます。

参考書で挙げた本では

  • 自然性
  • 直和(Whitney和)に対して積となること

などの公理と射影多様体からの構成的な方法で特性類とその値を定義、計算しているものが多いですが、曲率と不変多項式(行列式)を使った定義のほうがより直感的に感じました。
ですがなぜその定義で特性類の性質を満たせるかは式を追って納得しないといけません。

prompton.io

あっさりした導入

多様体Mに対し完全列
 0 \rightarrow Z \xrightarrow{i} A \xrightarrow{e} A* \rightarrow 0
(Aは複素関数の層(局所的には複素関数)、A*はゼロ点を持たない複素関数の層、eは指数関数写像、iは包含写像)
から得られるコホモロジー群の完全列
   H^1(M,A)  \xrightarrow{e}   H^1(M,A^*)  \xrightarrow{\delta}  H^2(M,Z)  \xrightarrow{i}  H^2(M,A)

の直線束(バンドル) E \in H^1(M,A^*)に対して \delta(E) \in H^2(M,Z)をチャーン類と定義する(完全列についてはへびの補題の写経 - xiangze's sparse blogも参照)。
これは抽象的すぎます。。。また一般の非可換なリー群Gの要素がMに作用する場合はより高次な項も定義できます。
prompton.io

曲率を使った説明

接続、接続形式

まずリー群Gの元aに対して左移動  L_a:G \rightarrow G, s  \mapsto as (s \in G) を定義します。
Gの単位元eに対してT_eを接空間、T*_eを余接空間(接空間双対)とすると
左移動に対して不変な微分1形式ω
 \omega_s=(L_s^{-1})*\omega_e すなわち
が定義できます。sの接空間T_sに対して恒等自己準同型をdsとすると
 \omega=(L_{s^{-1}})ds と書け、これを s^{-1} dsと略記します。
すると
 d \omega=-1/2[\omega,\omega]
と書くことができます(マウラー・カルタン方程式)

ここで多様体Mの各点にGの元が作用する様子を表すためにPという多様体からMへの射影πを考えます。M=P/Gとなります。
また z \in \pi^{-1}(U), a \in Gに対し s_U(az) =as_U(z)となるものとします。

リー群Gに属する演算子g∈Gとz∈Pに対して接続φを
 \phi(z) :=ds_Us_U^{-1}+\theta_U(x,s_U,dx) = ds_Us_U^{-1}+ad(s_U)\theta_U(x,dx)
と定義します。これは1-形式(微分形式)とみなせます。
ただし s_Uはs∈GをMの部分集合Uに制限したものです。
特にG=GL(q,C)(一般化線形群)の場合にはφは局所的な座標を変換する行列として行列 s_U,\theta_Uを用いて
 \phi =(d s_U +s_U \theta_U)s_U^{-1}
と書かれます(dは全微分です。)。このカッコ内の部分がリーマン幾何学でいう共変微分Dに相当します。

曲率形式

曲率2-形式Φは1形式φを用いて
 \Phi=d\phi -1/2[\phi,\phi]
と書かれ、ビアンキ恒等式
 d\Phi= -[\Phi,\phi] =[\phi,\Phi]
を満たします。リーマン多様体の場合はこれは曲率テンソルに相当しベクトル場X,Y,Zに対して
  D_X(D_Y Z) - D_Y(D_X Z) - D_{ [X,Y] } Z
と定義される3-1テンソルで書かれます。

不変多項式

リー環(リー代数)gの任意の要素a,bに対して随伴写像ad(a)を ad(a)b=aba^{-1}と定義すると

h次の多項式F(X)で
 F(X_1,X_2,...,X_h) = F(ad(a)X_1, ad(a)X_2, ..., ad(a)X_h)
となる多項式に対して
 F(X):=  F(X,X,...,X)
を不変多項式と呼び、それがなす環をI(G)とします。

不変多項式の具体例と一意性

行列式の各項が対称式となる性質から不変多項式をq次元行列Xに対し
 det(tI+ i/2pi X)=t^{q}+F_1(X)t^{q-1}+F_2(X)t^{q-2}+...+F_q(X)
(Iはq次元単位行列)
の各係数 F_i(X)が不変多項式となりG=GL(q,C)(q次元複素一般化線形群)の場合はこれがチャーン類です。

不変性の計算

定義が長くなりましたがF(Φ)が接続φのとり方によらないことを証明します。
異なる接続1形式 \phi_0,\phi_1
 \phi_t=\phi_0 + t \alpha  (\alpha  =\phi_1 -\phi_0)
 \Phi_t= d\phi_t +1/2 [ \phi_t,\phi_t ]
とおく。すると
 \Phi_t= \Phi_0 +t (d\alpha - [\phi_0,\alpha ] )-1/2 t^2[\alpha,\alpha ]
であることに注意すると
 \frac{1}{h} d/dt F(\Phi_t)= F(d\alpha-[\phi_t,\alpha ] ,\Phi_t,...,\Phi_t)
一方単純に微分するとビアンキ恒等式 d\Phi=-[\Phi,\phi ] =[\phi,\Phi]から
 d F(\alpha, \Phi_t,...,\Phi_t)= F(d\alpha, \Phi_t,...,\Phi_t)-(h-1)F(\alpha, [\phi_t,\Phi_t ], \Phi_t,...,\Phi_t)
となりFの不変性と引数の入れ替えから
 F([\phi_t,\alpha ],\Phi_t,...,\Phi_t)-(h-1)F(\alpha,[\phi_t,\Phi_t ],...,\Phi_t)
となり、上記2つの式から
 dF(\alpha,\Phi_t,...\Phi_t)=F(d\alpha,\Phi_t,...,\Phi_t)-F([\phi_t,\alpha ],\Phi_t,...,\Phi_t) = F(d\alpha-[\phi_t,\alpha ],\Phi_t,...,\Phi_t) =1/h d/dt F(\Phi_t)

 \frac{1}{h} d/dt F(\Phi_t)=d F(\alpha,\Phi_t,...,\Phi_t)
 F(\Phi_1)-F(\Phi_0)=hd\int_0^1 F(\alpha,\Phi_t,...,\Phi_t)dt
右辺は積分しているのでtに依らない。よって接続のとり方には依存しない■。

これによってコホモロジー類{F(Φ)}と不変多項式Fの間に準同型写像
 w:I(G) \rightarrow H*(M,R)
 w:F  \mapsto {F(\Phi)}

が定義できます。この準同型写像wをChern-Weil準同型と呼びます。
prompton.io

応用

素粒子物理学では量子異常と呼ばれる現象の理解に使われたり(参考書の)、物性物理学では端っこでだけ電気を通し、内部は絶縁体だったりするトポロジカル絶縁体という物質の性質の分類、伝導度の計算に用いられます。
人類の物質観を革新する「トポロジカル物質」、そのカギは時間や空間の反転にあり(長谷川 修司) | ブルーバックス | 講談社(1/4)

https://arxiv.org/abs/1904.00336

機械学習との関係で言えば例えば、圏論のところで書いたような構造や不変性を持ったデータの学習の性質をデータあるいはパラメーターの空間の特性類を使って説明できないでしょうか。逆に学習過程での幾何学的性質の変化に関して特性類が変化するようなことがあればどういった場合でしょうか。
prompton.io

感想

本を読むだけで何年もかかってしまいました。この数学は現実のきれいなところだけを抽出したもののようです。ですがそれが不純物を含む物性の理解に使われるのは興味深いです。
特性類絡みの発展的な研究はまだ探せていません。特異点を持つ多様体の話とかは面白そうです特異点を持った多様体の特性類
https://www.math.fsu.edu/~aluffi/publications/warsaw.pdf

About the geometry of Stein variational gradient descent. | FXV
最初にこの記事をみて計量g_hの定義に面食らったのが幾何学を復習しようとした理由の一つです。

What does 2022 hold for Geometric & Graph ML? | by Michael Bronstein | Towards Data Science
去年の記事ですが野心的です。特にグラフニューラルネット(GNN)の分野において対称性を保った学習、曲率などの微分幾何学的概念を使うことが有用であると主張しています。

prompton.io

参考書

難易度★★
IIの11章特性類の説明が最もわかりやすいです。
物理現象の理解をモチベーションとした本ですが、ファイバーバンドルとは何なのかとかI巻の最初から解説されているので長いですが順番に読んでいくのが良さそうです。するとtodd類などの他の高度な特性類についても理解できます。物理ではスピン群を使う必要があります。指数定理については一般論は事実だけ書いてあり特定の場合の証明(計算)が書かれています。

難易度★★
本編90ページ、付録50ページと短いです。
この本の5章と付録 特性類の幾何学のを写しました。本編では他に層とコホモロジーの基本から始まって複素多様体上のベクトルバンドル(束)(局所的には関数)について、ケーラー多様体の定義と性質、グラスマン多様体について書かれています。
リー群Gの特殊な場合であるq次の一般化線形群GL(q,C)の場合として行列式を用いた特性類の定義が書かれています。

特性類と曲率の関係の次にはF(Φ)=0の場合の二次不変量TF(Φ) (Tは転移作用素 の性質に関する議論があります。さらにガウスボンネの定理、ケーラーポテンシャルが定義できる場合のFubini-Study計量が与えられることの抽象的な記述などがコンパクトに議論されています。

あとがきで書かれている通り最近の複素多様体の本はHodge-小平の調和積分論(ポテンシャル論)偏微分方程式の知識が必要だがそれを省いたので短くできたそうです。ポテンシャル論は特性類よりは直感的でわかりやすく消滅定理の理解には必須なのですが証明を全部追えていません。

難易度★★★★
公理的定義で各種特性類の定義と計算 双対コホモロジー
巻末に「複素多様体講義」と同様幾何学的立場からの特性類の導入が書かれていますがここに書いた証明に対応する部分は結構飛躍があるように思えます。「曲線と曲面の微分幾何」を超圧縮したような内容になっています


英語版PDFhttps://aareyanmanzoor.github.io/assets/books/characteristic-classes.pdf
この本を26歳で書かれたというのは本当に驚くべきことです(のちにフィールズ賞受賞)

難易度★★★★★
最後の最後で特性類と幾何学の話がでてそこまではほとんど微分形式とコホモロジー群の代数的な計算で構成されておりでさらに抽象的です。
英語版PDFhttps://www.maths.ed.ac.uk/~v1ranick/papers/botttu.pdf

prompton.io

広告

prompton.io
https://prompton.ioではAIイラストを描いてほしい、描きたい人を募集しています。