Quantum-chemical insights from DTNN -3
*KaggleのテーマPredicting Molecular Propertiesと類似した内容であるが、Kaggleとは離れて、DTNNの本質に迫る。
・対象論文:K. T. Schütt et al., Quantum-chemical insights from deep tensor neural networks, nature communications 2017
*今日は、K. T. Schüttらの、ShuNetに関する2件の論文も含めて、DTNNを理解していきたいと思う。
*SchNet: A continuous-filter convolutional neurel network for modeling quantum interactions
*SchNet - a deep learning architecture for molecules and materials
*入力データ
・データベースCDB-7やCDB-9から、分子の情報を入力する。このときの1次情報は、構成原子の核電荷と構成元素の3次元座標
・構成元素の核電荷と3次元座標は、核電荷ベクトルZと原子間距離行列Dに変換される。
・核電荷ベクトルZは、次のようにcに変換される。
1. Assign initial atomic descriptors
・原子間距離マトリックスDは次のようにdに変換される。
2. Gaussian feature expansion of the inter-atomic distance
・さらに、cとdを用いて、原子間相互作用項vが導入される。
3. Perform T interaction passes
・とりあえず、次のステップへ。
4. Predict energy contributions
・最終ステップ
・5つのプロセスのうちの3番目のinteraction pass Tの意味がわからない。
*K. T. Schüttさんの学位論文があった。2018年5月25日付けである。
*学位論文のタイトル:Learning Representations of Atomistic Systems with Deep Neural Networks
・内容は、DTNNの論文と、2件のSchNetの論文と、2014年のHow to represent crystal structures for machine learning: towards fast prediction of electronic properties., の計4件の論文をまとめたもののようである。
・2014年の論文は、結晶のフェルミエネルギーにおけるDOS(状態密度)を予測するもので、結晶の表現方法に工夫があり、機械学習には、kernel ridge regression (KRR)を用いている。
・Chapter 1:ここでは、シュレーディンガー方程式や密度汎関数などが簡単に紹介されているので、用語に慣れることができる。
・Capter 2:Representing atomistic systems:分子の表現方法として、有機化学や分子生物学では化学式(キャラクターのみ)や化学構造式(直線や多角形とキャラクターの組合せ)が用いられるが、量子力学計算による物理化学的な量や物性値との相関が低いので機械学習の入力としては適切ではない。
・Uniqueness, Invariance, Equivariance, Differentiability, Cross-element generalizationなどを考慮する必要があるとのことで、Coulomb matrix, Many-body expansion, Chemical environments, などの項目を立てて議論されているがよくわからなかった。
・Chapter 3 : Deep tensor neural networks(DTNN):いよいよ本題に入ったが、学位論文を読むことで理解が深まるかどうか。
・論文とは違って、学位論文では、Tが強調された図面が2つ掲載されている。
・この2つの図をじっと見ていれば、Tのなんたるかが、少し分かった気になる。
・学位論文は、通常の論文よりも丁寧に説明されているし、文字も大きいので読みやすい。
*明日は、DTNNの計算の結果として得られている、Local chemical potential、の意味や、どのようにして得られるのかを理解しようと思う。
*その後で、SchNetについても学ぼうと思う。
つづく