Predicting Molecular Properties-1
*今日から1週間程度の予定で、過去のコンペ、Predicting Molecular Properties、に取り組む。
*目的は、DNNがどのような課題に対して、どのように貢献できるのかを、実例を通して学ぶこと。
*概略
・このコンペの課題は、生体分子の構造やダイナミクスの研究に重要な役割を果たしているNMR(核磁気共鳴法)による解析において必須となる磁気的相互作用パラメーター、スカラーカップリングを、分子の3次元構造情報から正確に推定できるようなプログラムコードを作成することのようである。
・最新の量子力学を用いれば、分子の3次元構造情報から、スカラーカップリングを正確に計算することができるが、時間とコストがかかるので、短時間で安価に計算する手法が開発されることを期待しているということのようだ。
*関連文献調査-1
IMPRESSION – prediction of NMR parameters for 3-dimensional chemical structures using machine learning with near quantum chemical accuracy†
Will Gerrard, a Lars A. Bratholm, a Martin J. Packer,b Adrian J. Mulholland, a
David R. Glowacki *a and Craig P. Butts *a
Chem. Sci., 2020, 11, 508
・タイトルからは判断できないが、本文に次の記述があり、ニューラルネットワークを使うメリットはなく、KRRという手法をベースにした、IMPRESSIONというプログラムを開発したとのことである。
IMPRESSION uses a Kernel Ridge Regression37 (KRR) framework to learn the 1JCH scalar couplings and 13C and 1H chemical shifts of molecular structures. KRR was successfully used by Paruzzo et al. to develop SHIFTML.22 Neural networks have also been used to predict chemical shifts in small molecules from experimental data,6,38,39 however we found no clear advantages in using feed forward neural networks in this work as the accuracy was comparable to KRR for the datasets used, with the kernel methods being much faster to train with the given training set size.
・しかしながら、この記述にあるように、ニューラルネットは、小さな分子の実験データに適用したということであって、DFTなどの第一原理計算結果に対して適用したものではない。
・さらに、ニューラルネットを適用した例として引用されている論文は、2002年から2007年にかけて発表されたもので、DNNの夜明け前のことである。
・最近のDNNの動向に触れられていないので、この論文をしっかり読むかどうかは、もっと調べてから判断しようと思う。
*関連文献調査-2
Nuclear spin-spin coupling constants prediction based on XGBoost and LightGBM algorithms