AI_ML_DL’s diary

人工知能、機械学習、ディープラーニングの日記

構造解析の勉強はPDBjから!

PDBjがどんなものか、アクセスしてみた。日本タンパク質構造データバンク、とある。

「生体高分子の立体構造データベースを国際的に統一化されたPDBアーカイブとして運営するとともに、様々な解析ツールを提供しております。」とある。

研究者向けであるが、一般向けのサイトも設けられている。

「タンパク質構造百科事典」というのがあるようだが、メンテナンス中となっている。

一般向けサイトに、「万見(よろづみ)プライム」というのがある。25種類の構造データが含まれており、リボソーム、細菌べん毛モーター、筋タンパク質、シャペロニン、口蹄疫ウイルスの殻、DNAなど、25種類の例がある。

一般向けということだが、25種類の中から「ヘモグロビン」を選んでクリックすると、ヘモグロビン分子がリボンモデルで3次元表示され、拡大縮小回転が自由に行え、ヘム構造もきれいに見える。また、空間充填モデルと球棒モデルにも切り替えることができる。さらに、用語の簡単な説明書きと、いくつかの重要なキーワードは、ウイキペディアペディアへのリンクが張られている。これだけでも十分なのだが、PDBデータベースへもリンクが張られており、研究者が使う構造データや詳細な技術資料を見ることもできるようになっている。 

テキストと違って、カラフルだし、構造モデルが立体的で、表示方法も変えられて、見ているだけで楽しくなるだけでなく、興味を惹かれたタンパクについて、PDBデータベースの中身を見ることができるのは非常にありがたい。

*PDBjデータベースに、実際に、アクセスしてみよう!

テキストの練習問題にあるアミノ酸配列を実際に入力してみることにする。H24問62の問題に示されているアミノ酸配列である。使ったのは、Sequence navigatorで、類似配列を持つPDBエントリーが検索によって表示される。実際に検索されて、最上位にエントリーされたのは、スコアが297で、E値は1.72967e-36であった。3j7z6というもので、非常に大きなタンパクであるが、分子量の順番に候補があげられているようで、最初の分子を選ぶと、入力したアミノ酸に相当する分子が表示された。問題に掲載されている通り、αヘリックスとβシートが2次元表示され、さらに、その3次元リボン模型も表示され、問題の図と一致した。

こんな使い方してよいのかなと思って、PDBjの利用規約を調べてみたが、問題なく使わせていただけそうである。

ディープラーニングを使って、新たな、もしくは、より高精度な探索方法を考えてみよう、という気になってきた。

そのためにも、これまでに先人たちが考えてきたこと、達成してきたこと、課題として残っていることなどを、しっかりと学んで理解していきたいと思う。

 

f:id:AI_ML_DL:20191002230124p:plain

style 154

 

f:id:AI_ML_DL:20191115083549p:plain

DeepDream