AI_ML_DL’s diary

人工知能、機械学習、ディープラーニングの日記

配列解析の勉強はDDBJから!

バイオインフォマティクス技術者資格の問題や内容に関して、機械学習、特にディープラーニングの内容にほとんど触れられていないのが気になったので、文献調査をして、いろいろ勉強し始めた。

しかしながら、バイオインフォマティクス分子生物学の基礎を知らないので、論文を読んでいても、上っ面しかわからない。

日本語でも用語の意味がわからないので、英文はもっと分かりにくい。もっとも、日本語の専門用語と言っても、配列解析においては、アルファベットやカタカナが多いので、わからないことはないが、そもそも意味が分かっていないものが多すぎる。

というわけで、昨日からは、配列解析に取り組んでいる。

学会公認のテキストの配列解析のセクションの最初は、データベースの説明である。

3-1 分子生物学データベース

国際的な公共の分子生物学データベース

表1に、代表的なDBのリストが示されている。

とりあえず、国際塩基配列DBのカテゴリの最初のデータベース、DDBJについて学びたいと思って、Googleで「DDBJ」と入力し、検索した。

そうすると、DDBJ - 国立遺伝学研究所、が最初に出てきたので、そこをクリックすると、生命情報・DDBJセンター、が現れた。

「検索・解析」が左上のいわゆるトップの位置にあるので、クリックしてみた。

とりあえず、知っている単語の「BLAST」(塩基配列による相同性検索)があったので、クリックしてみた。

そうすると、画面の左側に、テキストで見たblastn, blastp, blastxなどのプログラムが並んで表示されていた。

入力するものが無いので、前の画面に戻って、「BLAST」の「Help」をクリックしてみた。

検索に用いるデータベース、入力するパラメータなどの説明が示されていた。試験勉強に使っているテキストよりも詳しく説明されていて、わかりやすい。

ホーム画面に戻って、「講習会」をクリックすると、データベースや解析ソフトに関する講習会の案内があり、過去に開催された講習会の資料を見ることができる。

とにかく、「生命情報・DDBJセンター」のHP、すごくいいです。

機械学習ディープラーニングは、非常にオープンに進められているように思うが、バイオインフォマティクスの分野も、非常にオープンな雰囲気を感じる。分子生物学のデータベースは人類の共有財産である、ということですね。

10月3日追記

テキストの練習問題(出題H22)に、PSI-BLASTに関する記述があり、テキスト本文にも説明がある。しかし、DDBJの検索・解析メニューには出てこない。調べてみると、2010年3月にサービス終了となっている。FASTAも同時期にサービス終了している。

 

f:id:AI_ML_DL:20190930111831p:plain

style 002

 

f:id:AI_ML_DL:20191115100822p:plain

DeepDream