バイオインフォマティクス技術者資格の問題や内容に関して、機械学習、特にディープラーニングの内容にほとんど触れられていないのが気になったので、文献調査をして、いろいろ勉強し始めた。
しかしながら、バイオインフォマティクスや分子生物学の基礎を知らないので、論文を読んでいても、上っ面しかわからない。
日本語でも用語の意味がわからないので、英文はもっと分かりにくい。もっとも、日本語の専門用語と言っても、配列解析においては、アルファベットやカタカナが多いので、わからないことはないが、そもそも意味が分かっていないものが多すぎる。
というわけで、昨日からは、配列解析に取り組んでいる。
学会公認のテキストの配列解析のセクションの最初は、データベースの説明である。
3-1 分子生物学データベース
国際的な公共の分子生物学データベース
表1に、代表的なDBのリストが示されている。
とりあえず、国際塩基配列DBのカテゴリの最初のデータベース、DDBJについて学びたいと思って、Googleで「DDBJ」と入力し、検索した。
そうすると、DDBJ - 国立遺伝学研究所、が最初に出てきたので、そこをクリックすると、生命情報・DDBJセンター、が現れた。
「検索・解析」が左上のいわゆるトップの位置にあるので、クリックしてみた。
とりあえず、知っている単語の「BLAST」(塩基配列による相同性検索)があったので、クリックしてみた。
そうすると、画面の左側に、テキストで見たblastn, blastp, blastxなどのプログラムが並んで表示されていた。
入力するものが無いので、前の画面に戻って、「BLAST」の「Help」をクリックしてみた。
検索に用いるデータベース、入力するパラメータなどの説明が示されていた。試験勉強に使っているテキストよりも詳しく説明されていて、わかりやすい。
ホーム画面に戻って、「講習会」をクリックすると、データベースや解析ソフトに関する講習会の案内があり、過去に開催された講習会の資料を見ることができる。
とにかく、「生命情報・DDBJセンター」のHP、すごくいいです。
機械学習・ディープラーニングは、非常にオープンに進められているように思うが、バイオインフォマティクスの分野も、非常にオープンな雰囲気を感じる。分子生物学のデータベースは人類の共有財産である、ということですね。
10月3日追記
テキストの練習問題(出題H22)に、PSI-BLASTに関する記述があり、テキスト本文にも説明がある。しかし、DDBJの検索・解析メニューには出てこない。調べてみると、2010年3月にサービス終了となっている。FASTAも同時期にサービス終了している。