AI_ML_DL’s diary

人工知能、機械学習、ディープラーニングの日記

Kaggleエキスパートへの道

1. Kaggle: micro cource

2. Kaggle :

*Recursion Cellular Image Classification

・train、validデータの作り方がまだわからない。画像が6枚1組で、フォルダーが階層構造になっている。

・ファイルが大きいので、分割してトレーニングと予測をする必要があるかも。

*APTOS 2019 Blindness Detection

・コンペは終了したが、自分の戦いは終わっていない。

・スコアをもらえるプログラムを書こう!

・スコアが算出されない原因の1つは、予測結果が、プログラムを走らせるたびに大きく変わることではないかと思う。

・このコンペに関しては、トップをとるために必要なアイデアの多くは自分でも考えていたことであり、KaggleやGitHubからも学び、一部は実現できたが、大半は、プログラミング技術の不足により実現できなかった。

・根本的な問題もある。今のウインドウズベースのプログラミング環境では、インストールできない、インストール方法がわからないモジュール等があって、使えない技術がたくさんあることがわかった。

・当面は、Kaggleのkernelを使わせていただきながら、次の手を考えていくが、トップを目指すために、年内には、2080 Tiを搭載したUnix専用マシンを導入しようと思う。

3. Study:

*Hands-On Machine Learning with Scikit-Learn & TensorFlow by A. Geron

Deep Learning with Python by F. chollet

・Fine-tuning

4. バイオインフォマティクス技術者資格試験準備

*練習問題ばかりに目が行くと、過学習になりやすい。練習問題の3倍程度の知識獲得を目指そう!

*第6章 オーミクス解析

・遺伝子発現量データの解析に機械学習が用いられている。

微分方程式による遺伝子発現量の変動予測、固有値の分析によるシステムの安定性解析、ネットワークの構造とダイナミクス、などでは、微分方程式が用いられている。ここに、機械学習ディープラーニングを活用する余地があるかもしれない。

5. etc

*今日から、年内にKaggleエキスパートになること、が最優先課題であることを意識したタイトルに変える。

*Kaggleコンペで1位になるために何が必要かを24時間考え続ける。

・この日は本当に24時間考えたわけではないが、午前3時過ぎまで眠れず、ちょこちょこ起きだしてはテキストを見たり、データ構造を考えたり・・・。

 

f:id:AI_ML_DL:20190924003223j:plain

 

f:id:AI_ML_DL:20190924003039p:plain