この壁をぶち破らないと、仕事にならない。
それは、教師データを作ること。
Xとyのペアだ。
データとラベルだ。
何てことないはずだ。
テキストで勉強して、簡単にできると思っていたのだが、つまづいている。
学校のテストで100点をとっても、実社会での問題が解けるとは限らない。
学位をもらったからって、すぐに新たな論文が書けるわけではない。
そういうレベルの話ではないかもしれない。
ほんのちょっとしたことかもしれない。
ちょっとひねられると、手も足も出ない。
ということは、基本動作が身についていないということかもしれない。
テキストのXとyに直結するところから復習してみる。
テキストは、これくらいのことはわかっている筈、というスタンスで書かれているようだ。で、役に立たなかった。
今日、まさに求めているものを主題にしたブログとGitHubへの投稿を見つけた。しかし、3年前のプログラム環境が前提で、かつ、レベルが高すぎて、付いていけない。
APTOS 2019 Blindness Detectionのコンペが終了して、多くのプログラムが公開されているので、そこから学ばせていただくことにする。
Kaggleグランドマスターが遥かかなたに見える。いや、遠すぎて見えない。
9月23日
・やっと、初級レベルのXとyを作ることができた。
・pandasがちょっと使えるようになり、cv2.imreadをちょっと使って、for code in train_df["id_code"]:としてイメージデータを読み込んで、numpyで変換して・・・。
・とりあえず、ちょっとだけ、前進した。
・siRNAの検出には、全く違う難しさがあるが、あと3日で、できるだけ前に進もう。