Kaggleに挑戦-12
今日の課題:2D bounding boxを、画像に重ね書きすること。
その前に、ラベルデータをリストか配列にきっちり読み込んで、自在に加工できるようにしないとだめだな。
データのフォーマットが違うのか、pandasのread_csvはもちろんのこと、read_tableでも読めなかった。
ならば、readline()かleadlines()で読み込んで、配列に入れてみるか。
Pythonの知識不足のため、ただいま勉強中!
*Kaggleでは、考慮しない車をマスクした図が提供されている。このマスクを元の画像に重ねて考慮しない車を視界から消去するという方法が、Discussionで紹介されている。こういうコードは、今の自分では、書くのは難しい。1行、1命令毎に調べて理解していくしかない。この技術は必須だな。
*画像認識にはつきものの、画質調整が重要。視界不良とか、夕方とか、晴天、曇天などに対応できるように、data augmentationで、様々な処理をする。testデータに対しても、複数の処理をして、結果を平均することも重要かな。
*上位の人たちの議論のレベルの高さは、ハンパないな。非常に重要な議論がされているのが少しわかってきた。
*今の自分にとっては、下位の人やまだ結果が出てない人の質問や、それに対するコメントも重要だなと思うようになってきた。
*マイペースを決め込んで、地に足を付けて、着実に進歩することを目指しているが、新しく性能の高いモデルの開発も進んでいるようである。CenterNetは2019年の4月にaeXivから出版されたモデルであるが、このモデルを使った上位者がおられるようである。KITTIデータベースを用いたaverage orientation score (AOS)においては、自分が取り組んでいるモデルの方が性能が高いようであるが、KaggleのコンペはKITTIよりもラベルのデータ数が少なく、その場合には、CenterNetの方が性能が高いのかもしれない。いずれにしても、モデルを組み上げて収束させることが出来なければ、いつまでたっても机上の空論から抜け出せない。
*良い学習プログラムを作るためには、自分が、バランスよく学習しないとだめだな。
つづく