Kaggleに挑戦-36

Peking University/Baidu - Autonomous Driving

Can you predict vehicle angle in different settings?

＊1月21日の締め切りに向けて、お手本のプログラムコードを理解し、動かし、性能向上を図る。あと5日！

＊初級レベルの悪あがきかもしれないが、今日も1日、性能向上の手がかりを探す。

＊augmentation、うまくやる方法は、ないものか。

・効果のあるtransformであり、かつ、イメージとマスクと姿勢情報の相互関係を維持することができるようにしなければならない。

・イメージとマスクだけ関連付けても、姿勢情報が合わないと意味がない。

・fastaiのビデオレクチャーの肝は、テンソルのようだが、エクセルシートを使った説明は、非常に難しくて、お経を聴いているようだ。

・マスクは、イメージを縮小し、色情報がなく、位置情報のみ（2次元）。

・姿勢情報は、マスクの位置情報に、姿勢情報が追加されている（3次元）。

・位置情報（2次元）は、イメージもマスクも姿勢も、縮尺が違うだけで、相似形だから、transformによる回転、変形、切り取り、拡大縮小等を、イメージとマスクと姿勢の位置情報に対して、同時に作用させることは出来そうな気がする。

・さて、なんとなく、やるべきことが、見えてきたような気はするのだが、実際に、どのように、コーディングすればよいのだろうか。

＊コーディング方法がわからん。2次元の位置情報は、比例係数が違うだけなので、なんとかなりそうだと思っているが、本当にそうなのだろうか。RGB情報と、姿勢情報の次元をどう扱えばいいのだろうか。こういう書き方をすること自体が間違っているのかもしれない。

＊GitHubにあるProposal for extending transforms #230に、大きなヒントがあるように思うのだが、コーディングに至るまでの理解が出来ない。

＊明日は、Proposal for extending transforms #230、に集中して取り組む。

つづく

AI_ML_DL’s diary