Deepfake Detection Challenge - 5

Identify videos with facial or voice manipulations

＊今日は、400の動画から、各10枚の静止画像を抽出し、fakeファイルとtrueファイルに名前を付けて投げ込む。

・それがうまくいけば、次に、この2種類の画像をCNNで分類できるかどうか、試してみる。

・ここまでが第一ステップとなる。

＊さて、昨日は進捗がなかったので、今日もこのページでプログラム作成を続ける。

・お手本は、F. CholletさんのDeep Learning with Pythonの、5.2 Training a convnet from scratch on a small dataset

＊Listing 5.4 Copying images to training, validation, and test direction

・最初に作業用のdirectoryを作る。（catとdogを、trueとfakeにする。）

・base_dir

・train_dir, validation_dir, test_dir

・train_true_dir, train_fake_dir

・validation_true_dir, validation_fake_dir

・test_true_dir, test_fake_dir（今回、testは使わない）

＊次は、動画から、画像を抽出して、各ホルダーに格納する。

・400の動画からtrueとfakeを同数取り込む。trueは77だから、trueは全部取り込んで、fakeは77だけ、取り込むことにする。両方で154使うことになる。

・trainとvalidationの数は、validationを約2割として、それぞれ、62と15にしよう。

・各動画から10枚ずつ取り込めば、train画像は1240枚、validation画像は300枚になる。

＊まずは手作業で！

・うまくいかないな！

＜雑談＞

・コーディングが進まず、雑談など書いている場合ではないのだが・・・。

・Aurélien GéronさんのHands-On Machine Learning with Scikit-Learn & TensorFlowの第2版、今のコーディング力を補うために、購入することにした。よく見るとタイトルが少し変更されている。Hands-On Machine Learning with Scikit-Learn, Keras, and TensorFlow（Kerasが追加されている）

・日本発のChainerが気になって、Google Scholarで検索したら、本家の方々による紹介記事があった。Chainer: A Deep Learning Framework for Accelerating the Research Cycle, S. Tokui et al., Preferred Networks, Inc., arXiv:1908.00213v1, 1 Aug 2019

・そういえば、半年くらい前に、Chainerのチュートリアルをコピーしたことがある。数学・統計等の基礎知識のパート以外は、Google Colabでjupyter notebook環境を使って学習できるようになっている。当時は気付かなかった。　

＊予定の3日間が経ったが、だめだった。

＊明日は、手作業でもなんでもよいので、小さなDNNで、trueとfakeの分類を学習させるところまでは、やっておきたい。

つづく