Deepfake Detection Challenge - 5
Identify videos with facial or voice manipulations
*今日は、400の動画から、各10枚の静止画像を抽出し、fakeファイルとtrueファイルに名前を付けて投げ込む。
・それがうまくいけば、次に、この2種類の画像をCNNで分類できるかどうか、試してみる。
・ここまでが第一ステップとなる。
*さて、昨日は進捗がなかったので、今日もこのページでプログラム作成を続ける。
・お手本は、F. CholletさんのDeep Learning with Pythonの、5.2 Training a convnet from scratch on a small dataset
*Listing 5.4 Copying images to training, validation, and test direction
・最初に作業用のdirectoryを作る。(catとdogを、trueとfakeにする。)
・base_dir
・train_dir, validation_dir, test_dir
・train_true_dir, train_fake_dir
・validation_true_dir, validation_fake_dir
・test_true_dir, test_fake_dir(今回、testは使わない)
*次は、動画から、画像を抽出して、各ホルダーに格納する。
・400の動画からtrueとfakeを同数取り込む。trueは77だから、trueは全部取り込んで、fakeは77だけ、取り込むことにする。両方で154使うことになる。
・trainとvalidationの数は、validationを約2割として、それぞれ、62と15にしよう。
・各動画から10枚ずつ取り込めば、train画像は1240枚、validation画像は300枚になる。
*まずは手作業で!
・ うまくいかないな!
<雑談>
・コーディングが進まず、雑談など書いている場合ではないのだが・・・。
・Aurélien GéronさんのHands-On Machine Learning with Scikit-Learn & TensorFlowの第2版、今のコーディング力を補うために、購入することにした。よく見るとタイトルが少し変更されている。Hands-On Machine Learning with Scikit-Learn, Keras, and TensorFlow(Kerasが追加されている)
・日本発のChainerが気になって、Google Scholarで検索したら、本家の方々による紹介記事があった。Chainer: A Deep Learning Framework for Accelerating the Research Cycle, S. Tokui et al., Preferred Networks, Inc., arXiv:1908.00213v1, 1 Aug 2019
・そういえば、半年くらい前に、Chainerのチュートリアルをコピーしたことがある。数学・統計等の基礎知識のパート以外は、Google Colabでjupyter notebook環境を使って学習できるようになっている。当時は気付かなかった。
*予定の3日間が経ったが、だめだった。
*明日は、手作業でもなんでもよいので、小さなDNNで、trueとfakeの分類を学習させるところまでは、やっておきたい。
つづく