AI_ML_DL’s diary

人工知能、機械学習、ディープラーニングの日記

Deepfake Detection Challenge - 5

Deepfake Detection Challenge - 5

Identify videos with facial or voice manipulations

 

*今日は、400の動画から、各10枚の静止画像を抽出し、fakeファイルとtrueファイルに名前を付けて投げ込む。

・それがうまくいけば、次に、この2種類の画像をCNNで分類できるかどうか、試してみる。

・ここまでが第一ステップとなる。

 

*さて、昨日は進捗がなかったので、今日もこのページでプログラム作成を続ける。

・お手本は、F. CholletさんのDeep Learning with Pythonの、5.2 Training a convnet from scratch on a small dataset

*Listing 5.4  Copying images to training, validation, and test direction

・最初に作業用のdirectoryを作る。(catとdogを、trueとfakeにする。)

・base_dir

・train_dir, validation_dir, test_dir

・train_true_dir, train_fake_dir

・validation_true_dir, validation_fake_dir

・test_true_dir, test_fake_dir(今回、testは使わない)

 

*次は、動画から、画像を抽出して、各ホルダーに格納する。

・400の動画からtrueとfakeを同数取り込む。trueは77だから、trueは全部取り込んで、fakeは77だけ、取り込むことにする。両方で154使うことになる。

・trainとvalidationの数は、validationを約2割として、それぞれ、62と15にしよう。

・各動画から10枚ずつ取り込めば、train画像は1240枚、validation画像は300枚になる。

 

*まずは手作業で!

・ うまくいかないな!

 

<雑談>

・コーディングが進まず、雑談など書いている場合ではないのだが・・・。

・Aurélien GéronさんのHands-On Machine Learning with Scikit-Learn & TensorFlowの第2版、今のコーディング力を補うために、購入することにした。よく見るとタイトルが少し変更されている。Hands-On Machine Learning with Scikit-Learn, Keras, and TensorFlow(Kerasが追加されている)

・日本発のChainerが気になって、Google Scholarで検索したら、本家の方々による紹介記事があった。Chainer: A Deep Learning Framework for Accelerating the Research Cycle, S. Tokui et al., Preferred Networks, Inc., arXiv:1908.00213v1, 1 Aug 2019

・そういえば、半年くらい前に、Chainerのチュートリアルをコピーしたことがある。数学・統計等の基礎知識のパート以外は、Google Colabでjupyter notebook環境を使って学習できるようになっている。当時は気付かなかった。  

 

*予定の3日間が経ったが、だめだった。

*明日は、手作業でもなんでもよいので、小さなDNNで、trueとfakeの分類を学習させるところまでは、やっておきたい。

 

つづく 

 

f:id:AI_ML_DL:20200217080401p:plain

style=108 iteration=1

f:id:AI_ML_DL:20200217080500p:plain

style=108 iteration=20

f:id:AI_ML_DL:20200217080542p:plain

style=108 iteration=500