AI_ML_DL’s diary

人工知能、機械学習、ディープラーニングの日記

燃料電池の技術

西川尚男著 燃料電池の技術 東京電機大学出版局 2010年6月10日第1版1刷

ちょっと古いかなとは思うのだが、サブタイトルが、「固体高分子形の課題と対策」となっていて、当時の研究課題を知ることができるので、この12年間の進展を把握するための出発点とすることができそうである。(購入動機:上司の薦め)

 

第1章 資源の枯渇と地球温暖化問題

 

第2章 燃料電池の基本

2.1 燃料電池の原理と種類

2.2 燃料電池の理論効率と理論起電力

2.2.1 理論効率

ΔH=ΔG+TΔS

ΔHはエンタルピー変化、ΔGはギプス自由エネルギー変化、TΔSは温度とエントロピー変化の積。電気化学反応の場合、TΔSは熱として周囲に放出されるエネルギーである。

理論効率は(ギブス自由エネルギー変化ΔG÷エンタルピー変化ΔH)である。

2.2.2 理論起電力

理論起電力=ー(ギブス自由エネルギー変化÷nF)

2.2.3 高位発熱量HHVと低位発熱量LHVで表示した理論効率と理論起電力

温度によってギブス自由エネルギー変化もエンタルピー変化も変化するため温度によって理論効率も理論起電力も変化する。

 

第3章 固体高分子形燃料電池PEFC)のセル・スタック構成と水管理

3.1 PEFCのセル・スタック構成

3.1.1 触媒

(1)触媒担持体と触媒層

 PEFCの理論起電力は1.23 Vと高いが、電流を流すとセル電圧は低減する。小さい電流密度領域で実測されるセル電圧と理論起電力との差を活性化過電圧といい、活性化過電圧を小さくして、セル電圧を高めるために白金触媒が使用されている。

 白金触媒の粒径は1 nmから5 nmで、その比表面積は50 m2/gから200 m2/gであり、触媒担持体(カーボンブラック)の10 重量%から50 重量%の範囲で付着されている。 

(2)カソード触媒とアノード触媒

(3)新触媒の開発

 白金触媒量の低減、合金触媒を含めた耐久性の向上、白金に替わる代替触媒の開発

 触媒層内へのイオノマーの含浸量の最適化による触媒利用率の向上

 ガス拡散性ならびに水分排出の最適化

 膜の薄膜化による膜抵抗の低減

 触媒の微粒子化、コアシェル化、粒径の単分散化、合金化、表面原子構造の最適化

 脱白金触媒、カーボンアロイ触媒

3.1.2 高分子膜

 電解質膜の模式図とミクロ構造

 クラスター構造と水の移動

3.1.3 セパレータ

3.2 水管理

3.2.1 セル内水分移動

 加湿されたガスをセルに供給

 電気浸透水と逆拡散水

3.2.2 並行流と対向流

3.2.3 加湿方式

 

第4章 セル性能

4.1 セル性能の向上

(1)高分子膜厚さとEW値の低減

 EW:交換基当量重量(スルホン酸基1モル当たりの乾燥状態のナフィオン(プロトン型)のグラム数)

(2)触媒の微粒子化および高分散化

 触媒は粒径が1 nmから5 nmの白金触媒を10 nmから100 nmの粒状の触媒担持体であるカーボンブラックの上に付着させて形成される。

 白金触媒の比表面積が大きいほど触媒の活性は高まるので、担持体の表面積の大きいカーボンブラックの上に微粒子化された白金触媒を高分散化させるのが望ましい。

(3)触媒層へのイオノマーの含浸

 プロトン伝導性とガス拡散性のバランス

4.2 セル電圧特性

4.2.1 運転圧力特性

(1)加圧化によるセル電圧の上昇

(2)セル温度上昇の課題と解決策

 水蒸気分圧と水素や酸素分圧とのバランス

4.2.2 セル運転温度特性

4.2.3 利用率特性

燃料流量のセル電圧特性への影響を燃料利用率特性という。

燃料利用率:水素を燃料としたとき、セル内で発電により消費される水素量をセル入り口の水素量で除した値。

(1)燃料利用率特性

 (a)改質ガスを用いた燃料利用率特性

 (b)純水素を用いた燃料利用率特性

 純水素を燃料とする場合、排出される水素は燃料の損失となり電池効率の低下につながるため、排出水素量を極力減らす高燃料利用率運転か、電池からの排出水素を電池のアノードへ戻し、再度セル内で利用するアノードリサイクル運転が行われている。

(2)空気利用率特性

 (a)一般的な空気利用率特性

  空気利用率が増大するとセル内の酸素濃度が下がりセル電圧は低下する。

  とくに電流の大きい領域でセル電圧低下が著しい。

 (b)加湿温度変化時の空気利用率特性

4.2.4 加湿特性

PEFCは一般的に高加湿条件で運転する。

4.2.5 一酸化炭素の影響

 

第5章 セル劣化

 

5.1 触媒劣化

5.2 電解質膜劣化メカニズム

5.3 カーボン劣化

 

第6章 セル診断技術

6.1 サイクリックボルタンメトリー測定法(CV法)

6.1.1 測定原理

ある一定の電位掃引速度で、参照電極の電位を基準に作用電極に電圧を印加すると、参照電極と作用電極の間に電流が流れ、その結果作用電極で酸化・還元反応が起こる。

(Pt/C触媒では、電圧を0 V付近から1 V付近まで掃引すると、最初に水素脱離ピークが生じ、次にPtの酸化ピーク(酸素吸着)が生じる。続いて1 V付近から0 V付近まで掃引すると、Pt酸化物の還元ピーク(酸素脱離)が生じ、次に水素吸着ピークが生じる。)

6.1.2 測定方法と結果の評価

有効白金触媒表面積は、S=Q/2.1 m^2

(図6.3に、4種類の担持体のCV曲線が示されているが、本文の説明と対応していないように思う:グラファイトカーボンとブラックパールの線が入れ違いに?)

6.1.3 CV測定による触媒劣化の診断

単セルの起動停止試験終了後、活性化分極が38.5 mV増大し、カソード触媒の表面積は運転初期の25 %まで低下したという結果について検討した内容が示されている。

 セル電圧の低下 ΔV=blog(S/S0):bはターフェル勾配

電気化学的表面積の低下(S0S)は、起動停止試験終了後の触媒粒子の粒径増大を伴っている。触媒粒子の溶解や担持体からの脱離も電気化学的表面積減少の要因であろう。

6.2 分極分離手法

6.2.1 活性化分極、拡散分極、抵抗分極

活性化分極:酸素還元反応の寄与が大部分を占める:触媒性能の向上が低減に寄与

抵抗分極:電解質膜、ガス拡散電極、セパレータ、集電板などの抵抗による電圧低下

拡散分極:生成水の増える高電流密度領域で増える:反応ガスの拡散・反応の阻害による

(a)電流密度の小さい領域のセル電圧特性

低電流密度領域のセル電圧は直線的に変化し、このセル電圧の傾斜をターフェル勾配と呼ぶ。図6.7の場合のターフェル勾配は60 mV/decadeである。

ターフェル勾配の延長線と理論起電力との交点の電流密度を交換電流密度(exchange current density)とよび、その値は10^-8 A/cm2から10^-9 A/cm2である。

 

第7章 加速試験方法

燃料電池の開発をスピードアップさせるには、短時間で寿命予測が可能な加速寿命試験方法の開発が望まれる。

7.1 要素レベルの加速試験

7.2 ショートスタックを用いた加速試験

7.3 実セルレベルの加速寿命試験

 

第8章 PEFCの適用(自動車用と家庭用燃料電池

8.1 自動車への適用

 

8.2 家庭用燃料電池

 

 

 

 

 

 

 

 

 

style=188, iteration=360

 

固体ー構造と物性

固体ー構造と物性 金森順次郎・米沢富美子・川村清・寺倉清之著 岩波書店

2001年3月15日第1刷発行

 

2022/9/4

ナノ粒子の分析をしていて、基礎的なことを知らないことに気付いたので、書棚に眠っていた本書を取り出して読んでいる。

ナノ粒子に関する節があったのでそこを読んでみた。

 

7-5 超微粒子の結晶構造

金属超微粒子の構造については、1960年代に名古屋大学のグループによって徹底的に研究されたとのこと。ほとんどの金属超微粒子の結晶構造はバルクのものと同じであるが、バルク結晶なら高温相でのみ現れるはずの結晶構造が室温の超微粒子で見られることが多いとのこと。

紀本和男氏による1967年の論文から引用したCrナノ粒子の研究例があり、ナノ粒子ではバルクでは見られないA15型結晶構造となり、外形が5角形となっている。

界面張力と表面積の積が最小になるというGibbsの理論とその条件によって決まる多面体はWulffの多面体というとのこと。

 

 

style=187, iteration=1000

 

第一原理計算をやってみよう!20220614

20220614 第一原理計算をやってみよう

参考書:前園 涼/市場 友宏著 動かして理解する 第一原理状態計算

 

機械学習/ディープラーニングによって第一原理計算の高速化や高精度化を図るということを体験したいと思っているのだが、全く進んでいない。

今回取り上げるのは機械学習を全く含まない純然たる第一原理計算である。

まずこれを知らないとダメだろうということもあるが、今回このテキストを使ってみようと思ったのは、どうしても自分で計算してみたいことがある、パソコンでどこまでできるか知りたい、できればこの延長線上で大型計算機も使えるようになりたい、というのが最も強い動機である。

 

2022/10/01追記

昨日、参考書の3章から5章まで通読した。第一原理計算の骨子はぼんやりとではあるが把握できたように思う。

 

付録B ターミナル環境設定の詳細(Windows版)

B.1~B.3のターミナル環境設定はクリヤできた。

B.4~B.5のインストールも最後まで進んだが、

最後の描画は表示されなかった。

gnuplot> plot x

ここで止まったままである。

推測では、作業ディレクトリの準備で、入力できていないコマンドがある、という可能性がある。テキスト通りに進まず、エラーが表示されたときに、エラーに対する処置が適切に行えなかったことが描画できない原因となっている可能性がある。

 

2.2.3 教材セットの入手と配置

 

2022年7月7日:ここで止まったままである。

 

目の前に、1998年の論文がある。

"Effect of Strain on the Reactivity of Metal Surface"

原子や分子の吸着エネルギーが表面原子のcompressiveもしくはtensile stressによってどう変化するかをDFTによって計算し、最後にd-band centerとの相関が示されている。

 

2022年の論文を見ると、PtNiCoのナノ粒子をうまく調製すれば、Pt/Cの10倍以上の酸素還元活性を実現できているようだ。

 

酸素還元反応であれば、酸素ガスがカソード電極の背面から供給され、プロトンが高分子電解質膜から供給され、電子がカーボン担体から供給される。反応中間体は触媒表面近傍でどのような配置をとるのだろうか。吸着するのはOかOHかOHの場合Pt側はOかHかなど、よくわからない。実時間スケールでどのようなことが起きているのかを知りたいのだが、分子動力学の計算が必要になるのか。時間変化が追えなければ意味がなさそうだ。反応速度と反応機構を知りたいのだが、計算機の中でそれをどのようにすれば実現できるのだろうか。ダイナミックに捕えなければ意味がなさそうだ。カソード触媒表面近傍に供給された酸素ガスとプロトンと電子からH2Oが発生する様子を再現して反応速度を調べるためには、どうすればよいのだろうか。

PtNi、PtCo、PtNiCoなどでは、表面近傍の原子配列や電子状態がPt原子であってもその近傍の原子と位置によって異なると思うのだが、どうやれば原子配列構造を再現し、反応の様子を再現することができるだろうか。

 

2022/9/3

プログラムを動かしながら学ぶつもりだったが、情けないことに、インストールの途中で止まったままだ。

とりあえず、先に進んでみよう。

 

第3章 計算の一連の流れ

3.1 自己無同着計算という計算プロセス

3.2 インプットファイル群の準備

3.2.1 物質構造をどう準備するか

cif形式」⇒ VESTA ⇒ cif2cell ⇒ Quantum Espresso

3.2.2 物質構造ファイルの入手

3.2.3 構造ファイルの書式変換

3.2.4 擬ポテンシャルの準備

ウイキペディアから引用

「擬ポテンシャル(ぎポテンシャル、英: pseudopotential)は、第一原理計算において原子核近傍の内核電子を直接取り扱わず、これを価電子に対する単なるポテンシャル関数に置き換える手法である。これは原子間結合距離など、多くの物性において、内核電子の直接の影響が小さいことを利用したものである。平面波基底を用いて第一原理計算を行う場合、計算コストの問題から、何らかの擬ポテンシャルを使う場合がほとんどである。

有効内核ポテンシャル(英: effective core potential, ECP)とも呼ばれる。

こうした擬ポテンシャルは、内核電子が与える静電相互作用や交換相関相互作用とは全く無関係に、原子核から或る半径よりも外側では、波動関数が全電子計算の結果と一致することだけを指針に作成される。そのため平均場近似といった物理的な近似や洞察を含むものではなく、あくまでも計算のための便宜的な手法といえる。価電子帯の波動関数は、原子核近傍で同径方向に節(ノード)を持つが、擬ポテンシャルを作製する際には、こうした節を取り除き、滑らかな波動関数となるように問題をすり替える。このため、擬ポテンシャル法により得られる波動関数(密度汎関数法に用いる場合はKohn-Sham軌道)は擬波動関数と呼ばれることもある。こうした操作が、カットオフエネルギーの大幅な削減へと繋がる。」以上、ウイキペディアから引用

3.3 自己無撞着計算

3.3.1 計算の準備

3.3.2 自己無撞着計算の実行

3.3.3 自己無撞着計算の結果チェック

3.4 手早くプロットして確認する

3.5 電子構造の算定

3.6 分散図描画

3.7 クイック・チェックとしての物性計算

3.8 補遺:κ点パスの生成

 

第4章 計算条件の決定

4.1 計算条件の決定とは何か/なぜ重要なのか

4.2 計算分解能の決定

4.2.1 κメッシュ

4.2.2 エネルギーカットオフ

4.3 擬ポテンシャル選定による予見差異

4.4 交換相関ポテンシャル選定による予見差異

 

4.5 計算条件が予見に及ぼす影響 

 

第5章 第一原理解析の理解に関する勘所

5.1 カーネル計算の位置づけ

5.2 カーネル計算の勘所

5.3 密度汎関数法の概略:交換相関ポテンシャルの理解に向けて

5.4 擬ポテンシャル

5.5 基底関数系

5.6 ソフトウエアパッケージの選択指針

5.7 補遺:SCF収束の調整

 

第6章 さらなる展開へ

6.1 シミュレーション協働実務の進め方

6.2 自分の興味ある系への適用に至る道筋

6.3 マテリアルズインフォマティクス

6.4 ハイスループット化とワークフロー化

・量子モンテカルロ法電子状態計算

6.5 マテリアルゲノムへ

 

 

 

 

style=186, iteration=500

 

Expert SystemからLearning systemへ

機械学習は、どう使うのか、どう使われているのかを、日々、考え、調べ、学んでいる(つもりである)。

 

機械学習はさまざまな分野で用いられているが、機械学習を用いることによって得られた成果は、高解像度、高速、自動化、高精度化、分類、などでAI/AGIというほどのものではなく、見慣れてしまっているものが多い。

 

しかしながら、PauliNet, FermiNet, AlphaZero, AlphaFoldなどは、レベルが違っているように感じる。その仕組みを理解し、そのアルゴリズムを使ってみたいと思う。さらに、N. Artrithらがナノ粒子表面のDFTシミュレーションを機械学習を使って精密化している研究成果なども、実際に使ってみたいと思っている。

 

一昨日から、Using AI to accelerate scientific discovery - Demis Hassabis (Crick Insight Lecture Series)、のビデオを聴講している。

AlphaFoldは”32 component algorithms and 60 pages of SI”と説明されている(SI:supplemental information)。約20名が5年間をかけて開発しており、domain knowledgeを用いているので、AGIではないと述べている。

 

どのようなものなのか、論文をみてみよう。

Highly accurate protein structure prediction with AlphaFold

John Jumper et al., Nature, Vol 596, (2021) 583

 

Fig. 3

Training with labelled and unlabelled data
The AlphaFold architecture is able to train to high accuracy using only supervised learning on PDB data, but we are able to enhance accuracy (Fig. 4a) using an approach similar to noisy student self-distillation35. In this procedure, we use a trained network to predict the structure of around 350,000 diverse sequences from Uniclust3036 and make a new dataset of predicted structures filtered to a high-confidence subset. We then train the same architecture again from scratch using a mixture of PDB data and this new dataset of predicted structures as the training data, in which the various training data augmentations such as cropping and MSA subsampling make it challenging for the network to recapitulate the previously predicted structures. This self-distillation procedure makes effective use of the unlabelled sequence data and considerably improves the accuracy of the resulting network. Additionally, we randomly mask out or mutate individual residues within the MSA and have a Bidirectional Encoder Representations from Transformers (BERT)-style37 objective to predict the masked elements of the MSA sequences. This objective encourages the network to learn to
interpret phylogenetic and covariation relationships without hardcoding a particular correlation statistic into the features. The BERT objective is trained jointly with the normal PDB structure loss on the same training examples and is not pre-trained, in contrast to recent independent work.

良質な3次元構造データベースPDB(Protein Data Bank)が存在するということが大前提だということだろう。

 

Kaggleコンペが面白いのは、様々な分野から良質なデータベースが提供されるからだろうと思う。

プログラミング技術を習得して、Kaggleマスターを目指そう!

とは思うのだが、今は時間が取れず、Kaggleから遠ざかっている。

こんなことではだめだ。

 

こういうときに自分の性能を向上させるAIモデルを開発してみたいものだ。

自分の性能を向上させるAIモデルの仕様を決めよう。

Q&Aモデルが良さそうだ。

Q:現在の仕事のレベルアップとKaggleグランドマスターの両方を1年間で達成するにはどうすればよいのか。

A:現在の仕事のレベルアップに必要なAIモデルと、KaggleのGold Medalを獲得できるAIモデルを半年くらいのうちに開発すればよい。

 

ということで、今から実行に移そう。

 

style=185, iteration=500

 

吸着

W. J. Moore:Physical Chemistry 3rd Edition, 1962の藤代亮一訳に学ぶ

 

8章 34. 固体表面における気体反応

Langmuirの等温式は、表面が吸着分子によって次第におおわれ、吸着層が均一な1分子の厚さになったとき飽和するということに基礎をおいている。この等温式は特に化学吸着、すなわち、通常の化学結合と同じ程度の結合によって吸着分子が表面にむすびつけられているような吸着に適用できる。これはまた化学反応速度を促進させる吸着方式であり、化学吸着層は触媒反応における中間化合物としての役割を果たすのである。

 

つづく

 

f:id:AI_ML_DL:20220313080735p:plain

style=184 iteration=500



 

中性子散乱とX線散乱の機械学習による解析

中性子散乱とX線散乱の機械学習による解析

 

PDF解析をDiffPy-CMI&ASEでやりはじめたが、すでに限界が見えている。

これは、トライアンドエラーの積み上げ方式、すなわち、力業で攻める方式である。

すでに、パラダイムシフトが起きている。

古いパラダイムは潔く捨てよう。

 

ということで、次の総説に学び、プログラムを作って使ってみることにする。

 

Machine learning on neutron and x-ray scattering and spectroscopies
Zhantao Chen, Nina Andrejevic, Nathan C. Drucker, et al.                                            Chem. Phys. Rev. 2, 031301 (2021)

 

f:id:AI_ML_DL:20220220002807p:plain

小角散乱と吸収スペクトルはシミュレーションスペクトルデータベースがあるので、それを教師データにすれば良さそうと書かれている。

回折スペクトルは、そう簡単ではない。回折スペクトルをとる目的によって欲しいデータベースは全く異なるという理由で。

それでは始めてみようと思って小角散乱から取り掛かかってみたが、良く用いられる球状近似や楕円近似から、多角形、棒状、膜状へと対象範囲を広げていくことが、比較的容易に行えることが特徴のようだが、現状、ニーズは少ないので後回しにしよう。

次は吸収スペクトルだ。XANESやEXAFSは経験を要する解析である。これなら役に立ちそうだと思って取り掛かってみた。やはり重要なのは教師データである。これが充実しているのでお薦めだということで、シミュレーションスペクトルの計算方法、近似手法の検討、測定データとシミュレーションデータとの比較などを見ているうちに、提示されている例は広い範囲をカバーしているが、実際に使うとなると、もっと精密な計算に基づくシミュレーションスペクトル、様々な原子構造モデルに対するシミュレーションスペクトルが無いと結局は使い物にならないことがわかってきた。膨大な教師データからニューラルネットワークが学ぶのは、隠れた特徴量ではなさそうだ。これなら、与えられた条件を満たすスペクトルを検索しているのと大差ないように感じてしまった。イメージ図は不足データを補完することを期待させるものだが、測定スペクトルとの乖離が気になるし、そもそもデータベースはK殻の吸収が前提で、L殻は含まれていないようなので、途中下車することにした。

他に無いのかと探してみたら、PDFのことが書かれている箇所があったので読んでみたが、原理的なことを形式的に説明しているだけである。原子構造モデルからPDFを計算したシミュレーションスペクトルのデータベースは、公開されていないようである。自分で作成しよう。

 

以上で、やるべきことが明確になった。とにかく、計算資源を活用して、精度の高いシミュレーションスペクトルを集めることから始める必要があるということだ。

機械学習を用いて、短時間で、大量の、高精度なシミュレーションスペクトルを作ることができるプログラムをつくることも、選択肢の1つである。

 

<要検討>

損失関数の弱点は、1つ1つのデータの重要性の違いを、評価できていないことにあるような気がする。

マルチドメインなんて、重要性の違いという言葉に意味が無いような気がするので、個別にベストな解を目指すようにすることになるのだろうな。

1つ1つのデータの重要性の違いを評価する必要があれば、そうすればよい。データごとに最適化するだけの事。つまり、目的に適合しないデータは省く。ノイズとして扱うか信号として扱うかの判断を1か0かではなく定量的に評価する必要があるのだが、結局は原理に行きつくはずなので本質を把握し最適な関係式を探して適用することができるかどうかにかかっており、最適な関係式を見つけることができなければそのレベルのものになるということだな。

 

日々、レベルが下がっていくように感じる。その原因が、知れば知るほどわからないことが増える。何がわかっていないかを知る機会が増えていることがその理由であればよいのかもしれないが、単に思考力が低下し続けているのだということであれば、それは、克服する方法を探して対策を講じなければいけない。実際にはどちらも含まれているのだろうと思うので、後者の対策は意識的にやっていく必要があるように思う。

 

 

f:id:AI_ML_DL:20220220000930p:plain

style=183 iteration=500



Mask R-CNNを使ってみよう!2022.1.21-2

Mask R-CNNを使ってみよう!2022.1.21-2

ちょっとハードルを下げてみよう。

この2日間で、どんなかたちであれ、Mask R-CNNを使う!

 

1月22日12時すぎ:

気合十分で始めたのだが、なかなか進まぬ!

参考にしている(動かそうとしている)コードは、トレーニング無しのコード、すなわち、cocoで学習したモデルtorchvision.models.detection.maskrcnn_resnet50_fpn(pretrained=True, progress=True, num_classes=91)

を使って、用意した画像を、その学習済みモデルに入力して、どのような結果が得られるかを見るだけのものである。

参考にさせていただいているのは、Sovit Ranjan Rath氏の「Instance Segmentation with PyTorch and Mask R-CNN」というタイトルの記事とコードである。

学習することによって性能を上げるのが常であるが、今回は、学習済みモデルが学習したドメインと、インスタンスセグメンテーションに用いる画像はドメインが同じなので、学習する必要がない、というのが前提となっている。

 

つい最近終了したKaggleのコンペで、細胞のセグメンテーションの課題があった。そこでも学習済みのMask R-CNNを使っているチームがいたが、みんな、学習用のデータを使って学習させてから予測する。何が違うのか。そう、ドメインが違う。セグメンテーションモデルの学習済みモデルは、cocoで学習させていて、cocoには細胞の画像が含まれていないので、そのまま使っても正しく予測できるはずがない。細胞の教師データを使って追加で学習させる必要がある。つまり、学習済みモデルのドメインと、そのモデルを適用するドメインが同じであればそのまま使えるが、ドメインが異なれば、新たなドメインのデータセットで追加学習あるいは再学習させる必要がある。

 

1月22日22時すぎ:

Anacondaプロンプトで、次のコマンドを入力することによって、image1.jpgに対して、インスタンスセグメンテーションの結果が表示された。

python mask_rcnn_images.py --input ../input/image2.jpg”

f:id:AI_ML_DL:20220122202938p:plain

f:id:AI_ML_DL:20220122220041p:plain

手元にあるいろいろな画像で試してみてわかったことは、91種類の物体に対しては、かなり正確に判別するようだが、91種類以外の物体は検知されない。当然のことだが、次のチューリップは検知されなかった。

f:id:AI_ML_DL:20220122220308j:plain

閾値を0.4まで下げると全体がバウンディングボックスで囲まれた。ラベルは見えないのでわからない。"potted plant"と判定したのだろうと思う。

f:id:AI_ML_DL:20220122222907p:plain

目的物に対して学習させないと使えないことを、改めて感じさせられた。
個々の物質に対する識別能力が高ければ高いほど、少しでも違っていると検知しないということになる。もちろん確率の問題なので、確からしさを下げれば検知される。

上に示した絵画で、0.965のしきい値では、子どもは検知され、母親は検知されていない。しきい値を0.7まで下げれば、次のように、母親も検知された。

f:id:AI_ML_DL:20220122221752p:plain

ラベルと、バウンディングボックスと、スコアと、マスクの4つのデータが出力されること、および、それらのデータ構造の概要がわかった。

cocoで学習させたMask R-CNNが簡単に使えることがわかったとともに、目的物ごとに、データセットを用意して、追加学習させないことには、どうにもならないことも、身に染みて、わかった。

 

プログラミング技術の向上を急ごう!

 

f:id:AI_ML_DL:20220121113852p:plain

style=182 iteration=500