食品分類は、生活家電(スマート冷蔵庫、電子レンジ)、飲食店、病院などのさまざまなアプリケーションや、食品産業において利用できます。 FD-MobileNetモデルをベースにしたこのアプリケーションは、ピザ、ビール、フライド・ポテトなどの18種類の飲食物を識別できます。
アプローチ
- シーンをキャプチャするためにカメラモジュール(B-CAMS-OMV)を使用した
- 食品認識を実行するために、事前に訓練されたFD-Mobilenet NNモデルを選択した
- このモデルは、ファンクションパックFP-AI-VISION1(STM32H747ディスカバリーキット用)にすでに統合されている
- その後、STM32Cube.AIを使用してモデルを最適化した。
センサ
データ
データ形式
- 18クラス:「アップルパイ", "ビール", "シーザーサラダ", "カプチーノ", "チーズケーキ", "チキンウィング", "チョコレートケーキ", "コーラ", "カップケーキ", "ドーナツ", "フライドポテト", "ハンバーガー", "ホットドッグ", "ラザニア", "ピザ", "リゾット", "スパゲッティボロネーゼ", "ステーキ"
- RGB カラー画像。
結果
推論時間と精度の間で固有のトレードオフがある2種類のネットワークを用意しました。
モデル: 「標準」量子化畳込みニューラル・ネットワーク
入力サイズ:224 x 224 x 3
メモリフットプリント:132 KBフラッシュ(ウェイト用)
148 KB RAM(アクティベーション用
精度:72.8%STM32H747 (High-Perf) @ 400 MHz でのパフォーマンス推論時間:
79 msフレームレート:
11.8 fpsモデル: 「最適化済み」量子化畳込みニューラル・ネットワーク
入力サイズ:224 x 224 x 3
メモリフットプリント: ウェイト用
148 KBフラッシュ
アクティベーション用
199 KB RAM精度:77.5%STM32H747 (High-Perf)@400MHzでの性能推論時間:
145 msフレームレート:
6.6 fps食品分類例に関する情報のオンボード検証の概要