PINTOさんがアノテーション気合入れて、トレーニングされたGold-YOLOです👀
昨晩つぶやいた無駄に高解像度だった 640x480 から 320x256 にモデルの入力解像度を落として Float32 CPU推論してみた。ほぼ 3.5倍速 になって精度はほとんど落ちなかった。予想外。これなら確かに速い気がする。 pic.twitter.com/5RHqhLxlfk
— Super PINTO (@PINTO03091) 2023年11月28日
CPU推論 160x128 まで解像度を下げてみた。ちょっとウケるw 2.9ms/推論。Corei9。さすがにちょっとバウンディングボックスが揺らぎますね。まぁでも、3ms切ってるし良い気がする。 pic.twitter.com/NrCQl4UIGE
— Super PINTO (@PINTO03091) 2023年11月28日
PCでの動作確認はPINTOさんがされているので、ラズパイで動かしてみました🦔
ひとまずONNXのまま確認しましたが、早いですね。
TFLiteで整数量子化して4スレッド推論したらもっと早いかも?(ONNXより早くなるかはモデル次第なところもあるので何とも言えませんが)
とりあえずONNXのまま「gold_yolo_n_body_head_hand_post_0461_0.4428_1x3x256x320.onnx」を味見👀
— 高橋 かずひと@闇のパワポLT職人 (@KzhtTkhs) 2023年11月30日
ラズパイのCPUだし速度はこんなもんかなって感じはあるけど、精度に対する速度はかなり早い部類だと思う🦔 https://t.co/R8x11O8FOO pic.twitter.com/B696pBSNXp
ONNXのまま「gold_yolo_n_body_head_hand_post_0461_0.4428_1x3x128x160.onnx」を味見👀
— 高橋 かずひと@闇のパワポLT職人 (@KzhtTkhs) 2023年11月30日
50~70msってとこかなー。
おそらくだけど、TFLiteにして4スレッドにしたら30ms~40msってとこかな🤔 https://t.co/R8x11O8FOO pic.twitter.com/uUDdenN53q
---
追記:2023/12/01
からあげさんが動かし方をZennに投稿されていたので、これから動かそうと思っている方へ👀