2021-01-01から1年間の記事一覧
BASNet(Salient Object Detection)を試しています Saliency Object Detection(SOD)のモデルです。他に有名なモデルではU2-Netがありますね。 いわゆる、画像中の目立つ物体の領域を特定するタスクです。 まあ流石に適当な画像だと髭までは出ないよな、、…
以下の3入力を持つ画像変換モデルです 入力用セグメンテーションマップ(下記の左から1枚目) 参考画像(下記の左から2枚目) 参考画像のセグメンテーションマップ 動作は公式の以下のデモ画像を見たら分かりやすいかと思います。 ※https://github.com/microsoft…
元OpenVINOの車検出モデル、人検出モデルですね。 PINTO Model zooにデモコードを追加しました エグめの雨動画でvehicle-detection-0200お試し pic.twitter.com/yfxDeZBxWD — 高橋 かずひと@孫請級プログラマー (@KzhtTkhs) 2021年11月24日 person-detection…
再度使う可能性が出てきたため、デモコードを追加しました。 今回はONNXです。WindowsのノートPCで推論するだけならONNXは最強です(個人の感想です M-LSDで線検出をお試ししています(半年ぶり2回目)モデルはPINTOさん動物園のONNXです pic.twitter.com/r3Wj…
ちょっと用事があってロードセグメンテーション味見中 136_road-segmentation-adas-0001味見中、、、正直精度はボチボチですが、使いたい用途には普通に使えそう pic.twitter.com/TO73D65KpP — 高橋 かずひと@孫請級プログラマー (@KzhtTkhs) 2021年11月23日…
Crowd Counting(群衆カウント、群衆密度推定)の動作を試しています 知り得る限りCrowd Counting系のモデルはGPL3が多いのですが、DM-CountはMITライセンスです。 Crowd Counting(群衆カウント、群衆密度推定)お試し中使いやすいライセンスのモデル少ないなー…
はじめに PyCon mini Shizuokaでオンライン登壇してきました。 オンライン参加 と ライブビューイング参加 の組み合わせで開催されました。 今回はオンライン前提だったこともあり、トークは事前収録で進められました。 オンライン前提だと事前収録は当日が…
同解像度だとFast-SRGANのほうが早い? PINTO model zoo No.172:Real-Time-Super-Resolution64x64→256x256の超解像ソレっぽいですが、Fast-SRGANのほうが早かったかしら pic.twitter.com/O6RreGBuDE — 高橋 かずひと@孫請級プログラマー (@KzhtTkhs) 2021年…
ByteTrackはMOT(Multi Object Tracking)のアルゴリズムの一つです。 このアルゴリズムはWindowsで動作しました MOTはDetectionとTrackerとMachingなどの組み合わせで依存関係が激しく、環境構築が大変なことが多いのですが、ByteTrackはWindowsでも動きまし…
Low-Light Image EnhancementモデルのデモをPINTO_model_zooに追加しました。 しかし、暗闇を見やすくするタスクって「Low-Light Image Enhancement」だと思うのですけど、これ日本語に訳すと何て表現すれば良いの? ONNX試してみました。結構良いかも? htt…
いや、追加したのは少々前なのですが、、、 書き忘れていたので、、、 本当は横長な動画をインプットすると良いのでしょうけど、、、まずはLite-HR-Depth速度の割にエッジとか奥行きがしっかりしている? pic.twitter.com/2LgFv4B7gu — 高橋 かずひと@孫請級…
前回お試ししたプログラムだといまいちなため、 以下の流れで見栄えを調整しました 顔検出→検出領域をAnimeGANv2→セグメンテーションで切り抜いて、元画像に上書き 顔検出してAnimeGANv2かけてセグメンテーションしてみたやつのソースコード整理中 https://t…
アニメ画調に変換する「PyTorch Implementation of AnimeGANv2」を試しています 一例ですが以下のような変換が出来るようです。 また、サッと試せるColaboratoryのノートブックが公開されていたため、ぱくたそのラーメン屋さんの写真で試してみました。 ぱく…
Deep Learningの超解像と言えば、だいたい激重なイメージありますが、、、 Fast-SRGANは中々軽いです 動きました128x128→512x512だとCPU(i7-8750H)で200ms行かないぐらいですね。早いし見た目もそこそこTwitterにあげて動画ガビガビにならないか不安ですが、…
からあげさんメインで、本当に若干の協力をしたのみですが、、、 詳しくはからあげさんのはてブを参照ください。 NHKグッズ 僕も記念品をいただけました。 タオル、ノート、メモ、紅茶です 10/30追記。 からあげさんと技術協力した番組は、NHKプラスで11/5(…
JINS MEMEの新型2021年モデルを購入しました My new gear...JINS MEME pic.twitter.com/vYlT803mrK — 高橋 かずひと@孫請級プログラマー (@KzhtTkhs) 2021年10月14日 データ定義を眺めていたのですが、相当細かいデータが取れる模様 15秒間隔データ(logicInd…
Raspberry Pi4で推論速度を試したくて用意しました YuNetのONNX推論、TFLite推論のリポジトリを何のための用意していたかと言うと、Raspberry Pi4で速度見るためです。YOLOX-Nanoさん、工夫無しでも4FPSくらい出ている https://t.co/ayhjQXDgoT pic.twitter.…
Raspberry Pi4で推論速度を試したくて用意しました YuNetのONNX推論、TFLite推論のリポジトリを何のための用意していたかと言うと、Raspberry Pi4で速度見るためです。さすがにYuNetさんは早くて工夫無しでも25FPSくらい出ている https://t.co/1TIIFjHXf6 pi…
MediaPipe0.8.8来てました ・Holisticにenable_segmentation(人物セグメンテーションするやつ)オプション追加 ・FaceMeshにrefine_landmarks(目と口周りのランドマークの精度向上)オプション追加 MediaPipe 0.8.8のHolisticさん、これだけガチャガチャ動かし…
NanoDetの次はYOLOXを試しています。 今回はYOLOX-Nanoの自前データのトレーニングを行いました。 次はYOLOX-Nanoの自前データセットのトレーニング試すかなー pic.twitter.com/Ltl79jFavQ — 高橋 かずひと@孫請級プログラマー (@KzhtTkhs) 2021年9月29日 正…
AprilTagの検出を試しています。中々良さそう AprilTagの検出お試しAR系のタグと言えば、ArUcoはGPL3になってから疎遠になってたのですが、またタグ検出を使う機会が出そうなので、代替として試しています。さすがに高速&誤検出少ないですね。遠くに持って…
NanoDetは高速・軽量な物体検出モデルです COCO mAP 20.6 で パラメータ数が0.95Mと言う驚異的な軽さです。 2021//9/20時点でGitHubのREADME上に乗っているベンチマークだと以下のような感じです。 流石に精度を求めようと思ったらYOLOシリーズやEfficientDe…
Google MobileObjectLocalizerと言うモデルがTensorFlow-Hubで公開されていたため、試してみました 上記ページによると、以下のような特徴を持つモデルのようです。 MobileObjectLocalizerはクラスに依存しないオブジェクト検出器です。 オブジェクト分類は…
TensorFlow SimilarityというMetric Learning(Similarity Learning?)のライブラリが発表されていました。 β版、かつ、Google非公式のプロジェクトのようですが、Metric Learningが手軽に出来そうで期待しています。 TensorFlow Similarity中々良さかも?こ…
肌、服、髪のセマンティックセグメンテーションモデルを訓練していました。 データセットは自前で、モデルはDeepLabV3+、PAN(Pyramid Attention Networ)、N-Net++です。 pth形式とonnx形式で用意しています。 300枚ほどアノテーションしたので、ちょっと精度…
imread_from_url()と言う関数を作成し、はじめてPyPI登録しました 登録するだけなら結構サクッと出来るんですね。 OpenCVのimread()の対象をURLにした感じの関数です。デバッグとかで適当な画像読み込む時に使います↓ import cv2 from imread_from_url impor…
ちょっとセマンティックセグメンテーションがやりたくなったので、アノテーションツールを作りました GrabCutを利用しているので、明確な境界が無い領域のアノテーションに向きません。 ちょっとセマンティックセグメンテーションやりたくなったので、アノテ…
昨年・今年とGitHubに雑多にリポジトリを作りすぎた感があるので、整理を進めています 整理の一環としてちょっと前から、「WORKS.md」と言うページにリポジトリ一覧と概要をまとめていますが、今回はGitHub APIを用いて、リポジトリの情報を眺めてみようと思…
MediaPipe0.8.7のPoseにenable_segmentationオプションが追加されていました。 姿勢推定しつつ人物/背景分離が出来ます。 オプション使用時のFPSは約2/3ぐらいでした あと、utilのdrawに種類が増えたようなのですが、僕のサンプルでは描画は自前のため割愛し…
試そう試そうと思っていたのですが、ちょっと案件が立て込んでて遅くなりました。 MoveNetの複数人数(最大6名)の姿勢推定です。 処理速度は激速です 精度は以下のような感じ↓ MoveNetのMultiPoseを試していますいや、早いなほんと、、、 pic.twitter.com/kAr…