高橋かずひとのプログラミング、その他、備忘録。

日々調べてたことや、作ってみたものをメモしているブログ。 お決まりの断り文句ですが、このブログに書かれている内容は個人の見解であり、所属する組織の公式見解ではありません。チラ裏。

onnx2tf で高速なTFLiteモデルに変換🏃

onnx2tf です。 onnx-tensorflowじゃないです PINTOさんが開発されているツールで、 ONNXファイルをTensorFlow/TensorFlow-Lite形式に変換するツールです。 どうもonnx-tensorflowで変換をかけると、 無駄に大量のTransposeが挿入される(何か機械的な変換で…

NiceGUI お試し👀

NiceGUI は、 Pythonベースの UI フレームワークで、Webブラウザで表示するタイプのやつです。 Streamlit は、おまじないが多く、それらを解決するために作成したようです。 JustPyをラッピングする形で実現されているようです(JustPyは低レイヤーの処理が…

Mubert-Text-to-Music での音楽生成お試し🦔

イラスト生成AIが盛り上がったと思ったら、次は音楽生成ですね。 進歩のスピードが速くて驚きます。ホントに。 お試しした感想は、クオリティは高いけどプロンプトで狙った通りの雰囲気出すの難しいなー。て感じです。 そもそもソースコード的には、プロンプ…

Informative Drawingsでラフスケッチ風イラストへ変換👀

Informative Drawingsの味見をしています。 以下のような変換が出来るモデルです。 左上:元画像、右上:Anime Style 左下:OpenSketch Style、右下:Countour Style GPUは必要ですが、Webカメラ入力で動作させてみました。 それなりに動いていますね Inform…

Zenn:Pythonの辞書型(dict)でドットアクセス(dot notation)するメモ

久々のメモ書きです👀 ちょいちょい使いたくなる辞書へのドットアクセスのメモです。

ONNX Runtime:CUDNN error executing cudnnAddTensor() の処置(2022年10月13現在)

どこにもメモった形跡が無いので、改めてメモ kazuhito00.hatenablog.com 上記のモデルをONNXでGPU推論しようとすると以下のようなエラーが出ます。 onnxruntime.capi.onnxruntime_pybind11_state.Fail: [ONNXRuntimeError] : 1 : FAIL : Non-zero status co…

ThinkPad X1 Extreme Gen5購入

前回ThinkPad X1 Extremeを購入してから約3年と9か月たちました。 特に不調とかは無いのですが、そろそろ新しいのが欲しくなったので購入 また4年くらいは使えるスペックを。と思いカスタマイズしました。 ThinkPadのカスタマイズモデルは、注文~発送~納品…

Stable Diffusion img2imgさんに僕を神絵師にしてほしかった🦔

世の中にはimg2imgで凄いイラスト作成されている方もいますが、、、 流石に「img2img使うだけで貴方も神絵師に」みたいな、そんな甘い世界では無かったです(それはそう 長い呪文を使いたくなかったので「pixiv」とか「anime」とか「kawaii」とか入れていま…

PINTO_model_zoo:マルチタスクネットワーク(326_YOLOPv2)デモ追加 ※交通物体検出、道路・ラインセグメンテーション

YOLOPv2の味見をしています PINTOさんとこのYOLOPv2のONNXモデル(320x192)を味見中v1より確かに精度は良いけど、CPU推論だとモデルサイズ相応の推論速度に見える pic.twitter.com/STuSO203MV — 高橋 かずひと@闇のパワポLT職人 (@KzhtTkhs) 2022年9月3日 YOL…

ColaboratoryでStable Diffusion触っています👀

npakaさんのnoteの「Google Colab で はじめる Stable Diffusion v1.4」を読めばすぐ出来ました しかし、いきなりM:tGぽいものが出てきてしまった。。。 AIが作ったとはいえ、発表するか否かの判断は人間の責任なので、 取り扱いには注意していきたいですね…

ロイヤリティフリーの360度画像を用意したかった👀

基本はロイヤリティフリーの写真と同じなのですが、 360度だと前も後ろも映ってしまうので、映したくないものが入り込む可能性が高い。。。 360度カメラで撮影した風景を著作権フリー素材として公開したい。と思い何に気をつければ良いかを著作権・肖像権・…

OpenCVでオーディオスペクトラムをはめ込み画像風合成🦔

以下2つの合わせ技ですね👀 動作イメージは以下です。 ソースコードは以下です👻

OpenCVではめ込み画像風合成🦔

はめ込み画像風の合成(四角形のみ)をOpenCVでお試ししています。 OpenCVで雑なはめ込み画像作ってる👀 pic.twitter.com/SQLGlp1zdb — 高橋 かずひと@闇のパワポLT職人 (@KzhtTkhs) 2022年8月15日 ソースコードは以下に整理してコミットしています🦔

オーディオスペクトラムとか波形をOpenCVで描画してみる👀

まあタイトルの通りのお遊びで道楽です🦔 オーディオスペクトラムとか波形眺めるの好きなので、無限に見ていられる👀描画はもちろんOpenCVです ※OpenCVの用途外利用 pic.twitter.com/ils9BiIeUw — 高橋 かずひと@闇のパワポLT職人 (@KzhtTkhs) 2022年8月9日

Image-Processing-Node-Editorで360度画像を表示するサンプル🦔

この前作った360度画像のやつをImage-Processing-Node-Editorのノードにしました。 基礎的な機能は増えずにニッチな機能ばかり増えていく Image-Processing-Node-Editor360度画像の雰囲気対応基礎的な機能は増えずにニッチな機能ばかり増えていく pic.twitte…

OpenCVで360度画像を表示するサンプル🦔

リコーの初代THETAが出てから結構な年月が経って、 YouTubeとかVR界隈での利用もあったりで、 360度画像は、かなり身近なものになった気がします こんな感じの画像を、、、 こんな感じに変換したくてOpenCVのremap()で変換かけてみました。 行列計算とか解釈…

Image-Processing-Node-Editor v0.2.0リリース🦔

Image-Processing-Node-Editor v0.2.0 をリリースしました リリースと共にWindows向けの実行ファイルも用意しています。 リリース内容は以下です。 BRISQUEノード追加。 地味なノードを追加しているBRISQUEによる画質評価(数値が高いほど悪い) pic.twitter…

PINTO_model_zoo:画像捏造検出(309_ImageForensicsOSN)デモ追加

ImageForensicsOSN味見しています 分かりやすい感じのやつじゃないとうまく行かないですね。 309_ImageForensicsOSN味見中1枚目(公式リポジトリのサンプル)が上手くいくのは当然として、2枚目(無加工)は微妙。。。3枚目(高橋さんがペイントツールでロゴ消し)…

PINTO_model_zoo:物体検出(308_FastestDet)デモ追加

FastestDetに興味があるためチョイチョイ試しています FastestDet味見中速度の対して精度高いですね確かに https://t.co/7aUMOMtRVn pic.twitter.com/tSnKpnXfcM — 高橋 かずひと@パワポ職人 (@KzhtTkhs) 2022年7月10日 公式リポジトリの画像でも感じました…

Image-Processing-Node-Editor の 次のリリースタイミングいつにしよう👀 + WeDX

僕が作ったリポジトリの中で、継続的にメンテナンスしているものは少数派です。 パッと思いつく範囲でも以下の3つぐらい →MediaPipeのマイナーバージョンリリース毎くらいに更新 →更新内容によってはパッチバージョン更新でも追従 →「これだ!」と思った物体…

ROBOT TECHNOLOGY JAPAN2022に遊びにいってきました🦔

ROBOT TECHNOLOGY JAPAN2022に遊びに行ってきました 超晴天でした。 ロボットの展示会にきて、ソフトウェアの話ばっかり聞いている不審者は僕です あんまり写真残ってないのですが、AI(+GUIツール)とか、XRって展示も増えた気がしますね DOBOTのブース 見…

【Pythonデータ分析勉強会#33】「DearPyGuiに入門しました」の続き ~Image-Processing-Node-Editor~

Pythonデータ分析勉強会#33でLTしてきました🦔 資料はSpeakerDeckに公開しています👀 デモは動画を使用しているため、いつも通りYouTubeにも公開しています。

ノードエディターベースの画像処理ツールを作りました Ver0.1.1+α🦔

Ver0.1.1のタグ切った時に更新しておけば良かったーーー Ver0.1.1ってリリース内容なんだっけ、、、 いくつかのバグ修正とWin実行ファイル同梱? 次のタグ切りはいつにしようかしら、、、 特に方針決めてないからイマイチタイミングが決まらない とりあえず…

ノードエディターベースの画像処理ツールを作りました🦔

DearPyGuiにノードエディター機能があるのを知って、 ここ一週間くらいノードエディター+画像処理的なツールを作っていました 完全に自分のための仕様で、僕の仕事とかには使える作りにはなっているのですが、 実装済みのノードにはかなり偏りがあります 以…

【OSC2022 Online Nagoya】DearPyGuiに入門しました

OSC2022 Online Nagoya の Python東海/JuliaTokaiミニ合同勉強会にてLTをしてきました。 DearPyGui入門のお話です speakerdeck.com スライド自体もDearPyGuiで作ってて実演デモもあるので、YouTubeでの視聴を推奨しています www.youtube.com こんな感じの、…

在宅勤務でWeb会議中かどうかM5Stackで表示👀

実は4/1からフルリモートの現場勤務になっています。 そして、Web会議中は以下のようなドアプレートをつけていたのですが、、、 自分の部屋が2階奥のため、 案の定、家人から「部屋まで見に行くのがめんどい」と言われてしまいました、、、 と言うわけで、以…

PINTO_model_zoo:インスタンスセグメンテーション(295_SparseInst)デモ追加

PINTOさん気合入った改造していたようですが、ぼちぼち動いています 295_SparseInstさん、それっぽく動いている https://t.co/E36eE7VV0t pic.twitter.com/SichLMqJ8S — 高橋 かずひと@駆け出し何でも屋 (@KzhtTkhs) 2022年5月8日 デモコードは以下にコミッ…

PINTO_model_zoo:単眼深度推定(294_FSRE-Depth)デモ追加

FSRE-Depthお試し中🦔 味見👀どうじゃろう。これはCPU推論(Core i7-8750H)ですがなかなかの速度と精度🤔? https://t.co/YPf0xE6roi pic.twitter.com/JLQBdNJ2p1 — 高橋 かずひと@駆け出し何でも屋🦔 (@KzhtTkhs) 2022年5月8日 デモコードはPINTOさんのmodel zooにコ…

Raspberry Pi 4向けのPerson Tracking(CPU推論4スレッドで85~120ms)

トラッキング(motpy)付けると流石に重くなる、、、 ギリギリ10fps前後ですね。 「物体検出オンリーですか?」と聞かれたのでトラッキングも付けてみたRaspberry Pi4 CPUオンリーのPerson Trackingはギリギリ10fps前後 https://t.co/TNrgSwJIi0 pic.twitter.c…

Raspberry Pi 4向けのPerson Detection(CPU推論4スレッドで45~60ms)

Raspberry Pi 4向けの人検出モデルです。 ノートPCとかでも動きますが、ノートPCで動かすくらいならYOLOXとか使ったほうが精度と速度のバランス良いと思います Raspberry Pi4 CPUオンリーのPerson DetectionつづきPINTOさんのTensorflowLite-bin導入するだけ…