高橋かずひとのプログラミング、その他、備忘録。

日々調べてたことや、作ってみたものをメモしているブログ。 お決まりの断り文句ですが、このブログに書かれている内容は個人の見解であり、所属する組織の公式見解ではありません。チラ裏。

2022-01-01から1年間の記事一覧

2022年振り返り

はじめに 12/28(水)に仕事納めしました。 あとは、だらだらとLT資料作ったり、プログラム作ったり、 とあるスタートアップのお手伝いしたり、Axross寄稿原稿書いたりするだけの予定なので、 2022年の振り返りをしたいと思います。 思ったより作りたいものあ…

2022年振り返り その2:Kindle

からあげさんの「Kindleの蔵書情報をKindleアプリのXMLをパースして可視化する方法」です。 前回は昨年の12月31日にやっていますね。 Amazon Product Advertising API(商品情報API)追加版ノートブック 昨年使用したものを使おうと思っていたのですが、何か…

2022年振り返り その1:GitHub

年末と言うことでGitHubリポジトリの振り返りです 以下は昨年の投稿。 WORKS.md 今まで作成したリポジトリで対外的に公開しているものは、 以下のWORKS.mdに整理して公開しています。 ※画像が多いため転送量注意 公開ノートブック PyGitHubを用いたデータ集…

FreeYOLO(CrowdHuman)のお試し👀

人検出の精度高いやつが欲しくてFreeYOLOのCrowdHumanトレーニングバージョンを試しています CPUでも早くて、小さい対象も検出出来ているし、中々良さそう。 ちょっと別案件の人検出をFreeYOLO(CrowdHuman)に任せようか検討中まあ、添付の動画は無茶なんです…

Qiita:NiceGUI と OpenCV を組み合わせたい。

OpenCV Advent Calendar 2022の23日目に投稿しました👻 qiita.com

Qiita:ノードエディタ形式の画像処理ツール「Image-Processing-Node-Editor」

OpenCV Advent Calendar 2022の21日目に投稿しました👻 qiita.com

FreeYOLOのONNX推論お試し👀

DAMO-YOLOに引き続き、PINTO さんがツイートしていた FreeYOLOをお試ししています "FreeYOLO - Anchor-free YOLO detector." アンカーフリーなのってYOLOって呼んでいいのかな。ネーミングはもう一切気にしないですけども。「New AP results and weight file…

PINTO_model_zoo:物体検出(336_PP-YOLOE-Plus)デモ追加

PP-YOLOE-Plus の 味見 PP-YOLOE-PlusのSの640x640をCPU推論で味見いや、もう正直モデルの良し悪しは、この程度の動画推論くらいじゃ分かりませんね。。。パラメータ数相応の推論速度だとは思うし、ファインチューニングしたとき強いかは分かりませんし。。…

DAMO-YOLOをColaboratory上でトレーニングするサンプル👻

ある意味、以下の続編です。 以下にコミットしています。 いったん公開はしていますが、正直、暫定対応なところとか無理矢理なところとかがちょいちょいあってクオリティはあんまり高くないです。。。 そのうち改善されてくるでしょうけど、、、 暫定対応は2…

PINTO_model_zoo:セマンティックセグメンテーション(335_PIDNet)Pythonデモ追加

早いセマンティックセグメンテーションと噂のPIDNet味見 pidnet_S_cityscapes_544x960 CPUで味見このサイズでこのスピードは速いかしら。少々検出が不安定にも見えますが https://t.co/IgSWP8Bo0H pic.twitter.com/eXvZQBOyNq — 高橋 かずひと@闇のパワポLT…

PINTO_model_zoo:姿勢推定(333_E2Pose)デモ追加

E2Pose です 複数人の姿勢推定をEnd2Endで実行するモデルですね。 TensorRTでGPU推論するとかなり早い模様です。 今回はCPU推論でお試し。 PINTOさん動物園のE2PoseをCPU推論でお試し確認中 pic.twitter.com/V3kyU19EUy — 高橋 かずひと@闇のパワポLT職人 (@…

DAMO-YOLOのONNX推論お試し👀

PINTO さんがツイートしていた DAMO-YOLO の ONNX推論を試しています もはや何を認識しているのか分からない。凄いのかもしれない。"DAMO-YOLO" pic.twitter.com/62NRc8xqYV — Super PINTO (@PINTO03091) 2022年12月6日 すばらしい。 pic.twitter.com/XxcWEH…

Ogaki Mini Maker Faire 2022に出展しました🦔

Ogaki Mini Maker Faire 2022 に出展しました 今回は、からあげさんと「AI Zoo Keeper」と言うグループで参加しています。 雑多にAI系のデモを展示する感じです。気合でアレやコレや乗せた感 高橋側の展示物は以下3点です Deep写輪眼 & 写輪眼オーバーレイ (…

PINTO_model_zoo:単眼深度推定(210_SC_Depth_pl v3)デモ追加

SC Depth pl の v3です。 192x320で、このエッジの取れ具合は凄いな Image-Processing-Node-Editorに取り込もうかしら →(2022/11/15追記) SC Depth pl が GPL v3なので取り込まない おー、CPU推論でこの速度・精度だと、かなり凄いんじゃない?入力サイズは1…

OpenCVのremap()を用いてメッシュ変形👻

OpenCVのremap()を用いてメッシュ変形的な変換を行うサンプルを作成しました。 OpenCVでメッシュ変形的なやつ。ソースコード整理したぐりぐり動かしてパラメータ保存するスクリプトと、変換だけするスクリプトの2つにした pic.twitter.com/abXthtTMLl — 高橋…

Pop2PianoでPop音楽ベースのピアノカバー生成お試し👀

Pop音楽ベースのピアノカバーのMIDI生成が出来るPop2Pianoの味見をしています。 以下のプロジェクトページではいくつかのデモも聞くことが出来ます。 公式でColaboratoryのノートブックが提供されているので、それを開いてGPUランタイムで上から実行していけ…

onnx2tf で高速なTFLiteモデルに変換🏃

onnx2tf です。 onnx-tensorflowじゃないです PINTOさんが開発されているツールで、 ONNXファイルをTensorFlow/TensorFlow-Lite形式に変換するツールです。 どうもonnx-tensorflowで変換をかけると、 無駄に大量のTransposeが挿入される(何か機械的な変換で…

NiceGUI お試し👀

NiceGUI は、 Pythonベースの UI フレームワークで、Webブラウザで表示するタイプのやつです。 Streamlit は、おまじないが多く、それらを解決するために作成したようです。 JustPyをラッピングする形で実現されているようです(JustPyは低レイヤーの処理が…

Mubert-Text-to-Music での音楽生成お試し🦔

イラスト生成AIが盛り上がったと思ったら、次は音楽生成ですね。 進歩のスピードが速くて驚きます。ホントに。 お試しした感想は、クオリティは高いけどプロンプトで狙った通りの雰囲気出すの難しいなー。て感じです。 そもそもソースコード的には、プロンプ…

Informative Drawingsでラフスケッチ風イラストへ変換👀

Informative Drawingsの味見をしています。 以下のような変換が出来るモデルです。 左上:元画像、右上:Anime Style 左下:OpenSketch Style、右下:Countour Style GPUは必要ですが、Webカメラ入力で動作させてみました。 それなりに動いていますね Inform…

Zenn:Pythonの辞書型(dict)でドットアクセス(dot notation)するメモ

久々のメモ書きです👀 ちょいちょい使いたくなる辞書へのドットアクセスのメモです。

ONNX Runtime:CUDNN error executing cudnnAddTensor() の処置(2022年10月13現在)

どこにもメモった形跡が無いので、改めてメモ kazuhito00.hatenablog.com 上記のモデルをONNXでGPU推論しようとすると以下のようなエラーが出ます。 onnxruntime.capi.onnxruntime_pybind11_state.Fail: [ONNXRuntimeError] : 1 : FAIL : Non-zero status co…

ThinkPad X1 Extreme Gen5購入

前回ThinkPad X1 Extremeを購入してから約3年と9か月たちました。 特に不調とかは無いのですが、そろそろ新しいのが欲しくなったので購入 また4年くらいは使えるスペックを。と思いカスタマイズしました。 ThinkPadのカスタマイズモデルは、注文~発送~納品…

Stable Diffusion img2imgさんに僕を神絵師にしてほしかった🦔

世の中にはimg2imgで凄いイラスト作成されている方もいますが、、、 流石に「img2img使うだけで貴方も神絵師に」みたいな、そんな甘い世界では無かったです(それはそう 長い呪文を使いたくなかったので「pixiv」とか「anime」とか「kawaii」とか入れていま…

PINTO_model_zoo:マルチタスクネットワーク(326_YOLOPv2)デモ追加 ※交通物体検出、道路・ラインセグメンテーション

YOLOPv2の味見をしています PINTOさんとこのYOLOPv2のONNXモデル(320x192)を味見中v1より確かに精度は良いけど、CPU推論だとモデルサイズ相応の推論速度に見える pic.twitter.com/STuSO203MV — 高橋 かずひと@闇のパワポLT職人 (@KzhtTkhs) 2022年9月3日 YOL…

ColaboratoryでStable Diffusion触っています👀

npakaさんのnoteの「Google Colab で はじめる Stable Diffusion v1.4」を読めばすぐ出来ました しかし、いきなりM:tGぽいものが出てきてしまった。。。 AIが作ったとはいえ、発表するか否かの判断は人間の責任なので、 取り扱いには注意していきたいですね…

ロイヤリティフリーの360度画像を用意したかった👀

基本はロイヤリティフリーの写真と同じなのですが、 360度だと前も後ろも映ってしまうので、映したくないものが入り込む可能性が高い。。。 360度カメラで撮影した風景を著作権フリー素材として公開したい。と思い何に気をつければ良いかを著作権・肖像権・…

OpenCVでオーディオスペクトラムをはめ込み画像風合成🦔

以下2つの合わせ技ですね👀 動作イメージは以下です。 ソースコードは以下です👻

OpenCVではめ込み画像風合成🦔

はめ込み画像風の合成(四角形のみ)をOpenCVでお試ししています。 OpenCVで雑なはめ込み画像作ってる👀 pic.twitter.com/SQLGlp1zdb — 高橋 かずひと@闇のパワポLT職人 (@KzhtTkhs) 2022年8月15日 ソースコードは以下に整理してコミットしています🦔

オーディオスペクトラムとか波形をOpenCVで描画してみる👀

まあタイトルの通りのお遊びで道楽です🦔 オーディオスペクトラムとか波形眺めるの好きなので、無限に見ていられる👀描画はもちろんOpenCVです ※OpenCVの用途外利用 pic.twitter.com/ils9BiIeUw — 高橋 かずひと@闇のパワポLT職人 (@KzhtTkhs) 2022年8月9日