Kazuhito00のプログラミング、その他、備忘録。

日々調べてたことや、作ってみたものをメモしているブログ。 お決まりの断り文句ですが、このブログに書かれている内容は個人の見解であり、所属する組織の公式見解ではありません。チラ裏。

ThinkPad X1 Extreme購入

現行使用しているパソコンが相当ガタが来ているので、冬の賞与をあてにして、 「ThinkPad X1 Extreme」を注文しました。

ThinkpadLenovoになる前に使用していて、しばらく離れていたのですが、今回色々PCを見比べた結果、Thinkpadに決定。

ただ、注文~発送~納品までには結構時間がかかるようで、以下に記録していこうかと思います。

2018/12/5 :注文、クレジットカード決済

2018/12/22[延期]2018/12/25[延期]2018/12/29 → 2018/12/25(唐突に発送連絡有り) :発送済

2018/12/28[延期]2019/1/4[延期]2019/1/10 → 2019/1/5 :納品済み

www.lenovo.com

【OpenCV】【Python】画像上に透過付き画像を重ねて描画

もはや、タイトルが詐欺くさい気がしないでもないです(第2弾

OpenCV単体だと、ちょっとだけ面倒なのでPillow(PIL)を利用しております。

画像に透過付き画像を重ねたいことが、ちょいちょいあるのですが、 パッと思いつく範囲で以下のような対応があります(大変な順に。。。

 ・αチャンネルを元にマスク画像を生成し、マスク画像で切り抜いた画像を重ねる

 ・Pillow等の他ライブラリを用いて画像を重ねる

今回はパッと表示したいだけだったので、Pillowを利用します。 ソースコードは以下。

#!/usr/bin/env python
# -*- coding: utf-8 -*-

import cv2 as cv
import numpy as np
from PIL import Image


class CvOverlayImage(object):
    """
    [summary]
      OpenCV形式の画像に指定画像を重ねる
    """

    def __init__(self):
        pass

    @classmethod
    def overlay(
            cls,
            cv_background_image,
            cv_overlay_image,
            point,
    ):
        """
        [summary]
          OpenCV形式の画像に指定画像を重ねる
        Parameters
        ----------
        cv_background_image : [OpenCV Image]
        cv_overlay_image : [OpenCV Image]
        point : [(x, y)]
        Returns : [OpenCV Image]
        """
        overlay_height, overlay_width = cv_overlay_image.shape[:2]

        # OpenCV形式の画像をPIL形式に変換(α値含む)
        # 背景画像
        cv_rgb_bg_image = cv.cvtColor(cv_background_image, cv.COLOR_BGR2RGB)
        pil_rgb_bg_image = Image.fromarray(cv_rgb_bg_image)
        pil_rgba_bg_image = pil_rgb_bg_image.convert('RGBA')
        # オーバーレイ画像
        cv_rgb_ol_image = cv.cvtColor(cv_overlay_image, cv.COLOR_BGRA2RGBA)
        pil_rgb_ol_image = Image.fromarray(cv_rgb_ol_image)
        pil_rgba_ol_image = pil_rgb_ol_image.convert('RGBA')

        # composite()は同サイズ画像同士が必須のため、合成用画像を用意
        pil_rgba_bg_temp = Image.new('RGBA', pil_rgba_bg_image.size,
                                     (255, 255, 255, 0))
        # 座標を指定し重ね合わせる
        pil_rgba_bg_temp.paste(pil_rgba_ol_image, point, pil_rgba_ol_image)
        result_image = \
            Image.alpha_composite(pil_rgba_bg_image, pil_rgba_bg_temp)

        # OpenCV形式画像へ変換
        cv_bgr_result_image = cv.cvtColor(
            np.asarray(result_image), cv.COLOR_RGBA2BGRA)

        return cv_bgr_result_image

使用例は以下。 例では、いらすとや様の画像を使用しております。

if __name__ == '__main__':
    cv_background_image = cv.imread("bg_takeyabu_layer2.jpg")
    cv_overlay_image = cv.imread(
        "ninja_hashiru.png",
        cv.IMREAD_UNCHANGED)  # IMREAD_UNCHANGEDを指定しα込みで読み込む
    cv_overlay_image = cv.resize(cv_overlay_image, (100, 100))

    point = (550, 250)

    image = CvOverlayImage.overlay(cv_background_image, cv_overlay_image,
                                   point)

    cv.imshow("sample", image)
    cv.waitKey(0)
f:id:Kazuhito00:20181210010330j:plainf:id:Kazuhito00:20181210010336p:plain ⇒  f:id:Kazuhito00:20181210010342p:plain

以上。

【Python】importしたモジュールやパッケージの場所を調べる

半年に1回くらい特殊な状況(Jetsonとか環境魔改造したとか)で場所を 調べることがあるためメモ。

モジュール本体かinit.pyの場所を取得

import tensorflow
print(tensorflow.__file__)

 実行例:C:\Users\XXXXXXXX\Anaconda3\envs\OpenCV_3_4_1\lib\site-packages\tensorflow__init__.py

パッケージの場所を取得

import tensorflow
print(tensorflow.__path__)

 実行例:['C:\Users\XXXXXXXX\Anaconda3\envs\OpenCV_3_4_1\lib\site-packages\tensorflow']

以上。

2018年 IT系 取得資格

恐らく今年中には資格試験を受けないため、合格したものまとめ。

 

・画像処理エンジニア検定 エキスパート

 

・JDLA Deep Learning for GENERAL 2018 #1

 

 

pythonエンジニア認定基礎試験

Python合格体験記を書いたらノベルティもらえました。

 f:id:Kazuhito00:20181202222837j:plain

 

【OpenCV】【Python】画像上に日本語のテキストを描画

もはや、タイトルが詐欺くさい気がしないでもないです。
OpenCV単体だと大変なのでPillow(PIL)を利用しております。

日本語テキストを描画しようとしたら、
パッと思いつく範囲で以下のような対応があります(大変な順に。。。
 ・OpenCVソースコードを修正しputTextをマルチバイト文字対応させる
 ・日本語フォントの文字画像を用意し、対象画像に重ね合わせて描画する
 ・日本語対応している他ライブラリに渡して描画する

今回はパッと表示したいだけだったので、Pillowを利用します。
ソースコードは以下。

#!/usr/bin/env python
# -*- coding: utf-8 -*-

import cv2 as cv
import numpy as np
from PIL import ImageFont, ImageDraw, Image

class CvPutJaText:
    def __init__(self):
        pass

    @classmethod
    def puttext(cls, cv_image, text, point, font_path, font_size, color=(0,0,0)):
        font = ImageFont.truetype(font_path, font_size)
        
        cv_rgb_image = cv.cvtColor(cv_image, cv.COLOR_BGR2RGB)
        pil_image = Image.fromarray(cv_rgb_image)
        
        draw = ImageDraw.Draw(pil_image)
        draw.text(point, text, fill=color, font=font)
        
        cv_rgb_result_image = np.asarray(pil_image)
        cv_bgr_result_image = cv.cvtColor(cv_rgb_result_image, cv.COLOR_RGB2BGR)

        return cv_bgr_result_image

使用例は以下。

今回はフォントに「衡山毛筆フォント行書」を使用しております。

if __name__ == '__main__':
    cv_image = cv.imread("sample.jpg")
    
    font_path = './font/font_jb004_running_brush_wi.ttf'
    
    image = CvPutJaText.puttext(cv_image, u"ごんべ", (30, 30), font_path, 60, (0, 0, 0))

    cv.imshow("sample", image)
    cv.waitKey(0)

f:id:Kazuhito00:20180620025707p:plain 以上。

【Keras】メモ:Kerasのモデルを別スレッドで使用する

使用したいときに忘れているためメモ。

マルチスレッドでKerasのモデルを利用したい時には、 ロードしたモデルに対して、以下のAPIを呼んで事前コンパイルしておく。 (メイン関数でロードしたモデルを別スレッドに渡して、別スレッド内で推論する場合等)

model._make_predict_function()

以上。

【LINE】個人的に色々作ったBOT

これまた今さらですが、LINE Messaging APIを利用したLINE BOTの作成が楽しく、色々試しております。

以下に最近作ってみたものをご紹介。

 

■献立提案 BOT

 献立を考える助けになるかもしれないBOT

 ・使用技術

  - 楽天レシピAPI

  - ホットペッパー グルメサーチAPI

  - Google Apps Script

 ・機能

  - 食材からレシピを提案(写真1枚目)

  - 位置情報から最寄りのお店を提案(写真2枚目)

  - 特定のスタンプを送るとランダムでレシピを提案(写真3枚目)

f:id:Kazuhito00:20180318025837p:plain
f:id:Kazuhito00:20180318025956p:plain
f:id:Kazuhito00:20180318025958p:plain

 

OCR BOT

  画像を送るとOCR結果を返すBOT

 ・使用技術

  - Google Apps Script

  - Google Cloud Vision API(光学式文字認識(OCR))

 ・機能

  - 送付された画像のOCR結果を返す

  - 画像とOCR結果をスプレッドシートに更新してGoogleドライブ上に保存

f:id:Kazuhito00:20180318025959p:plain

 

■画像判別 BOT

  画像を送ると画像判別結果を返すBOT

 ・使用技術

  - Google Apps Script

  - Google Cloud Vision API(ラベル検出)

  - Microsoft Azure TranslatorAPI

 ・機能

  - 送付された画像に対し、ラベル検出結果を返す

    (ラベルは英語なので、日本語に翻訳した結果を返す)

f:id:Kazuhito00:20180318030001p:plain

 

以上。