高橋かずひとのプログラミング、その他、備忘録。

日々調べてたことや、作ってみたものをメモしているブログ。 お決まりの断り文句ですが、このブログに書かれている内容は個人の見解であり、所属する組織の公式見解ではありません。チラ裏。

2021年振り返り その2:Kindle

からあげさんの「Kindleの蔵書情報をKindleアプリのXMLをパースして可視化する方法」です。

 前回は昨年の12月30日にやっていますね。

 

Amazon Product Advertising API(商品情報API)追加版ノートブック

からあげさんの公開ノートブックをベースに、Amazonの商品情報APIを使用した処理を追加しています。

 

Amazonの商品情報APIを使用する際には、以下を設定してください。

KEY    = "<ACCESS KEY>"
SECRET = "<SECRET ACCESS KEY>"
TAG    = "<TAG>"

 

蔵書数

7609になりました。

昨年から1195冊増加です。

 年毎の購入数

 2015年に及ばないものの2021年も結構購入していますね。

f:id:Kazuhito00:20211230232344p:plain

月毎の購入数

今年は11月にめっちゃ買ってるな、、、👀

f:id:Kazuhito00:20211230233032p:plain

調べたら、唐突に「るろうに剣心」とか「最遊記」とか全巻買いしていましたわ、、、

衝動買い🦔

日毎の購入数

f:id:Kazuhito00:20211230235233p:plain

3日が多いのは前述の衝動買いの結果です👻

 

曜日毎の購入数

f:id:Kazuhito00:20211230235424p:plain

水曜日が多いのは前述の衝動買いの結果です👻

 

タイトル文字数の分析

f:id:Kazuhito00:20211230235505p:plain

平均:17.192667
標準偏差:12.549909
最小:1
最大:116

文字数1のタイトル

前回から変わらず「累」です。

文字数116のタイトル

こちらは前回と変わり
「ゲーム仲間のおっさんとオフ会したら世界ランク1位の美女だった。: 親友に裏切られ、絶望する俺を慰めてくれるゲーム仲間とオフ会したら世界ランク1位の美女だった。美女「君は天才だ…仲間になってほしい♥」俺「え…」 ホメテノバス【V漫画】」です。

無料漫画ですね。ただ、これ多分ダウンロードすらしていない、、、👀


筆者の分析

 三田紀房先生のマンガを買いたしているので、3位に浮上しています。

 Amazon Product Advertising API(商品情報API)で情報取得

昨年と同じく、ASIN(Amazon Standard Identification Number)を元に価格とジャンルを取得しました。

API呼び出し毎にASINが10個まで指定できるので、10個ずつAPIをforでぶん回しています。

Amazon側には負荷をかけないようにAPI呼び出し毎に、1秒スリープをしているので、ボチボチ時間かかります。

自分の環境では7609件で14分12秒かかりました。

 

取得できないデータ

今年もAPIで情報取得できないデータが結構な数ありました。

  • 発売停止になったもの
  • kindle unlimitedに登録し直しされて、ASINが変わったと思われるもの
  • 期間限定で公開されていたものが公開終了したもの 

おそらく上記の3パターンなのですが、今年がっつり件数が増えていました、、、👀

 

 価格

 ひとまず、価格をdescribe()で要約統計量眺めてみます。

データ取得できなかったやつは、ひとまず除外。

  • 平均:602.636791
  • 標準偏差:468.764434
  • 最小値:0.000000
  • 25%:441.500000
  • 50%:600.000000
  • 75%:660.000000
  • 最大値:4400.000000

あれ?4400円?

Code Completeとか取得失敗しているのかしら?

価格Top10

とりあえず、Top10を眺めてみます。

1位:ファイナルファンタジーVII リメイク マテリアル アルティマニア 4400円

FF7Rのマテリアル アルティマニアですね。

詳細な設定とか書かれていて中々読みごたえと満足度の高い本でした。

f:id:Kazuhito00:20211231002211p:plain

 

2位:Pythonによる医療データ分析入門 pandas+擬似レセプト編 4159円

医療データ分析の本です。

これは昨年買ったやつで今年は読んでいませんが、中々良書だった記憶があります。


3位:TensorFlow機械学習クックブック Pythonベースの活用レシピ60+ impres... 4158円

TensorFlowを良く触る人なら、とりあえず買っているんじゃないかと思っている本。


4位:ゲームメカニクス大全 ボードゲームに学ぶ「おもしろさ」の仕掛け 3940円

裏でインディーゲーム制作のお手伝いもしているので、そっち方面のお勉強系書籍。

ゲーム制作しなくても面白い本です。


5位:Python機械学習ライブラリ scikit-learn活用レシピ80+ impress t... 3861円

この手のやつ、買っただけで満足しているシリーズな気がします、、、

買うと安心する。

でも、実用するときは困りごとはググる。みたいな🙄

昨年買った本ですが、今年は読んでないな多分、、、


6位:美味しいマイナー魚介図鑑 3856円

唐突に魚介図鑑。

マイナー珍魚度、味の良さ、値段で評価されています🐟


7位:情報処理教科書 エンベデッドシステムスペシャリスト 2019~2020年版 3841円

ES試験の教科書ですね。

昨年取れなかったのですが、今年は受験していないです。

と言うか、会社の資格取れ取れ方針に若干疑問と言うか、、、

f:id:Kazuhito00:20211231002753p:plain

 
8位:PythonとKerasによるディープラーニング 3841円

これは2018年に購入した書籍ですね。

しょうがないことですが、もう今読むと結構内容が古い👀

f:id:Kazuhito00:20211231002925p:plain


9位:Game Programming Patterns ソフトウェア開発の問題解決メニュー impress top gearシリーズ 3762円

記憶にない、、、👀

[Robert Nystrom, 阿部和也, 上西昌弘, 武舎広幸]のGame Programming Patterns ソフトウェア開発の問題解決メニュー impress top gearシリーズ


10位:現場で使える!NumPyデータ処理入門 機械学習・データサイエンスで役立つ高速処理手法 3762円

これも買って満足したやつだな多分、、、👀

[吉田 拓真, 尾原 颯]の現場で使える!NumPyデータ処理入門 機械学習・データサイエンスで役立つ高速処理手法

 

 価格合計 ※正確には現在価格の合計(発売停止等のデータ取得できないもの以外)

2,178,532円

合計金額が昨年より下がっている、、、

多分取得失敗したやつの影響ですね。

 

ちなみに、2021年のみの合計金額は、524,752円でした。

昨年は544,532円だったので同じくらい使ってますね🙄

 価格ヒストグラム

流石に分かりにくいですね。

f:id:Kazuhito00:20211231003740p:plain


範囲を0~1000円に絞ってみます↓

f:id:Kazuhito00:20211231003808p:plain


マンガが主なので、こんな感じですかねー。特に違和感無し。

ジャンル

ひとまず、value_counts()で数えてみます。

 

取得失敗(発売中止等)    3994
少年マンガ           954
青年マンガ           729
マンガ             596
ファンタジー          443
               ... 
ノンフィクション・伝記       1
将棋                1
世界史               1
コンピュータ・情報処理       1
自転車・サイクリング        1
Name: genre, Length: 63, dtype: int64

 

「取得失敗(発売中止等)」が多すぎて、もはや情報として意味をなしてないな、、、🙄

f:id:Kazuhito00:20211231003910p:plain

ジャンルTop10

取得失敗した件数が3994件(約52%)あるのが痛すぎますね、、、

昨年は取得失敗割合は約12%だったので、かなりダメダメになってます。

f:id:Kazuhito00:20211231004111p:plain