からあげさんの「Kindleの蔵書情報をKindleアプリのXMLをパースして可視化する方法」です。
Amazon Product Advertising API(商品情報API)追加版ノートブック
からあげさんの公開ノートブックをベースに、Amazonの商品情報APIを使用した処理を追加しています。
Amazonの商品情報APIを使用する際には、以下を設定してください。
KEY = "<ACCESS KEY>"
SECRET = "<SECRET ACCESS KEY>"
TAG = "<TAG>"
蔵書数
7609になりました。
昨年から1195冊増加です。
年毎の購入数
2015年に及ばないものの2021年も結構購入していますね。
月毎の購入数
今年は11月にめっちゃ買ってるな、、、👀
調べたら、唐突に「るろうに剣心」とか「最遊記」とか全巻買いしていましたわ、、、
衝動買い🦔
日毎の購入数
3日が多いのは前述の衝動買いの結果です👻
曜日毎の購入数
水曜日が多いのは前述の衝動買いの結果です👻
タイトル文字数の分析
平均:17.192667
標準偏差:12.549909
最小:1
最大:116
文字数1のタイトル
前回から変わらず「累」です。
文字数116のタイトル
こちらは前回と変わり
「ゲーム仲間のおっさんとオフ会したら世界ランク1位の美女だった。: 親友に裏切られ、絶望する俺を慰めてくれるゲーム仲間とオフ会したら世界ランク1位の美女だった。美女「君は天才だ…仲間になってほしい♥」俺「え…」 ホメテノバス【V漫画】」です。
無料漫画ですね。ただ、これ多分ダウンロードすらしていない、、、👀
筆者の分析
三田紀房先生のマンガを買いたしているので、3位に浮上しています。
Amazon Product Advertising API(商品情報API)で情報取得
昨年と同じく、ASIN(Amazon Standard Identification Number)を元に価格とジャンルを取得しました。
API呼び出し毎にASINが10個まで指定できるので、10個ずつAPIをforでぶん回しています。
Amazon側には負荷をかけないようにAPI呼び出し毎に、1秒スリープをしているので、ボチボチ時間かかります。
自分の環境では7609件で14分12秒かかりました。
取得できないデータ
今年もAPIで情報取得できないデータが結構な数ありました。
- 発売停止になったもの
- kindle unlimitedに登録し直しされて、ASINが変わったと思われるもの
- 期間限定で公開されていたものが公開終了したもの
おそらく上記の3パターンなのですが、今年がっつり件数が増えていました、、、👀
価格
ひとまず、価格をdescribe()で要約統計量眺めてみます。
データ取得できなかったやつは、ひとまず除外。
- 平均:602.636791
- 標準偏差:468.764434
- 最小値:0.000000
- 25%:441.500000
- 50%:600.000000
- 75%:660.000000
- 最大値:4400.000000
あれ?4400円?
Code Completeとか取得失敗しているのかしら?
価格Top10
とりあえず、Top10を眺めてみます。
1位:ファイナルファンタジーVII リメイク マテリアル アルティマニア 4400円
FF7Rのマテリアル アルティマニアですね。
詳細な設定とか書かれていて中々読みごたえと満足度の高い本でした。
2位:Pythonによる医療データ分析入門 pandas+擬似レセプト編 4159円
医療データ分析の本です。
これは昨年買ったやつで今年は読んでいませんが、中々良書だった記憶があります。
3位:TensorFlow機械学習クックブック Pythonベースの活用レシピ60+ impres... 4158円
TensorFlowを良く触る人なら、とりあえず買っているんじゃないかと思っている本。
4位:ゲームメカニクス大全 ボードゲームに学ぶ「おもしろさ」の仕掛け 3940円
裏でインディーゲーム制作のお手伝いもしているので、そっち方面のお勉強系書籍。
ゲーム制作しなくても面白い本です。
5位:Python機械学習ライブラリ scikit-learn活用レシピ80+ impress t... 3861円
この手のやつ、買っただけで満足しているシリーズな気がします、、、
買うと安心する。
でも、実用するときは困りごとはググる。みたいな🙄
昨年買った本ですが、今年は読んでないな多分、、、
6位:美味しいマイナー魚介図鑑 3856円
唐突に魚介図鑑。
マイナー珍魚度、味の良さ、値段で評価されています🐟
7位:情報処理教科書 エンベデッドシステムスペシャリスト 2019~2020年版 3841円
ES試験の教科書ですね。
昨年取れなかったのですが、今年は受験していないです。
と言うか、会社の資格取れ取れ方針に若干疑問と言うか、、、
8位:PythonとKerasによるディープラーニング 3841円
これは2018年に購入した書籍ですね。
しょうがないことですが、もう今読むと結構内容が古い👀
9位:Game Programming Patterns ソフトウェア開発の問題解決メニュー impress top gearシリーズ 3762円
記憶にない、、、👀
10位:現場で使える!NumPyデータ処理入門 機械学習・データサイエンスで役立つ高速処理手法 3762円
これも買って満足したやつだな多分、、、👀
価格合計 ※正確には現在価格の合計(発売停止等のデータ取得できないもの以外)
2,178,532円
合計金額が昨年より下がっている、、、
多分取得失敗したやつの影響ですね。
ちなみに、2021年のみの合計金額は、524,752円でした。
昨年は544,532円だったので同じくらい使ってますね🙄
価格ヒストグラム
流石に分かりにくいですね。
範囲を0~1000円に絞ってみます↓
マンガが主なので、こんな感じですかねー。特に違和感無し。
ジャンル
ひとまず、value_counts()で数えてみます。
取得失敗(発売中止等) 3994
少年マンガ 954
青年マンガ 729
マンガ 596
ファンタジー 443
...
ノンフィクション・伝記 1
将棋 1
世界史 1
コンピュータ・情報処理 1
自転車・サイクリング 1
Name: genre, Length: 63, dtype: int64
「取得失敗(発売中止等)」が多すぎて、もはや情報として意味をなしてないな、、、🙄
ジャンルTop10
取得失敗した件数が3994件(約52%)あるのが痛すぎますね、、、
昨年は取得失敗割合は約12%だったので、かなりダメダメになってます。