『Pythonデータ分析/機械学習のための基本コーディング! pandasライブラリ活用入門』 Daniel Y. Chen:著 吉川邦夫:訳 福島真太朗:監訳 インプレス

買ったのがここ。

a-sue.hatenablog.com

途中でいろいろトラブったときのネタを書いたけど、まとまった時間が取れたので打ち込みながら読んで、昨夜最後まで到達した。
この手の本でちゃんと最後までやったのは初めてかも。
30年前、『プログラミング言語AWK』を買って打ち込みながら読んでたが、途中の時点で十分実用的に使えるレベルになっちゃったんで半分ぐらいで止まっちゃったなぁ。そのあと身の丈に合った範囲でどんどん使ったから、ある意味では正しいのだが。

この本ではpandasを使ってデータを取り込んでいろんな形で視覚化したり分析したりする手順を、基本的なところから始めて順番にやっていく。
Jupyter Notebook で入力しながらやっていくと、内部形式の違いとか分析の比較とかいろいろ確認する手順も語られてて非常に勉強になった。
全体の知識量が膨大なので、明日から自由自在に使いこなせるとは思わないが、pandasなどを使ったデータ処理について何が出来るかの基本的なことはわかったと思う。
ちゃんと身につけるには継続的に使わないとなー。

Pythonデータ分析/機械学習のための基本コーディング!  pandasライブラリ活用入門 (impress top gear)

Pythonデータ分析/機械学習のための基本コーディング! pandasライブラリ活用入門 (impress top gear)

追記

この本の GitHub リポジトリはこちら。中で使用するデータなどが入手できます。

GitHub - chendaniely/pandas_for_everyone: Repository to accompany "Pandas for Everyone"