ここ数日、一つのプロジェクトの解析で使うスクリプトをJupyter notebookを使って書いている。カーネルをpython3、bash、Rと使えるようにしておいて、ノートブックの途中でカーネルを変えながら、シェルスクリプトやpythonのプログラムを一つのファイルで記述していっている。こういう風にしていく理由の一つは、プロジェクト全体でどのようにデータ処理をしていったのか、流れがわかりやすくなるかなと思ったからだ。
これまではプロジェクトのディレクトリの色々な箇所にスクリプトが分散して置かれているような状態になっていて、一気に読めなかった。また、それぞれの処理の順番などが、後で見返したときにわかりにくいような気がしていた。
notebookにまとめると、そういった点は分かりやすくなったような気がする。標準出力も保存できるので、記録にもなる。あと、その都度アイデアなどをmarkdownでまとめていって、解析の流れの中で見れるのも便利だった。ただ、スクリプトや解析が長くなると逆に見づらくなってしまう。試行錯誤をしながら短いスクリプトの処理を積み重ねていくような場合だと、notebookが良いのだろうととりあえずの結論。