2019年10月28日月曜日

GPUの増設検討メモ

Mac miniでMinIONデータのベースコールをliveで行なっているが、一週間過ぎた現時点でも50%ほどしか進んでいない。これだと、48hほどランしたwhole genome DNA-seqのデータをベースコールするのに二週間以上かかりそうだ。これではちょっと不便だが、Nanopore communityの情報を見ていくと、CPUを使ったベースコールはだいぶ時間がかかるようだ。それに加えるとGPUを使った場合はかなり時間が短縮されるようだ。

性能の高いGPUは、機械学習にも使うことができるようで、この際GPU増設を行おうかという気になっている。ベースコールに使う場合、そもそもLinuxしかGPUを使った計算はできないらしい。しかもUbuntu限定のようだ。現在運用中のLinuxはcentosなので、もしMinIONのベースコールを行うのならOSごと変えないといけない。プラス、SSDのアップグレードも必要だろう。

とりあえずnanopore communityの情報などをもとに、GPUについて調べた。
  • https://community.nanoporetech.com/posts/gpu-for-basecalling に情報あった。
  • CUDA capability of 6.0 or greate が必要らしい。
  • 中の人は、GeForce RTX 2080Tiを使っているとある。
  • また、Nvidia quadro RTX8000がサポートされているかとの質問には、使えるだろうという回答。CUDA 7.5だから。
NVIDIAのCUDAの確認は、以下のサイトからできた。
  • https://developer.nvidia.com/cuda-gpus#compute
GeForce RTX 2080Tiは、12〜18万円くらいみたいだ。なかなかの値段。これに、SSD追加費用などを含めると、20万円ほどになるのではないかと思われる。

CUDA 6.0以上ということなので、もう少し安価なGPUを探すこともできるだろう。
以前WSを買ったUnivのサイトで、アカデミック限定でNVIDIA Quadro RTX 6000/8000のキャンペーンをやっていた。これは38万から55万円。オーバースペックかもしれない。

他の解決方法

  •  他研究室の先生と話していたが、CPUオンリーの計算で済ますとして、何台ものPCにfast5データを分けて並行してbasecallしたらいいんじゃないかという話が出た。PCを購入する必要が出てくるが、PCは他のことにも使うことができる。
  • もう一つの解決策は、Nanoporeが売っているMinITを買うことだろう。GPU accelerators (ARM processor 6 cores, 256 Core GPUとある。ただ、他の用途には使えないだろう。