2019年7月30日火曜日

tRFs の発現パターンと、機能的意義

tRNA : 転移RNA、またはトランスファーRNAは、翻訳の過程でアダプターとして働く小型のRNA分子で、だいたい100bpに満たないくらいの長さがある。翻訳の過程で遺伝暗号の解読を担っている。tRNAは転写されたのちに折りたたまれてクローバー葉構造(cloverleaf structure)の二次構造をとる。この二次構造は分子内塩基対形成(intramolecular base pairing)によって、1本のポリヌクレオチド鎖から形成される。鎖の異なる部分の間で塩基対ができ、Dアーム、アンチコドンアーム、Tアーム、受容アームと可変ループなどが形成される。

tRFs: 最近、tRNAの部分的な配列が小分子RNAとして大量に存在していることを報告する論文が複数の生物種で報告されている。このようなtRNA由来の断片は、tRNA-derived fragments (tRFs) と呼ばれる。tRNAの半分くらいの長さがある場合、tRNA halves という呼び方をしている場合もあるようだ。tRFsの機能的意義ははっきりしないが、遺伝子発現の調節、トランスポゾンの抑制などが提唱されている。がん細胞の増殖や抑制にも関連していると考える研究者もいる。機能を持つ場合はAGOにロードされて働く場合があると考えられる。

疑問:tRFと考えられるようなtRNAの部分配列のフラグメントが存在するとして、それは何らかの機構で生成されるのか、それとも単にtRNAが分解された産物なのか、本当に機能的役割を持っているのか。また、sRNA-SeqのRNA抽出やライブラリ調整の過程でtRNAが分解されたり、ある分解された断片が優先的に読まれてしまうような、人工的なバイアスはないのか。人工的な断片、自然にdegradateした断片、積極的に生成された断片などを想定して、分類することはできるのか。


参考:
Martinez (2018) RNA Biol 15, 170-175
Zhu et al. (2019) Cancer Lett 452, 31-37
Hirose et al. (2015) BMC Genet 16:83
Martinez et al. (2017) Nucleic Acids Res 45, 5142-5152
Kumar et al (2014) BMC Biol 12:78
Thompson et al (2018) Plant Cell Physiol 59, e1

2019年7月28日日曜日

tRNAとtRNA-derived fragments (tRFs)のデータベース

small RNAのデータをいじっている途中で、tRNAの配列が参照したくなって探したところ、tRexというデータベースを見つけた。論文は、昨年のPlant Cell Physiol のデータベース特集に入っていた論文(Thompson et al., 2018 PCP)で、オープンアクセスになっている。UIが良くて、使い方はすぐ分かる。元になっているのは、シロイヌナズナのsmall RNAを解析している論文について公開されているデータが元になっているようだ。情報には、tRNA、元にしているNGSデータ、そしてtRNA-derived fragmentsの3つの入り口からアクセスできるようになっている。tRNA-derived fragmentsは、tRNAの一部分からなる小分子のRNAで、sRNA-seqの中で検出される。最近では他のsmall RNAのように発現調整のような機能がある場合が示唆されているようだ。tRFsのデータベースとして先行しているものとして、tRFdbというサイトがある。ただ、主な対象となっているのはヒトやマウス、ショウジョウバエ、酵母、線虫など動物系で、分子生物学やがんゲノム系のようだった。

tRFsはtRNAのどこの部分に由来するかによって分類されているようだが、tRexでは10種類に分類しているようだ(http://combio.pl/trex/help/)。


簡単な使い方として、小分子RNAの配列をblastすることができる。すると、相同性があるtRNAと、登録されているtRFsの両方のblast結果をそれぞれ表示してくれる。それぞれのヒットを選択すると、そのtRFの基本情報に加えて、tRFがマッチするtRNAの情報や、tRFの予想される標的なども示してくれる。




tRNAを検索することもできるようになっている。データベースのすべての配列は、ダウンロードページからfasta形式のファイルとして取得することができる。


引用元:
tRex: A Web Portal for Exploration of tRNA-Derived Fragments in Arabidopsis thaliana. 
Plant and Cell Physiology, https://doi.org/10.1093/pcp/pcx173

2019年7月25日木曜日

配列類似性に基づいたクラスタリング

small RNA配列の類似性でグループ分けをしたくなって、いくつかツールを試しながらパイプラインを作っている。最初にpythonで配列をざっと見て、同一配列などをカウントしてまとめていく。配列類似性のクラスタリングはメジャーなツールとしてはuclustcd-hitなどだろうか。uclustはサイトからダウンロードして実行権限をつけて使ってみた。cd-hitの方はcondaから導入できた。まだ詳細に試していないが、どちらかで分類していくつもりだ。

一方で、閾値の設定をどうすれば良いのかについてあらかじめ分かっているわけではなく、配列間の類似性の分布によっては、閾値の設定が高すぎる場合や低すぎる場合等でてきて最適な値かどうかは検討が必要だろう。こちらの方の記事でわかりやすく解説されていたが、MeShClustというプログラムはこの問題を解決してくれるかもしれない。今回解析しているデータではないが、配列類似性に基づいたトランスポゾンのデータ解析でも、アラインメントやグループ分けのところで似たようなことに悩むことは多い。このプログラムにアラインメントツールなどを組み合わせて、目視も含めながら効率的に解析していく方法があるんじゃないかとふと思った。配列類似性に加えて、挿入位置や向きなども組み込みながら解析するようなパイプラインができそうな気がするが、時間があるときに考えてみたい。

2019年7月22日月曜日

MinION 来たる

研究室にOxford nanoporeの卓上ロングリードシークエンサーであるMinIONが購入された。数年前に登場した時には、実験室や野外でもシークエンス可能な機器の大きさと、それでいてロングリードのシークエンスが可能という性能に驚かずにはいられなかった。東大界隈で盛り上がっている話とか、実際の論文に使用例が出てきたことで、その能力や可能性、制約などいろいろな情報も揃ってきている。研究室のいくつかのテーマに利用可能とPIが判断して、今年度の予算で購入された。話で聴いていただけだが、nanopore社に登録してアカウントを作らなければならなかったり、学内手続きに時間がかかったりして結構大変だったようだ。

本体はこんな感じの箱に入ってきた。なんだかスマホとか、ちょっと高めのIT機器みたいな感じだ。本体が収められているだけで、この箱自体はとても小さい。


中を開けると、金属製の本体が入っていた。なんだろう、本当に外付けディスクか何かのようだ。


取り出してみたところ。本体の下にはUSBケーブルが入っていた。データの転送スピードが違うのだろうか、コネクタの部分の色が金色だ。


機能的に重要なのは、この本体というよりは、そこにセットするフローセルのようだ。フローセルは個別包装で、4℃保存だった。最初は、ゲノムシークエンス用のキットがちょっと多めに購入された。下は、フローセルの袋の写真だ。


これから使い方を習得しないといけないが、本体やキットには説明書らしいものは一切添付されていない。詳細情報はWebページを通して、ということらしい。また、初回のキットの購入で、チュートリアルコースの受講ができるそうだが、東京(?)まで出席しないといけないそうで、人を出すのかどうかはまだ決まっていない。

どんな使い方ができるのか、これまでの実績やラボでのニーズをよく考えてみる必要があると思う。数年前の論文の段階で、エボラ熱の監視にポータブルシークエンサーを使う、というnatureの記事があったが、サイトでの利用例も出てきていて、本当にすごい時代になったなと思う。自分が大学院生の頃、学科のABi3700系のキャピラリシーケンサーを運用していたが、データ量、シークエンサーの可搬性など、この10数年で本当に想像できないくらいの進展だと思う。