2019年10月1日火曜日

中国系のゲノムデータベースのサイトBRADが現在利用不可

Brassica rapaのゲノム情報を公開しているBrassica database (通称BRAD)というサイトがある。Brassica rapaについては、欧米系のポータルサイトもあるが、いわゆるハクサイ(Chiifu)のゲノムを解読したのは中国の研究グループで、標準の情報もそちらのサイトに集約されている。ときかく中国系の研究グループはパワフルで、標準系統だけでなく多数の系統のリシークエンスデータを読んで論文を出し続けていて、とても他の国の研究者が敵う感じではない。で、そのゲノム情報がまとめてあるBRADのサイトをよく使っているが、今日久しぶりに見てみたら、以下のようになっていてサイトにアクセスできない。


 中国語のメッセージで、しかも簡体字だと何を書いてあるのか分からない。で、google翻訳を中国語で使ってみることにした。すると、


 すごく流暢な和訳が返ってきた。どうも、中国の法規に引っかかるものがあって利用できなくなっているようだ。ハクサイゲノムの情報を公開していることと何か関連があるのだろうか?日本語訳された情報がいわくありげな感じで想像力が掻き立てられるが、いつになったら再開するのだろうか?

Google翻訳を前提にした非英語情報のネットサーフィン

先日にも書いたが、google翻訳はすでに実用的な段階になっている。今回はgoogle翻訳があるおかげで現在の状況の把握ができた。中国語だけでなく、自分が知らない言語について助けになることが身を以てわかった感じがする。これまでにも、翻訳サイトを使って海外のブログを読んでいる人がいるとか、海外サイトを見ている人がいるとかは知っていたが、うかつにもあんまりピンと来ていなかった。海外サイトを見るにしても、英語情報で事足りる場合が多かったし、英語ならばそこまで翻訳サイトを頼る必要がなかった。逆に言えば、英語以外の情報はあまり注意して探してみようとしていなかった。これからは何か情報を得たいときに、google翻訳が使えることを前提として、英語圏以外のサイトも見るのが当たり前になっていくのかも(自分が疎いだけでもうみんなそうしているのかもしれないけど)。
多分、分かっている人には前から分かっていて、すでにそういう風に行動しているんだろうなと思った。

逆説的だが、非英語圏のネットワークを探していくために、キーワードとなるとっかかりの単語や、簡単な知識は逆に色々な言語であったほうが良い気がした。言い回しとか、文化的な背景とかで、日本語そのままの発想だと適切なキーワードが思いつかない場合もあると思う。

これからの語学学習は、やはりこういう翻訳技術があることを前提にして、それらを役立てる方向で進めたほうが良いように思った(スタンドアロンで読み書き会話ができる、というのが目的ではなく)。


科学研究で中国のデータベースが普通に使われる現代

もう一つ思ったのが、ゲノムデータベースとして、中国の研究者が運営するデータベースサイトが研究分野や対象によってはもう普通であるということを改めて認識したことだ。今回のBrassica rapaのゲノムデータについてはまさにその通りで、リファレンスとして普通に使われている。そして、このエラーメッセージからは、何がしかの法的規制によってサイトが使えなくなったことがうかがえた。同様のことは欧米や日本の場合でも起こりうるのだろうが、基礎科学のデータベス、それもハクサイゲノムのデータベースでこのメッセージを見たことにとても強い違和感を覚えた。中国は科学技術の研究に多額の予算を費やしていて、日に日に存在感を増している。これからの科学研究で中国発のデータにますます頼るようになった場合に、中国の法規や国内事情によってそれが使用できなくなり研究に支障が出る、というようなことが現実として普通に起こるようになるのかな、とふと思った(今回のサイト利用できなくなった件の理由はよく分からないので、もっと単純な理由なのかもしれないが)。