データ&リソース

データベース

研究を推進するため、各種データベースを開発、運用しています。

› ソフトウェア

SDRF2GRAPH

  • 概要: SDRF2GRAPHはMAGE-tab形式により記述されたSDRFファイル(*.xslx)からグラフィカルなイメージを生成するソフトウェアです。
  • システム要件: Ruby, rexml, rubyzip, GraphViz.
  • 再配布条件: Ruby's license
  • 参考文献:
    • Hideya Kawaji et al., "SDRF2GRAPH - a visualization tool of a spreadsheet-based description of experimental processes". BMC Bioinformatics 2009, 10:133
  • URL: http://fantom.gsc.riken.jp/4/sdrf2graph

Nexalign

  • 概要: Nexalign は、次世代シーケンサーによって得られる短い塩基配列のアライメントを行うプログラムです。
  • システム要件: Unix / Linux.
  • 再配布条件: GNU General Public License
  • ダウンロード: nexalign-1.3.5.tgz
  • 連絡先: timolassmann@gmail.com

TagDust

  • 概要: TagDustは、次世代シーケンサーで得られるデータセットから様々な種類のアーティファクトを除去するプログラムです。
  • システム要件: Unix / Linux.
  • 再配布条件: GNU General Public License
  • 参考文献:
    • Lassmann T., et al. (2009) TagDust - A program to eliminate artifacts from next generation sequencing data. Bioinformatics.
  • ダウンロード: tagdust.tgz
  • 連絡先: timolassmann@gmail.com

EdgeExpressDB (eeDB)

  • 概要: EdgeExpressDB (eeDB) は、大規模な生物学データを統合・可視化する目的で設計されたデータ抽象・連合ミドルウェアです。本データベースは、10ペタバイト以上のデータを想定してデザインされています。ソースコードはCPANから入手可能ですので、興味のある方がEEDBをインストールしたサーバーを立ち上げることができます。
  • システム要件: Perl DBI/DBD, MySQL, SQLite.
  • 再配布条件: BSD License
  • 参考文献:
    • Jessica Severin, et.al. FANTOM4 EdgeExpressDB: an integrated database of genes, microRNAs, their promoters, expression dynamics and regulatory interactions. Genome Biology, 10:R39, 1-9 (2009)
  • ダウンロード: http://sourceforge.net/projects/eedb/, available via CPAN (http://search.cpan.org/~jms/EdgeExpressDB_0.953h/).

MuMRescueLite

  • 概要: MuMRescueLiteは、ゲノム上の複数個所にマッピングされるタグ配列を発現解析に用いるためのプログラムです。CAGE解析やChIP-Seq解析などで短いタグ配列をゲノムにマップする場合、タグ配列がゲノム上の複数の箇所にマップされる(multi-mapping tags or MuMs)ことがしばしばあります。通常、このような配列は、その後の解析に用いられませんが、これによって実験的なバイアスが起きたり、網羅性が低下するという問題がありました。MuMRescueLiteを使用することで、限られた計算資源で、発現解析にこれらのタグを含めることができるようになります。
  • システム要件: Python2.4 or later; platform is same to the Python itself.
  • 再配布条件: The MIT License.
  • 参考文献:
    • Faulkner, G.J., et al. (2008) A rescue strategy for multi-mapping short sequence tags refines surveys of transcriptional activity by CAGE, Genomics.
    • Hashimoto, T., et al. (2009) Probabilistic resolution of multi-mapping reads in massively parallel sequencing data using MuMRescueLite, Bioinformatics.
  • ダウンロード: MuMRescueLite_090522.tar.gz
  • サンプルデータセット: MuMRescueLite_test_data.tsv.gz

クローン

1. FANTOM3クローン

FANTOM3クローン(完全にアノテーションされた102,801個のマウスの完全長cDNAクローン)は、理研が指定した頒布業者を通じて提供可能です。

2. その他のクローン

Other clone(s) Contact: 

シーケンスデータ

理研が公開する全てのシーケンスデータは公開データベースに登録されます。

1. 理研シーケンスデータの使用

全てのシーケンスデータのファイルは理研マウスcDNA百科事典アーカイブに圧縮保存されており、HTTPを通じてダウンロード出来ます。圧縮されたファイルは圧縮解除("uncompress")を用いて元のフォーマットに拡張することが出来ます。これらのファイルをダウンロードする時は、ユーザーの記録のため、までEメールにてご連絡お願いします。

備考:お使いになるブラウザーによっては、ダウンロード時にトラブルが発生する可能性があります。そのような場合にはブラウザーの"save link as"という機能を選んでください。これによりトラブルを軽減することが出来るはずです。

学会発表や公開の資料に理研マウスエンサイクロペディアを用いる場合には、引用フォーマットを御利用ください。

2. ダウンロード可能なアーカイブの内容

理研の全長配列データの中には、他機関から提供されたEST(端読み)データを使ってアセンブルしたものが含まれています。そのような場合には、データ登録機関であるDDBJにそのような配列データを登録していないので、ご留意をお願いします。FANTOM3クローンに関するデータの全てがDDBJに登録されているものではなく、DDBJが公開している理研のリソース関連のデータに含まれていない場合もあります。

お問い合わせ

データとクローンに関する御質問等ございましたら、Eメールにて下記宛にお問い合わせ下さい。

メールアドレス:

独立行政法人 理化学研究所 オミックス基盤研究領域
〒230-0045 神奈川県横浜市鶴見区末広町1-7-22
電話番号:045-503-9222
FAX番号:045-503-9216