ユーザ用ツール

サイト用ツール


kusarinoko_search_sra_entries_with_pubmed_article

Kusarinoko: Search SRA Entries with PubMed Article

  • 概 要
    • 公共データベース (SRA, ENA, DRA)から、 “使える”「次世代シーケンサーデータ」を探すDBシステムです。
    • 公共データベース (SRA, ENA, DRA)に登録された次世代シーケンサーデータのうち、論文で公表され信頼性が確保されたと考えられるデータを収録しています。
    • さらに、 上記のデータには、 FastQCを用いて算出した配列データのクオリティーをあらわす統計量が与えられています。
    • メタデータを整理、充実させました。
    • その結果、ユーザーは、キーワード検索を行うとともに、配列データのクオリティー評価を参考に、自分が必要とする信頼性が高いデータを見つけることができます。
    • 提供されるクオリティーチェックの項目
      1. Per Base Sequence Quality(リードのクオリティー)
      2. Per sequence quality scores(クオリティーの分布)
      3. Per base sequence content(各塩基の割合)
      4. Per base GC content(GC含量)
      5. Per sequence GC content(GC含量の分布)
      6. Per Base N Content(いずれの塩基も割り当てられなかった割合)
      7. Sequence Length Distribution(リードの長さの分布)
      8. Sequence Duplication Levels(重複レベル)
      9. Overrepresented Sequences(出現頻度が高い配列)
      10. K-mer Content (kmerの出現頻度)
  • 今後の予定
    • 表示コンテンツの拡充、また視認性向上などのアップデートを行っています。
    • シーケンスクオリティを基準とした検索や、データベース全体を俯瞰するシステムを提供します。
    • SRAsの拡張プロジェクトとしてスタートしたため、SRAsの内部ブラウザとして統合を進めています。
  • 参考文献・資料
    • Kusarinoko: Developing the public nextgeneration sequencing data search interface that works.(第34回日本分子生物学会年会 2011年12月) 口頭発表スライド  ポスター
  • キーワード解説
      • 次世代シーケンサーなどハイスループットの配列データのクオリティーチェックを行うソフトウェア。評価結果はグラフ表示される。同様の機能を持つツールとして、SolexaQA、FASTX-Toolkit などがある。
kusarinoko_search_sra_entries_with_pubmed_article.txt · 最終更新: 2012/01/31 17:17 +0900 by kushidat