ユーザ用ツール

サイト用ツール


カタログ

カタログ (Integbioデータベースカタログ)

概要

  • 生命科学系データベースの所在情報と、データベースについての説明やさまざまな属性(メタデータ)をまとめたリスト(データベースカタログ)を作成しています。
  • 国内のデータベースについては各省で情報収集を進め、4省のデータベース情報を網羅していきます。
  • 本カタログの利用許諾はクリエイティブ・コモンズCC0ライセンスで提供しています。

方針

収録対象と収録状況

収録対象

  • 国内の研究資金で作成されたデータセットのうちWeb 上でデータベースとして公開、運営されているものはほぼ100%網羅する。
  • 多数のデータベースが紐づくポータルサイト、統合検索サイト、非公開及び紙媒体のデータセットは収録対象とはするがその網羅については当面目標とはしない。
  • 海外のデータベースについてはNAR Database Issue等のデータベースを主題とする主要ジャーナルに論文が掲載されているデータベースが漏れないよう配慮する。ただし2012以降はBioDBCoreと役割が重複しないよう配慮する。

収録状況

進捗 (更新日:2013/4/11)

2013年 (予定)

  • 英語サイトの公開(5〜6月)「説明」項目以外の項目を先行して公開予定 → 6/17に公開
  • 生物分類によるレコードの絞り込み機能の追加
  • 新規メタデータ項目の追加:「論文等 (PubMed ID以外)」、「統括サイト」
  • 文科省資金 (JST、科研費、他)別のデータベースあるなし調査の継続
  • 省間連携でのレコードの追加
  • キュレーション用のDBレコード (URLや名称)照合チェックツールの改良
  • BioDBCoreなど海外のカタログサービスとの交流 → BH13にて関係者と議論、RDF化のためのdescriptorsの整理

2012年

  • 10/1 「Integbioデータベースカタログ」正式公開
  • データベースの分類:ファセット型のカテゴリを公開

2011年

  • 未収録データベース調査と新規メタデータ作成
    • 各省よりデータベース情報の受領→収録完了 【2011/9】【済】
    • NAR DB issue 2011の調査とメタデータ作成 【2012/1~】【進行中】
    • 統合化推進「ゲノム情報に基づく植物データベースの統合」より受領した植物関連データベースリストのうち国内DBを対象にメタデータ作成【2012/1~】【進行中】

今後の予定

  • データベースの分類を用いた動向マップつくり
  • 国際交流(BioDBCore)

類似のプロジェクト、サイトの調査

データベースの分類方法を中心に既存の類似プロジェクトを調査する。この調査結果をもとにIntegbioでのデータベースの分類方法について検討する。 (更新日:2012/2/15 作成者:坂東)

プロジェクト名概要メンバーデータベースの分類その他
BioDBCore ライフサイエンス系DBの属性情報を記述するための世界標準となるminimum information checklistを策定するプロジェクト。MIBBI代表者、データベースに関する論文を収載している主要ジャーナルの編集者、各種モデル生物のデータベース構築者、APBioNetのメンバー、Bioinformatics Links Directoryのメンバー、ELIXIRの開発者、CASIMIRプロジェクトのDDF (Database Description Framework)リーダー等が共同でワーキンググループをもっている。Check ListはISBBiosharingと協同で監修している。未公開BioDBCoreについては下記に詳細あり
NAR Database Summary Paper Category ListNARのDatabase issueを含むジャーナルの論文中で紹介されたデータベースのリスト。1000件以上収録済。簡単なsummaryがついている。Nucleic Acid Researchの編集者。BioDBCoreに参加している。独自のカテゴリ体系を利用している。NARのDatabase issueの論文の分類としてバイオインフォマティクス領域では知られているカテゴリではある。現象や生物種などいくつかの観点が混同した作りになっている。DB issue2012からDBメタデータの提出をサプリメントデータとして著者に依頼しBioDBCoreに提供することになっているが、今後のBioDBCoreと本リストの棲み分けの方針については不明
Bioinformatics.ca links directory バイオインフォマティクスの専門家が推奨するリソースを掲載している。2003年よりNARのWebserver issueに掲載している全リソースの収録開始。CC-BY-SACanadian Bioinformatics Workshopsによる。NARとコラボレーション。一般からの推奨リソース情報の登録をフォームで受けつけているが必ず内部のスタッフが登録すべきか否かレビューを行う。独自のカテゴリ体系を利用している。プログラミング言語別などツール、ウェブサーバーを対象としたカテゴリを多く含む。なし
MIRIAMEBIにおけるBioDBCoreの先駆け的なプロジェクト?? MIBBIに登録されている。computational modelを表現するための標準的なURIの設計を主な目的としていた模様。EBIpathway, proteinなど独自のタグを仕様。カテゴリタブの中に掲載、タグクラウドページもありなし
Biositemaps 生命科学系のオンラインリソース情報の概要を記載するためのBiositemap.rdfファイルの記載仕様を提供している。リソースの所在情報の提供を行うことで、異なるデータベースから由来するデータを組み合わせた解析を促進することを目的とする。 Resource Discovery Systemを公開。1570リソース情報を提供中 (2012/2)。the NIH Roadmap National Centers of Biomedical Computing (NCBC)が提唱。またオントロジーとして利用しているBROはOBO (Biosharingのメンバー)が提供。resource_type, area of research, activityについてはBROを利用して記述。メタデータ項目のAdditional Informationのセクションには別途、keywordsの項目がある (例:Progenesis,SameSpot,PG220,DeCyder,MALDI,PVDF,isoelectric,typhoon)カテゴリの一覧ページがあり、選択してレコードを絞り込めるのが良い。BioDBCoreとの今後の関係は?
DRCAT (the data resource catalogue)EMBOSSのデータ統合のために開発された。http://drcat.sourceforge.net/drcatindex.htmlのブラウザから閲覧できる。sourceforgeにα版のダウンロードファイルもあり。655エントリーEBI•「EDAM Topics」項目ではEDAMのtopic以下のオントロジーを用いている。•「Category」項目ではUniProtが外部データベースのクロスレファレンスを掲載する際に利用しているカテゴリ名を用いている 。具体的にはUniProtのクロスレファレンスリスト (http://www.uniprot.org/docs/dbxrefの「Cat」の語彙 (Family and domain databases, Sequence databasesなど)を利用しているので参照のこと。なし
CASIMIR Database Description Framework (DDF)データベースのメタデータよりはアーカイブのデータのメタデータに近い。アカウントを取得して自由にレコードを作成可能。CASIMIRプロジェクトはマウスの機能ジェノミクスのためのデータ統合を目指している活動であるため、マウスに特化している様子がある。現在は頻繁に更新していない?CASIMIRプロジェクト (UK)。the European Commission within its FP6 Programme, under the thematic area “Life sciences, genomics and biotechnology for health,” のファンディングを受けているデータベースの分類、キーワードはなし。なし
NIF Registry NIF (Neuroscience information framework)のキュレーターがセレクトしたリソースを収録。データベース、ソフトウェア、脳のアトラス、グラントのサイト、バイオリソースのバンクなど多様なリソースを含む。Biosharingのメンバー調査中調査中
Pathguide (the pathway resource list)パスウェイに関連するリソースのリンク集。325エントリー。分かりやすいインターフェイス。調査中パスウェイの標準であるBioPAX, CeIIMLなどの仕様の有無についての項目、パスウェイ別カテゴリ、“Types of Data“などがある。なし
BioCatalogue ウェブサービスのカタログ。2274のサービスを収録。登録制。BBSRC (EBIなどの組織が参加)というプロジェクトが提供 SOAP,RESTなどウェブサービスに特化したカテゴリ 調査中
BioMed Central Databases1100以上のDBを収録。BioMed Centralのジャーナルで論文発表を行ったデータベースに限ってはいないようだ?ユーザーからの新規のデータベース情報も受けつけている。簡単なDescriptionの項目があり。この活動とは別にBioMed Centralに論文を投稿する著者のデータベース作成の支援も行っている。リンク切れがあり、ステータス状況が分からない。BioMed CentralSubjectとContentsの2つのカテゴリを組み合わせて検索ができる。SubjectはBioMed Centralのジャーナル分類に用いられているカテゴリBioMedはBiosharingのメンバーだが、BioDBCoreとの関係はどうなっているのか?
理研データベースレジストリ理研を含む世界中の公共DBが収録されたカタログ。現在125件。理研NARデータベースカテゴリを翻訳して利用なし
NBRPのリソースリスト国内外の遺伝資源提供サイトをリストアップしているNBRP情報センター動物、植物、微生物ごとに個々の生物種名をカテゴリとしてまとめているなし
OReFiLPubMedのアブストラクトとBioMed Centralのフルテキストを対象に、論文中に記述されているオンラインリソース (データベースやツールなど)のURL情報を自動的に取得し、各オンラインリソースURLとPubMedへのリンクを併せて提供するサービスライフサイエンス統合データベースセンターオンラインリソースについて記述した論文のPubMedアブストラクトに付与されたMeSH用語を利用して分類することが可能なし

BioDBCoreについて

  • 2011年 NAR DBissueに活動を紹介した論文を発表。17 Core attributesを提唱。RDFでのデータ共有を議論している。
  • 2011年8月 BH11にてワーキンググループ レポートSusanna Sansoneさん、Philippe Rocca-Serraさんを招待してBioDBCoreに準拠したRDFデータのプロト作成
  • 2012年サイト公開。NAR DB issue2012の論文によると、NAR DB issue 2012の投稿論文著者は公開したDBの属性情報についてBioDBCoreの定めるガイドラインに従って記述し、サプリメントデータとして提出することを求められている。現在サイト上で公開されているattributesは2011年に紹介された17 attributesとは異なる
カタログ.txt · 最終更新: 2013/07/10 09:36 +0900 by bando