ユーザ用ツール

サイト用ツール


大規模ゲノム疫学研究の統合情報基盤の構築

大規模ゲノム疫学研究の統合情報基盤の構築

研究代表者

  • 松田 文彦 先生 (京都大学 大学院医学研究科 附属ゲノム医学センター センター長・教授)

共同研究代表者

  • 佐藤 孝明 先生 (島津製作所 基盤技術研究所 ライフサイエンス研究所 所長)

概要

大規模ゲノム疫学研究の詳細かつ多様な情報を統合・一元管理するデータベースを構築し、「ながはま0次コホート事業」参加者一万人の環境・生活習慣情報、健診情報、5,000人の全ゲノム多型情報に加え、複数の複合遺伝性疾患患者数千人の全ゲノム多型情報を登録し、日本固有のゲノム疫学情報として広く国内外に公開する。また、ゲノム情報学、遺伝統計学の若手研究者に実務を通じた教育訓練を実施し、専門家の育成をはかる。



担当者編集項目

オントロジーおよびデータフォーマットの活用(実績、予定)

・このプログラムで活用している(する予定の)既存のオントロジーやデータフォーマット形式

すべて独自IDで管理の上、可能な範囲で外部リソースとの関係づけを実施します。以下、その外部リソースのリストです。対応付く外部リソースの項目が無ければ、その外部リソースに新たに登録する予定です。

  • polymorphism:reference配列のビルド、genome上の位置、アレルの組合せで一意化のうえ、対応するdbsnpと関係づけ。構造多型、ハプロタイプについては適切な外部DBが無く、今後の課題と考えている。
  • transcriptome:reference配列のビルド、ampliconのgenome上の位置(複数)で一意化のうえ、NCBI probe 経由で対応するrefseq Geneと関係づけ。商用マイクロアレイであれば、そのプローブIDから直接NCBI probeへ対応させる。ncRNAは未検討。
  • proteome:予定無
  • metabolome:化学構造で一意化の上、pubChemと関係づけ
  • phenome:臨床情報名とそのプロトコル(データ生成方法、データ型、型別の制約(例えば数値型なら最小最大だし、カテゴリ型なら各カテゴリの適格基準)で一意化の上、SNOMEDと関係づけ。さらに、医薬品に関わる項目は、その医薬品を、KEGG DRUGと関係づけ

・このプログラムで開発する(あるいは予定の)新規のオントロジーやデータフォーマット形式

  • 現時点では新たなオントロジーの開発は考えていません。データフォーマットとしては、オミックス横断的にメタデータを定義するものを開発したいと考えています。

Future work

・近い将来、実現したい機能など

  • まずは、「事前に各項目を厳密に標準化し、それに基づいてデータを作ることを促す(強制する)」ための仕組み作りに力点を置きたいと考えています。

国際標準化に関する情報

・各分野で、デファクトスタンダードとなっているデータベースや、オーソリティーが提供するデータベース

  •  NCBIのdbGaPが、ゲノム疫学の共通公開基盤となっており、非常に参考になります。
大規模ゲノム疫学研究の統合情報基盤の構築.txt · 最終更新: 2011/12/27 10:33 +0900 (外部編集)