大規模ゲノム疫学研究の統合情報基盤の構築
研究代表者
共同研究代表者
概要
大規模ゲノム疫学研究の詳細かつ多様な情報を統合・一元管理するデータベースを構築し、「ながはま0次コホート事業」参加者一万人の環境・生活習慣情報、健診情報、5,000人の全ゲノム多型情報に加え、複数の複合遺伝性疾患患者数千人の全ゲノム多型情報を登録し、日本固有のゲノム疫学情報として広く国内外に公開する。また、ゲノム情報学、遺伝統計学の若手研究者に実務を通じた教育訓練を実施し、専門家の育成をはかる。
担当者編集項目
オントロジーおよびデータフォーマットの活用(実績、予定)
・このプログラムで活用している(する予定の)既存のオントロジーやデータフォーマット形式
すべて独自IDで管理の上、可能な範囲で外部リソースとの関係づけを実施します。以下、その外部リソースのリストです。対応付く外部リソースの項目が無ければ、その外部リソースに新たに登録する予定です。
polymorphism:reference配列のビルド、genome上の位置、アレルの組合せで一意化のうえ、対応するdbsnpと関係づけ。構造多型、ハプロタイプについては適切な外部DBが無く、今後の課題と考えている。
transcriptome:reference配列のビルド、ampliconのgenome上の位置(複数)で一意化のうえ、NCBI probe 経由で対応するrefseq Geneと関係づけ。商用マイクロアレイであれば、そのプローブIDから直接NCBI probeへ対応させる。ncRNAは未検討。
proteome:予定無
metabolome:化学構造で一意化の上、pubChemと関係づけ
phenome:臨床情報名とそのプロトコル(データ生成方法、データ型、型別の制約(例えば数値型なら最小最大だし、カテゴリ型なら各カテゴリの適格基準)で一意化の上、SNOMEDと関係づけ。さらに、医薬品に関わる項目は、その医薬品を、KEGG DRUGと関係づけ
・このプログラムで開発する(あるいは予定の)新規のオントロジーやデータフォーマット形式
Future work
・近い将来、実現したい機能など
国際標準化に関する情報
・各分野で、デファクトスタンダードとなっているデータベースや、オーソリティーが提供するデータベース