ユーザ用ツール

サイト用ツール


実務者連絡会_化合物オントロジー検討会議_議事録_2011年11月11日

実務者連絡会 化合物オントロジー検討会議 議事録

  • 日時:2011年11月11日(金)10:00~12:15
  • 場所:公益財団法人野口研究所 会議室
  • オーガナイザー:金谷先生、山田先生
  • 参加者:13名
研究開発プログラム 氏 名 所 属
メタボローム・データベースの開発    金谷 重彦     奈良先端科学技術大学院大学      
有田 正規     東京大学      
櫻井  望     かずさDNA研究所       
荒   武    
ゲノム・メタゲノム情報を基盤とした微生物DBの統合 菅原 秀明   国立遺伝学研究所  
生命と環境のフェノーム統合データベース 土井 考爾 理化学研究所  
桝屋 啓志
糖鎖統合データベースと研究支援ツールの開発 山田 一作 野口研究所  
澤木 弘道  産業技術総合研究所 
大規模ゲノム疫学研究の統合情報基盤の構築    川口 喬久     京都大学   
データベース統合に関わる基盤技術開発 金  進東  ライフサイエンス統合データベースセンター  
時松 敏明 京都大学 
  櫛田 達矢 バイオサイエンスデータベースセンター  

議論の経過

オーガナイザー 金谷先生

  • 「(1)化合物オントロジーのニーズ、(2)化合物を取り扱う者にとって、このようなもの(オントロジー)があったら便利、を意識しながら議論を進めていきたい」
  • 「現在、5万種類以上のデータを効率的にオントロジーに対応させる問題をかかえている。手動で行うのは現実的に不可能」
  • 「フラボノイドについては、有田先生、時松先生と開発したフラボノイドデータベースがある」

川口先生

  • 「カルテからあがってくる多種多様なデータを整理する必要がある」
  • 「化合物オントロジーについては、薬剤の整理の観点から興味がある」
  • 「臨床医学のオントロジーとして、SNOMED(SNOMEDClinical Terms)を使っている」

菅原先生

Chemical Entities of Biological Interest (ChEBI)活用の検討

オーガナイザー 山田先生

  • 「データベースのデータのマッピングにChEBIが利用できるか?」
  • 「(1)硫酸基やリン酸基がどこについているか不明の化合物、(2)ポリマーなどをChEBIにマッピングすることは可能か?」
  • 「ChEBIでオントロジーマッピングをする場合、構造の似ているものにマッピングすればよいか?」
  • 「専門外の化合物があった場合、それがChEBIのツリー上のどこに対応しているか探すのは困難な作業になる」

有田先生

  • 「ChEBIは、いろいろなコミュニティーが使用することを想定して作られている」
  • 記号なしリスト「ChEBIは低分子化合物に最適化されている」
  • 「高分子化合物に対応するオントロジーは存在しない」

桝屋先生

  • 「自分の持っている化合物データを、ChEBIのグループに渡して、ChEBIに取り込んでもらい、IDをもらうことは可能ではないか。お互いのメリットなるのでは」

=>有田先生「ChEBIのグループとコネクションがあるので、上記が可能か問い合わせてみる」

金先生

  • 「(マッピングにChEBIを用いる場合の)ChEBIの問題点は、(1)概念の不足、(2)過剰、(3)間違っている」

=>山田先生「間違ってるというよりも、用途の問題にあると思う」

化合物データの取り扱いについていろいろな提案

有田先生

  • 「メタボロームの分野では、取り扱う化合物のほとんどが構造が不明」
  • 「抽出方法、極性、揮発度の情報が重要」
  • 「実験データ(化合物)のマッピングに使える分類体系が必要(ほかには存在しない)」
  • Dictionary of Natural Products (DNP)structuresの大分類が使えそう。フラボノイド、アルカロイド、脂質、タンニンがそれに相当する。」
  • 「糖脂質、糖鎖などは、DNPの大分類にはないため、新規に作る必要がある。」
  • 「その他、不足する概念は、DNPの大分類に(2段階程度まで)サブカテゴリーをつくることで対応すればよい」
  • 「合成化合物は、トップのレベルで分類するのが良いのでは」
  • PubChemはDNPの大分類のような検索はできない」
  • 「実験データ(化合物)をDNPの大分類でアノテーションすることができれば、成功と考える」
  • 「DNPのカテゴリーにあって、ChEBIにない概念は、ChEBIに追加してもらうことを検討」

有田先生の提案のまとめ

  • (1)精密質量データ、分析手法、実験方法の標準化取り組む。
  • (2)信頼度の指標を与える(例、Putative, Predicted, Identified)。
  • (3)CAS番号やInChI (The IUPAC International Chemical Identifier)がついているものはそれを使う。
  • (4)マシンリーダブルであれば、フォーマットは問わない。
  • (5)RDFタグに記述するのは、DNPの大分類程度の語彙をもちいる。

BioPortalを利用した既存オントロジーの再利用

金先生

  • BioPortalを使う利点
    • (1)作業が楽
    • (2)世界のグループとデータ変換が可能になる

桝屋先生?

  • 「BioPortalを使うとどれだけ作業が楽になるかイメージがわかない」

=>NBDC「BioPortalの講習会を近々開催したい」(12月上旬開催で調整中)

荒先生

  • 「オントロジーのサブセットを作る際、トリミング作業が難しい。自動でやる方法はないか?」

議論のまとめ

当面の化合物の取り扱いは以下のように進める。

  • CAS、InChIなどを持つ既知の化合物はそれを用いてマッピングする。
  • 一方、未知の化合物の場合、
    • (1)DNPのカテゴリーの拡張を行い、これを用いて化合物のマッピングを行う。
    • (2)ChEBIに対して、構造式などできるだけ詳細な情報を渡してその化合物を登録、分類してもらう。
    • (3)上記(2)について、ChEBIに対して、新規登録、分類にどの程度の時間がかかるかを確認する。
    • (4)ChEBI側との連絡、交渉は、有田先生に担当していただく。

その他の確認事項

=>その後、JSTで確認したところ、APIなどを利用したバッチ検索は、現時点で不可能であることを確認しました。また近い将来そのような機能を開発する予定はないとの回答がありました(2011年11月15日)。

  • 化合物を取り扱う実務者のメーリングリストの開設をNBDCが準備する

=>メンバーは、[メーリングリスト]で確認してください(2011年11月16日)。

実務者連絡会_化合物オントロジー検討会議_議事録_2011年11月11日.txt · 最終更新: 2015/01/09 18:08 +0900 by kushidat