Skip to content
Toshiaki Katayama edited this page Feb 18, 2021 · 11 revisions

第1回バリアント情報標準化研究会

Variant Information Standardization Collegium (VISC) #1

開催趣旨

これまで、通称「Varの会」として DDBJ (Jvar), 京大 (MGeND)、NBDC/DBCLS (TogoVar) の有志メンバーを中心にバリアント情報の標準化のための連携を進めてきました。今年度中に遺伝研・京大・NBDC/DBCLSで共通のバリアントRDF整備を間に合わせ、今後もバリアントデータの流通および普及を推進していくために、2020年末のSPARQLthon99で、バリアント情報標準化研究会(Variant Information Standardization Collegium; VISC)を発足することになりました。

当面のゴールとしては TogoVar-MGeND-Jvar-DPV のバリアント情報を全て国内共通の RDF で流通できるようにするとともに、SPARQL をベースとした Beacon のようなサービスの API 開発や、Med2RDF の医科学データを利用した共通の TogoStanza などによるウェブアプリケーションを開発することで、データの利活用を効率的に促進することを目指します。このためには構造変異も含めたバリアント情報の標準化が欠かせません。このインフラ整備を GEM Japan のデータ連携の中心としていきたいと思います。ひいては、GA4GH にも国際的に展開していきたいと考えています。バリアントの標準 RDF に Med2RDF や NBDC RDF ポータルで整備してきた RDF を統合的に利用することで、NBDC/DBCLS が本来目指してきたデータベース統合とその有用性を示すこともできると期待しています。

第1回の研究会では、gnomAD SV も含む既存のバリアントデータの VCF や GVF での表現を整理し、これを RDF で標準化するための議論および開発を行います。また、がんゲノムやグラフゲノムの観点から将来的に破綻しない十分な拡張性を持つデータモデルを検討することも期待しています。実用的には上流下流のツールが揃っている VCF などでの流通は今後も続くと思いますし、効率を重視するなら専用のバイナリ形式などが必要になるでしょう。しかし、アノテーションや他の医科学データとの連携を考えると RDF 化は有用なデータ標準化手法であると考えています。

Program

  • 1月5日 (Zoom)
    • 15:00-17:00 開催趣旨説明、課題整理
    • 17:00-19:00 MGeND-TogoVar-JVar連携とゴール設定
  • 1月6日 (Zoom)
    • 09:00-12:00 バリアントの表現とRDF化
    • 14:00-15:00 TogoVar, JVar リモート会議
    • 15:00-19:00 複雑な構造変異の表現とRDF化
  • 1月7日 (Zoom)
    • 09:00-11:00 標準化のまとめと今後のTODO整理
    • 11:00-12:00 ラップアップ、リモート会議

資料

検討内容

関連資料

参加者

  • DBCLS: 片山・川島・守屋
  • ToMMo: 荻島
  • 東大: 笠原
  • がんセ: 山下・白石
  • MGeND: 鎌田
  • JVar: 藤澤(リモート:秦・児玉)
  • TogoVar: 佐藤(リモート:豊岡・三橋・川嶋)
  • SPARQL: 岡別府

Clone this wiki locally