-
Notifications
You must be signed in to change notification settings - Fork 0
VISC1
Variant Information Standardization Collegium (VISC) #1
- 日程:第1回 バリアント情報標準化研究会 1/5(火)午後 〜 7(木) 午前
- 場所:佐勘(仙台市)
- 参加費:なし
- ウェブサイト: https://sites.google.com/kyoto-u.ac.jp/visc1
これまで、通称「Varの会」として DDBJ (Jvar), 京大 (MGeND)、NBDC/DBCLS (TogoVar) の有志メンバーを中心にバリアント情報の標準化のための連携を進めてきました。今年度中に遺伝研・京大・NBDC/DBCLSで共通のバリアントRDF整備を間に合わせ、今後もバリアントデータの流通および普及を推進していくために、2020年末のSPARQLthon99で、バリアント情報標準化研究会(Variant Information Standardization Collegium; VISC)を発足することになりました。
当面のゴールとしては TogoVar-MGeND-Jvar-DPV のバリアント情報を全て国内共通の RDF で流通できるようにするとともに、SPARQL をベースとした Beacon のようなサービスの API 開発や、Med2RDF の医科学データを利用した共通の TogoStanza などによるウェブアプリケーションを開発することで、データの利活用を効率的に促進することを目指します。このためには構造変異も含めたバリアント情報の標準化が欠かせません。このインフラ整備を GEM Japan のデータ連携の中心としていきたいと思います。ひいては、GA4GH にも国際的に展開していきたいと考えています。バリアントの標準 RDF に Med2RDF や NBDC RDF ポータルで整備してきた RDF を統合的に利用することで、NBDC/DBCLS が本来目指してきたデータベース統合とその有用性を示すこともできると期待しています。
第1回の研究会では、gnomAD SV も含む既存のバリアントデータの VCF や GVF での表現を整理し、これを RDF で標準化するための議論および開発を行います。また、がんゲノムやグラフゲノムの観点から将来的に破綻しない十分な拡張性を持つデータモデルを検討することも期待しています。実用的には上流下流のツールが揃っている VCF などでの流通は今後も続くと思いますし、効率を重視するなら専用のバイナリ形式などが必要になるでしょう。しかし、アノテーションや他の医科学データとの連携を考えると RDF 化は有用なデータ標準化手法であると考えています。
- 1月5日 (Zoom)
- 15:00-17:00 開催趣旨説明、課題整理
- 17:00-19:00 MGeND-TogoVar-JVar連携とゴール設定
- 1月6日 (Zoom)
- 09:00-12:00 バリアントの表現とRDF化
- 14:00-15:00 TogoVar, JVar リモート会議
- 15:00-19:00 複雑な構造変異の表現とRDF化
- 1月7日 (Zoom)
- 09:00-11:00 標準化のまとめと今後のTODO整理
- 11:00-12:00 ラップアップ、リモート会議
- 共有フォルダ Google drive
- スライド 進捗報告・ラップアップ
- ドキュメント バリアントタイプ一覧
- DBCLS: 片山・川島・守屋
- ToMMo: 荻島
- 東大: 笠原
- がんセ: 山下・白石
- MGeND: 鎌田
- JVar: 藤澤(リモート:秦・児玉)
- TogoVar: 佐藤(リモート:豊岡・三橋・川嶋)
- SPARQL: 岡別府