Skip to content
Toshiaki Katayama edited this page Sep 27, 2024 · 4 revisions

Data Integration Visual Exploration (DIVE)

ライフサイエンス統合データベースセンター(DBCLS)では、生命科学データベースの統合利用のための技術開発を行っています。

RDFポータルでは多数のデータベースを知識グラフ化することで統合しており、TogoIDではデータベースのID間の関係を集約しています。これらを元に、TogoDX Humanではヒトに関わる多様な情報を探索的に捉えるためのデータ統合と可視化を実現しました。

一方で、統合データは複雑なグラフ構造をしているため、多様な情報を閲覧し直感的に理解することは容易ではありません。このため、DIVEでは統合データのインタラクティブな可視化を実現する様々な展示アプリケーションを模索しています。

第1弾として、ヒトの遺伝子と臓器および進化的な関係を可視化に挑戦してみました。人体モデルにはDBCLSで開発してきたBodyparts 3Dが使われており、ヒトの遺伝子と臓器の関係および各遺伝子の進化的な新しさはTogoDXのデータを用いています。また、各遺伝子についての詳細情報はTogoStanza/MetaStanzaを用いてウェブ上に表示できるようにしています。発現情報はRefEx, GTEx, ProteinAtlasデータベースから、タンパク質としての機能はUniProtデータベースから、立体構造はPDBデータベースから、バリアントの情報と臨床的意義はTogoVarおよびClinVarデータベースから、リファレンスの情報はTogoGenomeを経由してPubMedデータベースから取得しています。また、日本語による遺伝子の説明をLLMを用いて取得しています。

ビジョン

「データ統合ビジュアル探索」は、統合データの新しいプレゼンテーション手法を探究するプロジェクトの目的を示し、"DIVE"という略語は覚えやすく、探究の意味も込められています。

Clone this wiki locally