Skip to content
Toshiaki Katayama edited this page Oct 3, 2024 · 4 revisions

Data Integration Visual Exploration (DIVE)

ライフサイエンス統合データベースセンター(DBCLS)では、生命科学データベースの統合利用のための技術開発を行っています。

RDFポータルでは多数のデータベースを知識グラフ化することで統合しており、TogoIDではデータベースのID間の関係を集約しています。これらを元に、TogoDX Humanではヒトに関わる多様な情報を探索的に捉えるためのデータ統合と可視化を実現しました。

一方で、統合データは複雑なグラフ構造をしているため、多様な情報を閲覧し直感的に理解することは容易ではありません。この課題に取り組むのが、統合データのインタラクティブな可視化を実現する様々な展示アプリケーションを模索するためのプロジェクト、Data Integration Visual Exploration (DIVE)です。略称にはデータベースの深淵への「探求」の意味も込めています。

今回は、第1弾として、ヒトの遺伝子と臓器および進化的な関係の可視化に挑戦しました。人体モデルにはDBCLSで開発してきたBodyparts 3Dを使用し、ヒトの遺伝子と臓器との関係および各遺伝子の進化的な新しさはTogoDXで整備したデータを用いています。

各遺伝子についての詳細情報もTogoStanza/MetaStanzaを用いてウェブ上に表示できるようにしています。発現情報はRefEx, GTEx, ProteinAtlasデータベースから、タンパク質としての機能はUniProtデータベースから、立体構造はPDBデータベースから、バリアントの情報と臨床的意義はTogoVarおよびClinVarデータベースから、リファレンスの情報はTogoGenomeを経由してPubMedデータベースから取得しています。また、日本語による遺伝子の説明をLLMを用いて取得しています。

今後の展望

今回は、遺伝子セットの各臓器での発現および進化医学的な意義を探索的に考察でき、かつ、科学に興味のある一般市民にも親和性の高い体感的なインターフェースを提案しました。データベースに含まれているリファレンスデータから有意義な仮説を見出すことは必ずしも容易ではありませんが、どのようなデータをどのような形で表現すれば直感的かつ効率的なデータ探索が実現できるのか、今後も探求していきます。

Clone this wiki locally