(セッション2 :【数理・情報・計算による挑戦】)「データベース生物学」 高木 利久(情報・システム研究機構 : バイオインフォマティクス)

dbの意義

  • ゲノム、タンパク構造、発現、相互作用、....
  • データだけでなく知識、手法、検索、解析ツール込み
  • 研究のインフラ
  • 研究の目的はデータベース作りだ!

データベース生物学のこころ

  • インフラ&フロンティア
  • そうすると、戦略を立てられるし、再利用可能etc...
    • 変わらないと進まないのでは?

タイトルとの関わり

  • 網羅定量計測->モデリング->予測制御
    • 今は計測とモデルの間にギャップ、事前知識に大きく依存
  • バイオインフォの役割は

モデル化(スライド左側)と網羅的計測(スライド右側)

  • 右側に莫大な労力

網羅的計測データおよび知識の増加傾向

ライフサイエンスにおける情報爆発

  • データ爆発
  • 知識爆発
  • db爆発

データ生産を思考した国家プロジェクト

  • チャンピオンデータしか出てこない
  • どうつなげるか、モデルや権利を含めてどう使えるようにするか

モデル化と網羅的計測とデータベース

取り組むべき課題

  • dbからのモデル構築支援
    • 文献マイニング、知識発見
  • 様々な統合
  • 品質管理、メタデータ
  • 標準フォーマット、専門用語の整理
  • etc...

知識の抽出や発見の技術動向と課題

複雑な知識の記述法

  • 分子レベル
  • 実体間の関係
  • 挙動の表現
  • 機能、表現系の表現
    • (抜け部分)

データ共有、公共財化のための制度

  • 欧米
  • 日本

制度が決めるデジタルデータの流れ

我が国における現状

  • データの利用競争

ライフサイエンスdbの課題

整備統合に対する考え方

dbclsの活動

まとめ

提言

  • ヒトとネットワーク
  • bigdataの処理
  • 構造か規格化されてないデータの処理

QA

  • 国際的にはどうなってる?
  • 配列や構造は国際的にやってる。相互作用なんかは、欧米でも国際的にはなってない
  • 画像とかは標準化されてない、フォーマットの寿命とかは?
  • まだこれから。
  • 標準化への動きは?
  • メタデータはそれなりに。解析はまだこれから。
  • 細胞をどう処理するかとか、実験の現場レベルの話は?
  • アレイなんかは。ターゲットタンパクも標準化には動いてる。
  • 標準化の問題、けど全部は標準かできないのでは?
  • (抜け部分)
  • メンテナンス?
  • ここに管理されてるdbの検索、データベースの公開も受けている?
  • (抜け部分)
  • インセンティブもルールも縛るのも必要かと
  • 標準化で音頭を取れる部分があるとしたら?
  • 配列の先、で、取れるかと。