(セッション2 :【数理・情報・計算による挑戦】)「データベース生物学」 高木 利久(情報・システム研究機構 : バイオインフォマティクス)
dbの意義
- ゲノム、タンパク構造、発現、相互作用、....
- データだけでなく知識、手法、検索、解析ツール込み
- 研究のインフラ
- 研究の目的はデータベース作りだ!
データベース生物学のこころ
- インフラ&フロンティア
- そうすると、戦略を立てられるし、再利用可能etc...
- 変わらないと進まないのでは?
モデル化(スライド左側)と網羅的計測(スライド右側)
- 右側に莫大な労力
網羅的計測データおよび知識の増加傾向
ライフサイエンスにおける情報爆発
- データ爆発
- 知識爆発
- db爆発
データ生産を思考した国家プロジェクト
- チャンピオンデータしか出てこない
- どうつなげるか、モデルや権利を含めてどう使えるようにするか
モデル化と網羅的計測とデータベース
取り組むべき課題
- dbからのモデル構築支援
- 文献マイニング、知識発見
- 様々な統合
- 品質管理、メタデータ
- 標準フォーマット、専門用語の整理
- etc...
知識の抽出や発見の技術動向と課題
複雑な知識の記述法
- 分子レベル
- 実体間の関係
- 挙動の表現
- 機能、表現系の表現
- (抜け部分)
データ共有、公共財化のための制度
- 欧米
- 日本
制度が決めるデジタルデータの流れ
我が国における現状
- データの利用競争
ライフサイエンスdbの課題
整備統合に対する考え方
dbclsの活動
まとめ
提言
- ヒトとネットワーク
- bigdataの処理
- 構造か規格化されてないデータの処理
QA
- 国際的にはどうなってる?
- 配列や構造は国際的にやってる。相互作用なんかは、欧米でも国際的にはなってない
- 画像とかは標準化されてない、フォーマットの寿命とかは?
- まだこれから。
- 標準化への動きは?
- メタデータはそれなりに。解析はまだこれから。
- 細胞をどう処理するかとか、実験の現場レベルの話は?
- アレイなんかは。ターゲットタンパクも標準化には動いてる。
- 標準化の問題、けど全部は標準かできないのでは?
- (抜け部分)
- メンテナンス?
- ここに管理されてるdbの検索、データベースの公開も受けている?
- (抜け部分)
- インセンティブもルールも縛るのも必要かと
- 標準化で音頭を取れる部分があるとしたら?
- 配列の先、で、取れるかと。