DNAの配列、遺伝子、蛋白質、化合物などデータベースに蓄積されている情報から、これらの機能に関連した生物医学的な意味を導くためには、これら静的なデータ-ベース情報を統合化し、相互関係を明らかにしなければならない。相互関係を明らかにすることによって、生命がシステムとして機能する相互のメカニズム、あるいは疾患のメカニズムを明らかにすることができ、創薬にもつなげることができる。
近年文献の電子化、データベース化も急速に進んでいることから、我々は、文献情報から必要な情報を信頼度高く抽出し、知識を集約・統合化し、なおかつ分かりやすい形で表示し、しかも予測ができるような自然言語処理技術を応用した生物医学のための文献情報基盤処理システムの構築を目標としている。
その手始めとして、文献から遺伝子、蛋白質等の相互関係を調べ、文献からこれらの相互の関連性を抽出し、相互作用全体のネットワークあるいはパスウェイを構築し、DNAマイクロアレイ解析の結果をシステマティックに解析できるシステムの構築を進めている。具体的には、分散処理環境など様々な計算機環境で、右の特徴を備えたシステムを作成している。
マイクロアレイ解析に特化したシステムの特徴として、マイクロアレイのプローブ情報からの多数の検索を効率的に行なうための簡単な操作による検索機能
マイクロアレイのプローブ情報以外にも様々な形式で蛋白質相互作用を検索するための多数のデータを扱うための検索の高速化
ユーザ指定によって情報を広く収集したり絞り込んだりしながら文献検索マイニングを行なえる機能
関係性に関する様々の文献情報をユーザニーズにあわせて検索結果を様々に表示する機能
入力された情報と得られたあたらしい情報を様々な研究者のニーズをみたすように様々な形式でネットワークを構築しながら表示する機能
ネットワークの詳細、およびパスウェイの動的な変化などをユーザが理解しやすいような可視化機能