User Tools

Site Tools


bioforumeurope1

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision
Previous revision
bioforumeurope1 [2010/08/25 16:19]
admin
bioforumeurope1 [2014/01/18 07:44] (current)
Line 12: Line 12:
 {{:​ピクチャ_5.png|}} ​ {{:​ピクチャ_5.png|}} ​
 > E-Cellシミュレーション環境(バージョン3)のスクリーンショット。E-Cellシステムは動的な計算機上で細胞シミュレーションを可能にする。そして、汎用性の高いオブジェクト指向モデリングとマルチアルゴリズム・タイムスケール型のシミュレーション環境を備え、Python言語による高い拡張性をもつ点で他のシミュレーション環境に比べ幾つかの優位性を誇る。E-cellは活発に開発が進められており、Gnu General Public Licenseにもとづきオープンソースソフトウェアとして www.e-cell.org から入手可能である。 > E-Cellシミュレーション環境(バージョン3)のスクリーンショット。E-Cellシステムは動的な計算機上で細胞シミュレーションを可能にする。そして、汎用性の高いオブジェクト指向モデリングとマルチアルゴリズム・タイムスケール型のシミュレーション環境を備え、Python言語による高い拡張性をもつ点で他のシミュレーション環境に比べ幾つかの優位性を誇る。E-cellは活発に開発が進められており、Gnu General Public Licenseにもとづきオープンソースソフトウェアとして www.e-cell.org から入手可能である。
 +
 +{{:​ピクチャ_6.png|}}
 +> E-Cellシステムを用いたショウジョウバエの概日時計をシミュレーションした結果。細胞内で生じる動的な挙動は非直感的で複雑な生体内反応によってにもたらされる。図中の24時間周期の振動はPERタンパク質とCLKタンパク質のフィードバックによって生じる。
  
 ===== オミクスデータを用いた大規模モデルの自動生成 ===== ===== オミクスデータを用いた大規模モデルの自動生成 =====
Line 17: Line 20:
 システム生物学において、細胞モデルのすべての要素を網羅的に自動生成することは現時点では現実的ではないが、オミクスデータを用いることで大規模な細胞モデルを自動生成することは一定の範囲において可能である。よってモデルの自動生成化における主要な課題は、データベースごとに異なるデータ様式で保存されている生物学的データを統合することにある。ここで、データの統合は、遺伝子、mRNA、タンパク質、代謝物といった異なる階層にまたがった生体分子の意味的な対応づけと、同一データにおける異なるデータ様式の統一が要求される。例えば、大腸菌における「ピルビン酸キナーゼI」遺伝子は、データベースによって「PK-1」、「PK-I」、「pykF」、「pyruvate kinase F」、「b1676」などと記述される場合があり、さらにこの名称は遺伝子のほかに、mRNA、タンパク質の名称としても用いられる。よって、データベースの統合は十分に整備された同一のテータを指す異なる名称をもったデータの語彙ライブラリーと辞書のテキストマイニングとアノテーションに依存する。しかしながら、分子生物学の知見はセントラルドグマに立脚しているため、データがどのような分子生物学的な階層にまたがっていたとしても、データベースに登録されているデータには必ず対応するDNA配列が関連付けられている。したがって、私たちは大量のオミクスデータを統合するため、遺伝子のDNA配列をデータベースの辞書として、BLASTといった相同性検索から類似するデータをデータベースのクエリとして用いて、さまざま生物学的な資源から情報を関連づけさせるという遺伝子指向型のアプローチ方法を採用した。このアプローチにはDNA配列をシステム生物学におけるオミクス解析の起点にすることができるといった利点があることも特筆すべき点だ。 システム生物学において、細胞モデルのすべての要素を網羅的に自動生成することは現時点では現実的ではないが、オミクスデータを用いることで大規模な細胞モデルを自動生成することは一定の範囲において可能である。よってモデルの自動生成化における主要な課題は、データベースごとに異なるデータ様式で保存されている生物学的データを統合することにある。ここで、データの統合は、遺伝子、mRNA、タンパク質、代謝物といった異なる階層にまたがった生体分子の意味的な対応づけと、同一データにおける異なるデータ様式の統一が要求される。例えば、大腸菌における「ピルビン酸キナーゼI」遺伝子は、データベースによって「PK-1」、「PK-I」、「pykF」、「pyruvate kinase F」、「b1676」などと記述される場合があり、さらにこの名称は遺伝子のほかに、mRNA、タンパク質の名称としても用いられる。よって、データベースの統合は十分に整備された同一のテータを指す異なる名称をもったデータの語彙ライブラリーと辞書のテキストマイニングとアノテーションに依存する。しかしながら、分子生物学の知見はセントラルドグマに立脚しているため、データがどのような分子生物学的な階層にまたがっていたとしても、データベースに登録されているデータには必ず対応するDNA配列が関連付けられている。したがって、私たちは大量のオミクスデータを統合するため、遺伝子のDNA配列をデータベースの辞書として、BLASTといった相同性検索から類似するデータをデータベースのクエリとして用いて、さまざま生物学的な資源から情報を関連づけさせるという遺伝子指向型のアプローチ方法を採用した。このアプローチにはDNA配列をシステム生物学におけるオミクス解析の起点にすることができるといった利点があることも特筆すべき点だ。
  
-ゲノムにはすべての遺伝子情報が含まれることから細胞内の最大要素数を定義することができるため、全細胞モデルの検索空間を制約し遺伝子のDNA配列から関連する情報を集積することができる。私たちは生物固有のゲノムから代謝反応に関わる遺伝子を自動抽出して、遺伝子の類似性やオーソロジーから生物固有の代謝モデルを自動生成する the Genome-based Modeling (GEM) システムを開発した。GEMシステムによって自動生成されたモデル自体は各化学反応の速度パラメターを保持していないが化学量論行列やSBMLを用いることで代謝流束解析やグラフ解析へ応用し、代謝経路の網羅的な解析が可能である。代謝モデルに含まれる要素数はゲノムによって制約されめ、トップダウン的なアプローチ方法によって速度パラメターを追加していくことに適している。GEMシステムによって自動生成されたモデル精度の妥当性を検討するために、バクテリア90種以上を対象としてモデル化し、代謝モデルをKEGG代謝データベースと比較した自動生成した大部分のモデルは、500以上酵素800以上の代謝物から構成され、KEGGに登録されている代謝経路の約90~100%を満たした。大腸菌ゲノムから生成したモデルは最も精度が高く、968個の酵素と1195個代謝物から構成され、KEGGにおける代謝経路を完全に満たし、EcoCycにおける代謝経路の92%を満たした。自動生成したすべてのモデルは www.g-language.org/​gem/​models/​static.cgi からダウンロードできる。状のGEMシステムは速度パラメターを考慮た静的な化学反応の記述にとどまっているが、遺伝子指向型のアプローチ方法は、遺伝子発現制御やシグナル伝達経路といったあらゆる種類の分子生物学的な階層に対して拡張性をもつ。特に代謝といった分野では、ハイスループットな測定機器で測定される定量的なデータによって、細胞内の動的な相互作用をシステムとしてとらえることが期待され、これからのシステム生物学がより発展していくだろう+{{:​ピクチャ_7.png|}} 
 +GEMシステムによって自動生成され、Cytoscapeによって可視化された大腸菌の代謝経路のモデル968個の生体内反応1195個の代謝物が含まれ、KEGGに登録されている大腸菌の代謝経路を完全に現している。
  
 +ゲノムにはすべての遺伝子情報が含まれることから細胞内の最大要素数を定義することができるため、全細胞モデルの検索空間を制約し遺伝子のDNA配列から関連する情報を集積することができる。私たちは生物固有のゲノムから代謝反応に関わる遺伝子を自動抽出して、遺伝子の類似性やオーソロジーから生物固有の代謝モデルを自動生成する the Genome-based Modeling (GEM) システムを開発した。GEMシステムによって自動生成されたモデル自体は各化学反応の速度パラメターを保持していないが、化学量論行列やSBMLを用いることで代謝流束解析やグラフ解析へ応用し、代謝経路の網羅的な解析が可能である。代謝モデルに含まれる要素数はゲノムによって制約されるため、トップダウン的なアプローチ方法によって速度パラメターを追加していくことに適している。GEMシステムによって自動生成されたモデルの精度の妥当性を検討するために、バクテリア90種以上を対象としてモデル化し、代謝モデルをKEGG代謝データベースと比較した。自動生成した大部分のモデルは、500個以上の酵素と800個以上の代謝物から構成され、KEGGに登録されている代謝経路の約90~100%を満たした。大腸菌ゲノムから生成したモデルは最も精度が高く、968個の酵素と1195個の代謝物から構成され、KEGGにおける代謝経路を完全に満たし、EcoCycにおける代謝経路の92%を満たした。自動生成したすべてのモデルは www.g-language.org/​gem/​models/​static.cgi からダウンロードできる。現状のGEMシステムは速度パラメターを考慮した静的な化学反応の記述にとどまっているが、遺伝子指向型のアプローチ方法は、遺伝子発現制御やシグナル伝達経路といったあらゆる種類の分子生物学的な階層に対して拡張性をもつ。特に代謝といった分野では、ハイスループットな測定機器で測定される定量的なデータによって、細胞内の動的な相互作用をシステムとしてとらえることが期待され、これからのシステム生物学がより発展していくだろう。
  
  
-*figure 1 
-E-Cellシミュレーション環境(バージョン3)のスクリーンショット。E-Cellシステムは動的な計算機上で細胞シミュレーションを可能にする。そして、汎用性の高いオブジェクト指向モデリングとマルチアルゴリズム・タイムスケール型のシミュレーション環境を備え、Python言語による高い拡張性をもつ点で他のシミュレーション環境に比べ幾つかの優位性を誇る。E-cellは活発に開発が進められており、Gnu General Public Licenseにもとづきオープンソースソフトウェアとして www.e-cell.org から入手可能である。 
  
-*figure 2 
-E-Cellシステムを用いたショウジョウバエの概日時計をシミュレーションした結果。細胞内で生じる動的な挙動は非直感的で複雑な生体内反応によってにもたらされる。図中の24時間周期の振動はPERタンパク質とCLKタンパク質のフィードバックによって生じる。 
  
-*figure 3 
-GEMシステムによって自動生成され、Cytoscapeによって可視化された大腸菌の代謝経路。このモデルには968個の生体内反応と1195個の代謝物が含まれ、KEGGに登録されている大腸菌の代謝経路を完全に再現している。 
bioforumeurope1.txt · Last modified: 2014/01/18 07:44 (external edit)