掲示板

No.478 ケーニヒスベルクの街歩きからゲノムの再構築まで

投稿日時: 2023/06/01 システム管理者

 

 

 

 

 

 

 

 

 

 

現代の生物学では,大きなDNA分子を本のように一文字ずつ「読む」ことはまだできません.その代わりに,科学者はゲノムのどの部分から切り取られたのか分からない短いDNA断片の配列を解読しています.このような大量のDNA断片からゲノムを組み立てるプロセスをシークエンシング(sequencing)と呼びます.
 
10億個のジグソーパズルを組み立てるようなもので,3世紀以上前に開発された数学的理論に基づいている.

18世紀前半.
大数学者レオンハルト・オイラーが「ケーニヒスベルクの橋の問題」を解決し,川と二つの島に囲まれたケーニヒスベルクでは,現存する7つの橋をそれぞれ一度だけ通過して出発点に戻ることはできないことを証明しました.このようなグラフの経路はオイラーサイクル(Eulerian cycle)と呼ばれる.オイラーサイクルの存在問題は,グラフの各頂点から偶数個の辺が出ているか,奇数個の辺の出る点がある場合は2つという,非常に単純な判定基準を持つ.オイラーサイクルを見つける問題(ZEC)は,非常に大きなグラフであっても,かなり速く解決される.

 19世紀後半.
数学者William Hamiltonは,ZECに似た問題として,グラフの各頂点を1回だけ通る閉じた道(ハミルトンサイクル)を見つける問題(ZGC)を考えた.

20世紀後半.
ZECとは異なり,ZGCは効率的な解法アルゴリズムが知られていない問題の代表格であることが立証された.

20世紀末から21世紀にかけて.
1990年代半ばに細菌ゲノムが,2001年にヒトゲノムの塩基配列が決定された.この作業は,スーパーコンピューターのアルゴリズムがZGCをベースにしていたため,時間とコストがかかるものだった.この10年間で,数学者はZECに関連した高速アセンブリー法を開発した.
そして 現在,生物学者たちは,哺乳類の各生物種のゲノムを組み立てるという基本的な課題に取り組む準備を進めている.
 
Певзнер Павел Аркадьевич
p.13