2010年の超高速シーケンス

PRISM 3100が子供の玩具に見える。454 life scienceのシーケンサーや、solexa
までもが既に旧式のDNAシーケンサーになる。

そんなシーケンサーアメリカのPacific bio社が2010年発売を目指して開発中とのこと

1時間で1,000億塩基(100Gbp)、しかも1分子由来のシグナルが数キロベースから25キロベースに渡って出力される
(論文はこちら)。
速度も長さも現在あるシーケンサーの能力を遙かに凌駕している。SolexaやSOLiDは25bp程度、
454でも100bp程度
の能力なので、長さでも桁違いだ。

CAGEやSAGEと組み合わせると、Microarrayが要らなくなる日はそう遠くないかもしれない。

しかし、データの保存はどうするんだろう?理研に入る予定のHelicosでさえ、1回の運転で2Gbp
/day
、14TB(!)ものデータ量になるが、1時間でその50倍(700TB !!)ものデータが出ることになる。

もう、研究所にstorage farmを併設しないと埒があかない事態だ。こうなると、
光ファイバーなんかでとろとろデータを送ってる場合ではない。Googleに大量のデータを送る際には、
専用のトランク型のハードディスクにデータを詰めてFedexかDHLで送るらしいが、700TBのデータって・・・
市販のハードディスクドライブ1個の容量が漸く1TBに達したところなのだが。

CCDの電圧出力としての生データが出る端から圧縮するか、それとも結局はATGCとNの3ビットで1塩基を表せるのだから、
生データをリアルタイムで処理して塩基情報に変換するか、何らかの方法でデータを圧縮しないと大変な有様になりそうです。

人気blogランキングへ←クリックしていただけますと筆者が喜びます!