Pipeline Pilot というソフトウェアが有名です。 画面(デフォルト)はこんな感じです。
このソフトは、パイプラインと呼んでいる通り、解析の流れを先ず作ります。 GUIで作ります。
「解析の流れ」は様々なパーツ(コンポーネント)を組み合わせて作るのですが、一度作ってしまえば何度も解析のバッチ処理ができ、同じ作業を何十回もやらなければいけない時などに便利です。
で、このパイプラインにはオプションで、シーケンス解析のパーツがあるのです!!
このAccelrys社と、1分子シーケンサーのOxford Nanopore社が、パートナーシップを結んだそうです。
http://ir.accelrys.com/releasedetail.cfm?ReleaseID=557883
Oxford Nanopore社のテクノロジーは、他のどのシーケンサーとも変わっていて、ナノポア(小さい穴)の中を分子が通過するときの電荷を検出して、1分子単位で物を測るというものです。
今はNGS、DNAシーケンサーとして開発しているようですが、分子は何もヌクレオチドである必要は無いわけで、タンパク質でも化合物でも可能でしょう。
そんな将来性の高さが、Accelrysとのパートナーシップにつながったのではないでしょうか、というのは私の勝手な想像です。
Nanoporeシーケンサーは、まだリリースされていないようですが、技術は期待大ですね。
さて、最近、Accelrys社のWebinarがありました。
日本時間の24日深夜0時半から、でしたが、内容はずばりPipeline PilotのNGS Collection
今日はこれを紹介します。
Pipeline Pilot NGS Collection
これらの解析機能を並列に実行できて、例えばマッピングなら異なるアルゴリズムを並列に実行し、結果を比較することができます。
アノテーションDBと連携させて、検出したSNPがどの遺伝子にあるのかわかります。
ビューワーはGBrowse2で見ることも、リストでみることもできます。
SAM/BAM, GFF3/Tabix, XML で出力できます。
リードを取り込んで、マッピングして、SNP検出して、それぞれでレポートして、SNPがあれば遺伝子のどこにあるか、それをGFFで出力、またはHTMLで表示、・・・ などという一連の流れ(パイプライン)を設計して実行!
そんな説明とデモを見ました。
パイプラインの様子(MAQとSOAP SNPを並列処理)
SNPのリスト表示
ベン図で表示
私の印象では、ありきたりの有名なアルゴリズムはメニューにあるものの、マイナーな、というか
難しい、転座解析やバイサル解析はどうだろう? もっと見てみたい。
リスト表示やエクセルでできるような統計は簡単にできそうですね。
レポート表示は充実しているようです。
今度、トライアルをする予定なので、またご報告を。
参考資料です。 興味のある方はどうぞ。
Next Generation Sequencing Collection Overview: http://accelrys.com/products/datasheets/next-generation-sequencing.pdf
Building Novel Applications with Pipeline Pilot to Drive Next Generation Sequencing: http://accelrys.com/resource-center/case-studies/pdf/oxford-nanopore-case-study.pdf