それ自身で標的のmRNAの3’-UTRなどに結合し、標的mRNAを分解します。
microRNAは発現制御機能を持った、RNA分子なのです。
と、ごくごく簡潔にまとめましたが、microRNAについては、多くのレビューや教科書に記載がありますので、詳しくは書かないとして。 Wikipediaでもかなり情報が得られますよ。
さて、microRNAの解析は、長らく、TaqManアレイやその他のマイクロアレイ、PCRなどが主流でした。
近年、NGSでもこれを解析している例が見られます。
実験プロトコールとして一般的なのは、
- トータルRNAを抽出して
- ゲルに流した後18-30塩基のあたりを切り出し
- Small RNAを精製して
- ライブラリーキットにある通りアダプターを付け
- cDNA合成し
- ライブラリーをシーケンサーで短めに読む
短めに読む、というのはフラグメントの長さが 18-30塩基を予想しているからで、35、6塩基も読めば十分全体をカバーするからです。
ゲノムや転写産物を読む場合は、できるだけ長く読めたほうが良いですが、microRNAは短くてもOK、むしろちゃんと正確に読めることが大切です。
さて、シーケンサーが無事データを出力しました。
ここからデータ解析です。
microRNAの解析では、リードのアダプタートリミングは大切です。 (microRNAに限ったことではありませんが)
読んでいるフラグメントの長さが短い分、5’側のアダプターから読んだ時に、フラグメントを読み切り、3’側のアダプターまで読んでしまうことがあるからです。
そのため、3’側のアダプターをトリミング(除去)することが必須です。
次に、トリミングした後のリードが、短くなりすぎると、後でマッピングする際にNon Specificにマップされる恐れがあるので、これも除きます。 15‐18塩基以下の短いリードは除去するといいかもしれません。
リードがきれいになったところで、いよいよマッピングです。 でも何に対して?
一例を示します。 今度参考文献も示しますね。
- 先ずゲノムにマッピングし、マップされなかった配列はごみとして除去する
- ゲノムに当たったリードを回収、miRBase の配列(precursor, mature, mature*)にマッピング
- miRBaseの配列にぴったり当たったリードは、既知のmicroRNAとして保存
- miRBaseの配列に当たらなかったリードは、次に、microRNA以外の、既知のnon-coding RNA (piwiRNA, snRNA, snoRNAなどの) 配列に対してマッピング
- non-coding RNAにも当たらなかったリードは、念のため、RefSeqのmRNA配列に対してマッピング
- それでも当たらなかったリードは、新規microRNA「候補」として保存
これにより、①既知のmicroRNA、②それ以外のnon-coding RNA、③新規microRNA 候補、の3種類のデータセットができる。
既知のmicroRNA、non-coding RNA については、発現量の解析をすることになるでしょう。
新規候補の解析は、少しやっかいだが、アルゴリズムが無くはないのです。
つづく
0 件のコメント:
コメントを投稿