ゲノムの重複と次世代シーケンサー雑感

某di-tag seqで、ゲノムの複数箇所にマップされる配列が頻出->tagを長くしよう、とか、某アレイのプローブがゲノムの複数箇所にマップされる->長いプローブのアレイを使おう、とか言う流れだと思ってたのだけど、ucscがゲノムにマッピングしたrefseqの一部でもマルチマップが起きてるのを見つけて思った。元々進化的にゲノムが重複したりしてる以上、マルチマップって起きるべくして起きるんでね?
今まで解析にあたってmaskしてたrepeatからの発現を扱った論文とかも出てる以上、こういうことも扱って行かんと行かんのやなー、と思う今日この頃。
となると、正確にgenomeと一致してるかどうかを見たくなるのだけど、ChIP-seqにつかうような最近のシーケンサーって、結構シーケンシングエラーが多いのよね...少なくとも、sanger法なシーケンサーに比べて。一方でSNPがどんどん探されてきてるので、multimapの扱いが以前より難しくなってきてるのだなという感想を持っています。
以上雑感*1

*1:アルコール投入しながらの...