bioinformatics

ucsc genome browserのrefGeneテーブル

職場内製のtranscriptomeなデータを某生物種のゲノムにマッピングして、refGeneでアノテーション付けてみる。と。全然アノテーションがつかない。あれっと思ってrefGeneテーブルの中身を見てみると、1000行そこそこしかない感じ。 ひょとして、キュレーショ…

やっぱりIO

今までのよりメモリが載ったPCクラスタを使いだした。メモリがあるから、ということで、1nodeで処理するjobの数を増やしてみた。 ...ノードでtop取ってみたら、数秒に一回io waitかかりまくってcpu usageがあまり上がらないorz やっぱIO大事だなー、と思った…

network解析で気になってた事

なんとなく気になって、レヴィ=ストロースの解説をちらちらと読み返してて気付く。 network解析で見てるのって、構造主義でいう構造なんぢゃないのかなと。 日本語版wikipediaにはなかったけど、英語版にはsocial networkとのかかわりを書いてあって納得し…

GridEngineAPIの挙動

今使ってるクラスタのGridEngineをAPI経由で呼んだ場合の挙動がなんかおかしいっぽい。 状況 1.某パイプラインの実行時にuseSGE=Tureを付けて呼んだ場合 2.某パイプラインの旧バージョンに含まれるmapperを、drmma4rubyを含むrakeから呼んだ場合 結果 投入jo…

こんどはRake

ということで、rubyの本を引っ張りだしてきてる今日この頃。

plotの速度と、OSのバージョン

仕事で作っているコードの一つに、与えられたファイルの中にあるサンプルの、全ての組み合わせに対して散布図を描く、というのがあるのだけど、最近サンプルが非常に多いデータが来て、メモリ足りなくて転けるわ時間かかるわで、もうさんざんw メモリは余計…

Re: xmlなtagの設計で悩みすぎる今日この頃

rdfみたいに一般的なtagに属性をつけるのか、アノテーションをそのままタグにするのか tagにせよannotationにせよ、terminologyをどうするか って辺りを、データを渡す当の相手に聞いてみた。 彼としては、アノテーションをそのままタグにしてもらったほうが…

マルチマップの扱い雑感(続ゲノムの重複と次世代シーケンサー雑感)

昨日のエントリで 結構シーケンシングエラーが多いのよね... (中略) 一方でSNPがどんどん探されてきてるので、マルチマップの扱いが以前より難しくなってきてるのだなという感想を持っています。 というあたりをもう少し。マルチマップということはmappingさ…

ゲノムの重複と次世代シーケンサー雑感

某di-tag seqで、ゲノムの複数箇所にマップされる配列が頻出->tagを長くしよう、とか、某アレイのプローブがゲノムの複数箇所にマップされる->長いプローブのアレイを使おう、とか言う流れだと思ってたのだけど、ucscがゲノムにマッピングしたrefseqの一部で…

統数研にBioCのミラーがあるらしいが*1

URLを聞いたことがなかった... http://prs.ism.ac.jp/bioc/らしい*1。 *1:via http://prs.ism.ac.jp/~nakama/BioC1.9/readme.html

apply()ファミリーでベクトルとしての計算が出来るはず/apply() family will compute values as vector, but ...

なのだけど、気になってることが1点。/ but here I have a question. apply()とか、内部的にmmxなりsseなり使ってるのだろうか? / within the R, will apply() or other vector function use mmx or sse? 倍精度ないから、無理ナンデスカ...? / or sse is no…

GNF Symatlasのつもりが

しばらく見てなかったら、Symatlas(http://symatlas.gnf.org/SymAtlas/)がBioGPS(https://biogps.gnf.org/)にカワットル。 古すぐる>ヲレ

じゃぁさ、融合領域をどうするの?

前からぽつぽつと気になってたネタ。 前置き 先に書いておくけど、リンク先の意見は、完全に正しいんだ。そして、ヲレはリンク先の方々なら、「こいつはダメだ」と即答される程度のプログラミングスキルしか持ってない。けど、その通りにした時に、タコ壷に…

Re: RAIDしてても、DiskIOはやっぱり大問題

blast結果を後処理してたのだけど、この途中で、クラスタのヘッドノードのload averageが時々凄く上がってしまう。そのときヘッドノードでactiveなのは、nfsdぐらいなもの。どぉやら、load averageの中身はIO wait。 今日は別のクラスタで、短い配列をマッピ…

いんたらくとーむ

eTocをみてて、ガンにおけるPPIのかく乱、とかいう論文がBMC.Sys.Biol.に出たのを見付けた。 論文自体は未読。 が、タイトルを見て考え込んでしまう。 このタイトルの事柄をまじめにやるなら、何を見たら(測定したら)出来るんだろう。 考えれば考えるほど分…

Rめも

ターミナルとGUI ちらっとsqueak触ったせいか、コードを書いて、マウスで選択して、選択範囲だけ実行、というのが結構やり易いのがよくわかる。ヲレ的には、Rを学ぶならRgui使った方がしっくりくるかも。 統計英語がわからん!! 教えてくれる人がまだ帰宅して…

2項検定

検定する必要があるのだが、上司としては、カイ二乗検定でなく2項検定してほしいっぽい。 ところが、perlに2項検定のモジュールってないっぽい。 まあ、Rでやるか…

案の定忘れてた

久しぶりにRを起動する。と、すっかり書き方忘れてた…。 あっちみたりこっち見たりして、かろうじて目的を達成する。 だって、localのRHEL3だとRcommanderがこけるとかいろいろあって、使う意思が減退してたんだもの… [ヲレのバカ]そのうえ せっかく買った"…

fRNAdbが

3.0になるらしい。今はまだBetaなので、ここからまだ機能が増えていく、らしい。

ucscな愚痴

転写物のマッピングデータとして、ucscなデータ*1をMySQLに突っ込んでみたのだが。 …なんでall_mrnaテーブルとrefGeneテーブルのスキーマがあんなに違うんだー!!クエリ書きにくいじゃないか!!バカヤロー!! *1:ftp://hgdownload.cse.ucsc.edu/goldenPath/hg18…

blast

先日まで、職場でblastしてたのだが、こんな事もあるのね、というのをいくつか。 1プロセス4Gでは足りない ある日出勤すると、クラスタのノードが死んでた。クラスタの管理者に聞くと、他のノードを再起動して来たところだと言う。あらあら、やっちまった。…

古いとだめなこともある

Pen4Xeon3GHzで1日半かかって、Opteron2.4Ghzで30秒で終わるってどういうことよ。 Pen4Zeonなマシンは古い鳥が入ってるので、そのせいにちがいない… さらにJ師の協力で、sortコマンドが下手したらperlスクリプトよりも遅いことが判る。こんなん、ハードウェ…

BioC本届く

前後して、BioCを解説した本が2冊刊行されたが、片方が届いた。「統計解析環境Rによるバイオインフォマティクスデータ解析 − Bioconductorを用いたゲノムスケールのデータマイニング」の方。…ヲレ今週から来週にかけて、時間取れそうな気がしないのだけど。

Re: シンテニー

UCSCにliftoverというツールがあるが、「異なる生物種間での変換はお勧めしない」と事あるごとに出てくる。しかもパラメータ変えて実行すると、セグメンテーションフォルト。 上記はx86-64版をRHEL3/CentOS4で動かしたときに出る。i386版にかえるとすんなり…

Re:ノンコーディングというかmRNAというかなんとなく

この程度のエントリにはてなスター頂くなんてありえへん、とか思いつつ、せっかく頂いたので書ける情報を書いてみる。 Uniprot/{swissprot/tremble}の転写物情報 genbankなmRNAに対して、どのaccessionがnoncodingかとかどれが端読みか、というのをごそっと…

シンテニー

シンテニー領域を取り出すツール シンテニーという言葉はしばしば聞くが、実際にあーやってこーやって、というチュートリアルを見たことがない。バイオインフォな本も何冊か持っているが、そっちにもない。 UCSCにliftoverというツールがあるが、「異なる生…

NCBIへの自動アクセス

500個程なら大丈夫だろうという事で、embossのinfoseqで配列に関する情報を取ろうと思った。が、そのままやると、あとでウチの組織ごとアク禁くらいかねない。適当にインターバル空ければいい筈なのだが、何秒空けたらいいか、どこ調べても判らない…。

ノンコーディングというかmRNAというかなんとなく

genbankなmRNAに対して、どのaccessionがnoncodingかとかどれが端読みか、というのをごそっと調べてくる方法、ないのかねえ。どうしたものだか。 まあ 方法があったところで、データがでかいから扱うの大変なわけだが。 おまけ ということで、「はてなTシャ…

mogr本

某はてなリングで話題のmogr本を、訳者の一人のK師にお願いする。和訳待ってて良かった、amazonJPで買う英語原著よりだいぶ安い!! おまけ amazonJPで"バイオインフォマティクス"と引くとでてくるスポンサーリンクにIMGC2007って出てるのだけど、いくらでスポ…

プラットフォーム、怖っ

http://mbe.oxfordjournals.org/cgi/content/abstract/msm061v1 ヲレ的には 比較ゲしないと、信用できるplatformかどうかわからん、という意味に読んだのだけど、こういう読み方でいいのかね。まあ、GNFのデータ見て「どういうことよ」と思わされることは結…