- 2025年4月4日
【BCBio-GFFの使い方】GFF3をpythonで操作する
GFF3 (General Feature Format version 3) ファイルは、ゲノムアノテーション情報を記録するための標準的な形式です。 本記事では、GFF3ファイルの基本的なフォーマット構造と、PythonからGFF3ファイルを操作することができるBCBio-GFFの使い方を解説しま […]
GFF3 (General Feature Format version 3) ファイルは、ゲノムアノテーション情報を記録するための標準的な形式です。 本記事では、GFF3ファイルの基本的なフォーマット構造と、PythonからGFF3ファイルを操作することができるBCBio-GFFの使い方を解説しま […]
BEDファイルは、ゲノム上の位置情報を表現するのによく使われるファイルフォーマットであり、ゲノムブラウザによる可視化などで使われます。 本記事では、BEDファイルフォーマットの構造とともに、pythonかBEDファイルを操作することができるpybedtoolsの使い方を解説します。 BEDファイルと […]
次世代シーケンサーの解析において、SAM/BAM形式のファイル操作は非常に重要となります。 そこで本記事では、SAM/BAMファイルの読み込みや変換ができるPythonのライブラリであるpysamを使い方を解説します。 SAMファイルとは シーケンスのアライメント結果を扱う際に広く利用される形式がS […]
VCF形式はゲノム解析において重要なファイルフォーマットであり、VCFPyはそれを扱うための効率的なPythonライブラリです。 本記事では、VCFファイルフォーマットの構造と特徴、およびVCFファイルをpythonで取り扱えうことのできるVCFPyの使い方を解説します。 VCFとは VCF (Va […]
ぴよこ RNAseqのデータを用いて発現量が変動した遺伝子を解析したい まさる博士 それなら、PyDESeq2が便利だよ 本記事では、PyDESeq2を用いて、発現変動遺伝子を解析する方法について解説します。 PyDESeq2とは PyDESeq2の前に、DESeq2について説明します […]
ぴよこ kallistoで解析したデータをその後の解析にどうやって使えばいいのかわからない。調べたらtximportが便利みたいだけど、R使ったことないからできなさそう。。。 まさる博士 そんな君に朗報!tximportのpythonバージョンであるpytximportがあるよ RNAseq解析にお […]
ぴよこ RNAseqデータの解析をしてみたいけど、どうやってデータを探していいかわからない。。。 まさる博士 GEOで検索すると、自分の解析したいデータを探すことができるよ! バイオインフォマティクスを始めるにあたって、RNA-seqのデータ解析をしてみたいけど、自分の目的に合うデータが探したい(そ […]
ぴよこ RNA-seqのデータを解析したけど、結果が転写産物IDごとになってる。遺伝子ごとに変換したいんだけど、どうやってやればいいの? まさる博士 それなら、EnsemblのBioMartを使うといいよ! 遺伝子の解析をしていると、geneIDやtranscriptIDを変換したり、遺伝子名に変換 […]
より高速な発現定量データ解析手法として、発現定量を主眼とした、ゲノムにアラインメントしない方法(アラインメントフリー)が広まりつつあります。 アラインメントフリーの手法では、これまでに知られたすべてのトランスクリプトーム配列を使って、そのどれに解読した配列が相当するかをカウントします。 この記事では […]
FASTQファイルの品質管理と前処理は、下流のデータ解析において高品質で信頼性の高いデータを取得するために重要なステップです。 本記事では、アダプター配列の除去やクオリティの低いリードの除去など、FASTQファイルを高速に前処理するツールであるfastpの使い方を解説します。 MacBookAir […]