CATEGORY

NGS解析

  • 2024年8月13日

【PyDESeq2の使い方】発現変動遺伝子を解析する

ぴよこ RNAseqのデータを用いて発現量が変動した遺伝子を解析したい まさる博士 それなら、PyDESeq2が便利だよ 本記事では、PyDESeq2を用いて、発現変動遺伝子を解析する方法について解説します。   PyDESeq2とは PyDESeq2の前に、DESeq2について説明します […]

  • 2024年8月12日
  • 2024年8月13日

【pytximportの使い方】転写産物ごとの発現量データを遺伝子ごとの発現量に変換する

ぴよこ kallistoで解析したデータをその後の解析にどうやって使えばいいのかわからない。調べたらtximportが便利みたいだけど、R使ったことないからできなさそう。。。 まさる博士 そんな君に朗報!tximportのpythonバージョンであるpytximportがあるよ RNAseq解析にお […]

  • 2024年5月5日

【GEOの使い方】GEOでRNAseqのデータを検索する

ぴよこ RNAseqデータの解析をしてみたいけど、どうやってデータを探していいかわからない。。。 まさる博士 GEOで検索すると、自分の解析したいデータを探すことができるよ! バイオインフォマティクスを始めるにあたって、RNA-seqのデータ解析をしてみたいけど、自分の目的に合うデータが探したい(そ […]

  • 2024年5月4日

【BioMartの使い方】geneIDとtranscriptIDの対応表を作成する

ぴよこ RNA-seqのデータを解析したけど、結果が転写産物IDごとになってる。遺伝子ごとに変換したいんだけど、どうやってやればいいの? まさる博士 それなら、EnsemblのBioMartを使うといいよ! 遺伝子の解析をしていると、geneIDやtranscriptIDを変換したり、遺伝子名に変換 […]

  • 2023年12月23日
  • 2024年3月25日

【kallistoの使い方】アラインメントフリーで遺伝子発現量を計算する

より高速な発現定量データ解析手法として、発現定量を主眼とした、ゲノムにアラインメントしない方法(アラインメントフリー)が広まりつつあります。 アラインメントフリーの手法では、これまでに知られたすべてのトランスクリプトーム配列を使って、そのどれに解読した配列が相当するかをカウントします。 この記事では […]

  • 2023年7月3日
  • 2024年3月25日

【fastpの使い方】FASTQのクオリティチェックとトリミング

FASTQファイルの品質管理と前処理は、下流のデータ解析において高品質で信頼性の高いデータを取得するために重要なステップです。 本記事では、アダプター配列の除去やクオリティの低いリードの除去など、FASTQファイルを高速に前処理するツールであるfastpの使い方を解説します。 MacBookAir […]

  • 2023年6月26日
  • 2024年5月4日

【seqkitの使い方】FASTQファイルをダウンサンプリングする

FASTQファイルは一般に数GBを超えるような大容量のファイルになります。 データサイズが大きすぎると、取り回しが大変なので、リード数の少ないデータにして解析に使用したい場合があります。このようなリードのダウンサンプリング(サブサンプリング)は、データ全体からランダムにサンプリングすることで実現でき […]

  • 2023年6月12日
  • 2024年3月25日

【ファイル形式】FASTAとFASTQ

FASTAとFASTQは、どちらも配列を扱うときに使われる代表的なファイル形式です。 本記事では、FASTAとFASTQの2つのファイル形式の内容について解説します。 FASTA形式とは FASTAは塩基配列やアミノ酸配列を記述するときに使われるデータ形式で、「ファスタ」もしくは「ファストエー」と読 […]

  • 2023年6月5日
  • 2024年3月25日

【fasterq-dumpの使い方】FASTQファイルを高速にダウンロードする

  ぴよこ FASTQファイルをダウンロードしたくてNCBIのサイトをうろうろしてるんだけど、全然見つからない(汗) まさる博士 NCBIのSRAでは、FASTQファイルはブラウザからはダウンロードできないんだって 次世代シーケンサー(NGS)のデータ解析を始めるために、まずFASTQファ […]