- 2023年12月23日
- 2024年3月25日
【kallistoの使い方】アラインメントフリーで遺伝子発現量を計算する
より高速な発現定量データ解析手法として、発現定量を主眼とした、ゲノムにアラインメントしない方法(アラインメントフリー)が広まりつつあります。 アラインメントフリーの手法では、これまでに知られたすべてのトランスクリプトーム配列を使って、そのどれに解読した配列が相当するかをカウントします。 この記事では […]
より高速な発現定量データ解析手法として、発現定量を主眼とした、ゲノムにアラインメントしない方法(アラインメントフリー)が広まりつつあります。 アラインメントフリーの手法では、これまでに知られたすべてのトランスクリプトーム配列を使って、そのどれに解読した配列が相当するかをカウントします。 この記事では […]
FASTQファイルの品質管理と前処理は、下流のデータ解析において高品質で信頼性の高いデータを取得するために重要なステップです。 本記事では、アダプター配列の除去やクオリティの低いリードの除去など、FASTQファイルを高速に前処理するツールであるfastpの使い方を解説します。 MacBookAir […]
FASTQファイルは一般に数GBを超えるような大容量のファイルになります。 データサイズが大きすぎると、取り回しが大変なので、リード数の少ないデータにして解析に使用したい場合があります。このようなリードのダウンサンプリング(サブサンプリング)は、データ全体からランダムにサンプリングすることで実現でき […]
FASTAとFASTQは、どちらも配列を扱うときに使われる代表的なファイル形式です。 本記事では、FASTAとFASTQの2つのファイル形式の内容について解説します。 FASTA形式とは FASTAは塩基配列やアミノ酸配列を記述するときに使われるデータ形式で、「ファスタ」もしくは「ファストエー」と読 […]