- 2023年6月26日
- 2024年5月4日
【seqkitの使い方】FASTQファイルをダウンサンプリングする
FASTQファイルは一般に数GBを超えるような大容量のファイルになります。 データサイズが大きすぎると、取り回しが大変なので、リード数の少ないデータにして解析に使用したい場合があります。このようなリードのダウンサンプリング(サブサンプリング)は、データ全体からランダムにサンプリングすることで実現でき […]
FASTQファイルは一般に数GBを超えるような大容量のファイルになります。 データサイズが大きすぎると、取り回しが大変なので、リード数の少ないデータにして解析に使用したい場合があります。このようなリードのダウンサンプリング(サブサンプリング)は、データ全体からランダムにサンプリングすることで実現でき […]
バイオインフォマティクスを始めるときに、初心者が最初にぶつかる壁が環境構築です。解析を行うためには非常にたくさんのソフトウェアをインストールして使わないといけないケースが多くあります。 この記事では、Windowsのパソコンで簡単にバイオインフォマティクスの解析をする環境を準備する方法を解説します。 […]
FASTAとFASTQは、どちらも配列を扱うときに使われる代表的なファイル形式です。 本記事では、FASTAとFASTQの2つのファイル形式の内容について解説します。 FASTA形式とは FASTAは塩基配列やアミノ酸配列を記述するときに使われるデータ形式で、「ファスタ」もしくは「ファストエー」と読 […]
ぴよこ FASTQファイルをダウンロードしたくてNCBIのサイトをうろうろしてるんだけど、全然見つからない(汗) まさる博士 NCBIのSRAでは、FASTQファイルはブラウザからはダウンロードできないんだって 次世代シーケンサー(NGS)のデータ解析を始めるために、まずFASTQファ […]
バイオインフォマティクスを始めるときに、初心者が最初にぶつかる壁が環境構築です。解析を行うためには非常にたくさんのソフトウェアをインストールして使わないといけないケースが多くあります。 この記事では、簡単にバイオインフォマティクスの解析を始められる環境を準備する方法を解説します。 結論から言うと、自 […]