- 2025年4月16日
バイオインフォマティクスの主要なファイル形式
バイオインフォマティクスでは、ゲノムシーケンス、解析結果、アラインメント、バリアント(遺伝子多型)情報など、さまざまな生物学的データを扱います。各種ファイル形式は、データの内容や解析目的に応じて最適なフォーマットが選択され、効率的なデータ管理および解析を実現します。 本記事では、バイオインフォマティ […]
バイオインフォマティクスでは、ゲノムシーケンス、解析結果、アラインメント、バリアント(遺伝子多型)情報など、さまざまな生物学的データを扱います。各種ファイル形式は、データの内容や解析目的に応じて最適なフォーマットが選択され、効率的なデータ管理および解析を実現します。 本記事では、バイオインフォマティ […]
より高速な発現定量データ解析手法として、発現定量を主眼とした、ゲノムにアラインメントしない方法(アラインメントフリー)が広まりつつあります。 アラインメントフリーの手法では、これまでに知られたすべてのトランスクリプトーム配列を使って、そのどれに解読した配列が相当するかをカウントします。 この記事では […]
FASTQファイルの品質管理と前処理は、下流のデータ解析において高品質で信頼性の高いデータを取得するために重要なステップです。 本記事では、アダプター配列の除去やクオリティの低いリードの除去など、FASTQファイルを高速に前処理するツールであるfastpの使い方を解説します。 MacBookAir […]
FASTQファイルは一般に数GBを超えるような大容量のファイルになります。 データサイズが大きすぎると、取り回しが大変なので、リード数の少ないデータにして解析に使用したい場合があります。このようなリードのダウンサンプリング(サブサンプリング)は、データ全体からランダムにサンプリングすることで実現でき […]
FASTAとFASTQは、どちらも配列を扱うときに使われる代表的なファイル形式です。 本記事では、FASTAとFASTQの2つのファイル形式の内容について解説します。 FASTA形式とは FASTAは塩基配列やアミノ酸配列を記述するときに使われるデータ形式で、「ファスタ」もしくは「ファストエー」と読 […]