- 2023年12月23日
- 2024年3月25日
【GEOparseの使い方】GEOのデータをpythonで解析する
本記事では、pythonのライブラリである、GEOparseを用いて、GEOのデータを取得・解析する手法について解説します。 GEOとは NCBIのGEO(Gene Expression Omnibus)は、遺伝子発現情報のデータベースであり、マイクロアレイやRNA-seq実験などで得られたデータが […]
本記事では、pythonのライブラリである、GEOparseを用いて、GEOのデータを取得・解析する手法について解説します。 GEOとは NCBIのGEO(Gene Expression Omnibus)は、遺伝子発現情報のデータベースであり、マイクロアレイやRNA-seq実験などで得られたデータが […]
より高速な発現定量データ解析手法として、発現定量を主眼とした、ゲノムにアラインメントしない方法(アラインメントフリー)が広まりつつあります。 アラインメントフリーの手法では、これまでに知られたすべてのトランスクリプトーム配列を使って、そのどれに解読した配列が相当するかをカウントします。 この記事では […]
Visual Studio Code(VS Code)は、Microsoftが開発したオープンソースのコードエディターです。多くの言語やプラットフォームに対応しており、拡張機能やデバッグツールなどの機能も豊富です。 VS Codeを使うときに便利なのが、キーボードショートカットです。キーボードショー […]
FASTQファイルの品質管理と前処理は、下流のデータ解析において高品質で信頼性の高いデータを取得するために重要なステップです。 本記事では、アダプター配列の除去やクオリティの低いリードの除去など、FASTQファイルを高速に前処理するツールであるfastpの使い方を解説します。 MacBookAir […]
FASTQファイルは一般に数GBを超えるような大容量のファイルになります。 データサイズが大きすぎると、取り回しが大変なので、リード数の少ないデータにして解析に使用したい場合があります。このようなリードのダウンサンプリング(サブサンプリング)は、データ全体からランダムにサンプリングすることで実現でき […]
バイオインフォマティクスを始めるときに、初心者が最初にぶつかる壁が環境構築です。解析を行うためには非常にたくさんのソフトウェアをインストールして使わないといけないケースが多くあります。 この記事では、Windowsのパソコンで簡単にバイオインフォマティクスの解析をする環境を準備する方法を解説します。 […]
FASTAとFASTQは、どちらも配列を扱うときに使われる代表的なファイル形式です。 本記事では、FASTAとFASTQの2つのファイル形式の内容について解説します。 FASTA形式とは FASTAは塩基配列やアミノ酸配列を記述するときに使われるデータ形式で、「ファスタ」もしくは「ファストエー」と読 […]
ぴよこ FASTQファイルをダウンロードしたくてNCBIのサイトをうろうろしてるんだけど、全然見つからない(汗) まさる博士 NCBIのSRAでは、FASTQファイルはブラウザからはダウンロードできないんだって 次世代シーケンサー(NGS)のデータ解析を始めるために、まずFASTQファ […]
バイオインフォマティクスを始めるときに、初心者が最初にぶつかる壁が環境構築です。解析を行うためには非常にたくさんのソフトウェアをインストールして使わないといけないケースが多くあります。 この記事では、簡単にバイオインフォマティクスの解析を始められる環境を準備する方法を解説します。 結論から言うと、自 […]