AUTHOR

まさなり

  • 2023年12月23日
  • 2024年3月25日

【GEOparseの使い方】GEOのデータをpythonで解析する

本記事では、pythonのライブラリである、GEOparseを用いて、GEOのデータを取得・解析する手法について解説します。 GEOとは NCBIのGEO(Gene Expression Omnibus)は、遺伝子発現情報のデータベースであり、マイクロアレイやRNA-seq実験などで得られたデータが […]

  • 2023年12月23日
  • 2024年3月25日

【kallistoの使い方】アラインメントフリーで遺伝子発現量を計算する

より高速な発現定量データ解析手法として、発現定量を主眼とした、ゲノムにアラインメントしない方法(アラインメントフリー)が広まりつつあります。 アラインメントフリーの手法では、これまでに知られたすべてのトランスクリプトーム配列を使って、そのどれに解読した配列が相当するかをカウントします。 この記事では […]

  • 2023年11月29日
  • 2024年3月25日

VS Codeの便利なショートカットキー(Windows)

Visual Studio Code(VS Code)は、Microsoftが開発したオープンソースのコードエディターです。多くの言語やプラットフォームに対応しており、拡張機能やデバッグツールなどの機能も豊富です。 VS Codeを使うときに便利なのが、キーボードショートカットです。キーボードショー […]

  • 2023年7月3日
  • 2024年3月25日

【fastpの使い方】FASTQのクオリティチェックとトリミング

FASTQファイルの品質管理と前処理は、下流のデータ解析において高品質で信頼性の高いデータを取得するために重要なステップです。 本記事では、アダプター配列の除去やクオリティの低いリードの除去など、FASTQファイルを高速に前処理するツールであるfastpの使い方を解説します。 MacBookAir […]

  • 2023年6月26日
  • 2024年5月4日

【seqkitの使い方】FASTQファイルをダウンサンプリングする

FASTQファイルは一般に数GBを超えるような大容量のファイルになります。 データサイズが大きすぎると、取り回しが大変なので、リード数の少ないデータにして解析に使用したい場合があります。このようなリードのダウンサンプリング(サブサンプリング)は、データ全体からランダムにサンプリングすることで実現でき […]

  • 2023年6月19日
  • 2024年5月4日

Dockerのインストールから使い方まで(Windows版)

バイオインフォマティクスを始めるときに、初心者が最初にぶつかる壁が環境構築です。解析を行うためには非常にたくさんのソフトウェアをインストールして使わないといけないケースが多くあります。 この記事では、Windowsのパソコンで簡単にバイオインフォマティクスの解析をする環境を準備する方法を解説します。 […]

  • 2023年6月12日
  • 2024年3月25日

【ファイル形式】FASTAとFASTQ

FASTAとFASTQは、どちらも配列を扱うときに使われる代表的なファイル形式です。 本記事では、FASTAとFASTQの2つのファイル形式の内容について解説します。 FASTA形式とは FASTAは塩基配列やアミノ酸配列を記述するときに使われるデータ形式で、「ファスタ」もしくは「ファストエー」と読 […]

  • 2023年6月5日
  • 2024年3月25日

【fasterq-dumpの使い方】FASTQファイルを高速にダウンロードする

  ぴよこ FASTQファイルをダウンロードしたくてNCBIのサイトをうろうろしてるんだけど、全然見つからない(汗) まさる博士 NCBIのSRAでは、FASTQファイルはブラウザからはダウンロードできないんだって 次世代シーケンサー(NGS)のデータ解析を始めるために、まずFASTQファ […]

  • 2023年6月1日
  • 2024年5月4日

Dockerのインストールから使い方まで(Mac版)

バイオインフォマティクスを始めるときに、初心者が最初にぶつかる壁が環境構築です。解析を行うためには非常にたくさんのソフトウェアをインストールして使わないといけないケースが多くあります。 この記事では、簡単にバイオインフォマティクスの解析を始められる環境を準備する方法を解説します。 結論から言うと、自 […]