- 2024年5月5日
【GEOの使い方】GEOでRNAseqのデータを検索する
ぴよこ RNAseqデータの解析をしてみたいけど、どうやってデータを探していいかわからない。。。 まさる博士 GEOで検索すると、自分の解析したいデータを探すことができるよ! バイオインフォマティクスを始めるにあたって、RNA-seqのデータ解析をしてみたいけど、自分の目的に合うデータが探したい(そ […]
ぴよこ RNAseqデータの解析をしてみたいけど、どうやってデータを探していいかわからない。。。 まさる博士 GEOで検索すると、自分の解析したいデータを探すことができるよ! バイオインフォマティクスを始めるにあたって、RNA-seqのデータ解析をしてみたいけど、自分の目的に合うデータが探したい(そ […]
ぴよこ RNA-seqのデータを解析したけど、結果が転写産物IDごとになってる。遺伝子ごとに変換したいんだけど、どうやってやればいいの? まさる博士 それなら、EnsemblのBioMartを使うといいよ! 遺伝子の解析をしていると、geneIDやtranscriptIDを変換したり、遺伝子名に変換 […]
本記事では、poetryの使い方を解説します。 poetryとは poetryはpythonの依存関係管理とパッケージングのためのツールです。 poetryのインストール asdfのインストール poetryのインストールですが、別の記事で解説したasdfを使うと簡単にインストールすることができます […]
ぴよこ 複数のpythonのバージョンを使い分けたいんだけど、どうすればいいかな? まさる博士 それなら、asdfが便利だよ! みなさん、pythonのインストールはどのようにしていますか? 1つのバージョンだけ使うのであればpythonの公式ページからダウンロードして、インストールするのが簡単です […]
本記事では、pythonのライブラリである、GEOparseを用いて、GEOのデータを取得・解析する手法について解説します。 GEOとは NCBIのGEO(Gene Expression Omnibus)は、遺伝子発現情報のデータベースであり、マイクロアレイやRNA-seq実験などで得られたデータが […]
より高速な発現定量データ解析手法として、発現定量を主眼とした、ゲノムにアラインメントしない方法(アラインメントフリー)が広まりつつあります。 アラインメントフリーの手法では、これまでに知られたすべてのトランスクリプトーム配列を使って、そのどれに解読した配列が相当するかをカウントします。 この記事では […]
Visual Studio Code(VS Code)は、Microsoftが開発したオープンソースのコードエディターです。多くの言語やプラットフォームに対応しており、拡張機能やデバッグツールなどの機能も豊富です。 VS Codeを使うときに便利なのが、キーボードショートカットです。キーボードショー […]
FASTQファイルの品質管理と前処理は、下流のデータ解析において高品質で信頼性の高いデータを取得するために重要なステップです。 本記事では、アダプター配列の除去やクオリティの低いリードの除去など、FASTQファイルを高速に前処理するツールであるfastpの使い方を解説します。 MacBookAir […]
FASTQファイルは一般に数GBを超えるような大容量のファイルになります。 データサイズが大きすぎると、取り回しが大変なので、リード数の少ないデータにして解析に使用したい場合があります。このようなリードのダウンサンプリング(サブサンプリング)は、データ全体からランダムにサンプリングすることで実現でき […]
バイオインフォマティクスを始めるときに、初心者が最初にぶつかる壁が環境構築です。解析を行うためには非常にたくさんのソフトウェアをインストールして使わないといけないケースが多くあります。 この記事では、Windowsのパソコンで簡単にバイオインフォマティクスの解析をする環境を準備する方法を解説します。 […]