Skip to content

Latest commit

 

History

History
38 lines (21 loc) · 2.9 KB

Chap-Generative.md

File metadata and controls

38 lines (21 loc) · 2.9 KB
title output
1 Generative Models for Discrete Data
html_notebook

In molecular biology, many situations involve counting events: how many codons use a certain spelling, how many reads of DNA match a reference, how many CG digrams are observed in a DNA sequence. These counts give us discrete variables, as opposed to quantities such as mass and intensity that are measured on continuous scales.

分子生物学では、多くの状況でカウントイベントが発生します: 特定のスペルを使用するコドンの数、リファレンスと一致するDNAのリード数、DNAシーケンスで観察されるCG2文字組の数。 連続スケールで測定される質量や強度などの量とは対照的に、これらのカウントは離散変数を提供します。

If we know the rules that the mechanisms under study follow, even if the outcomes are random, we can generate the probabilities of any events we are interested in by computations and standard probability laws. This is a top-down approach based on deduction and our knowledge of how to manipulate probabilities. In Chapter 2, you will see how to combine this with data-driven (bottom-up) statistical modeling.

調査中のメカニズムが従う規則がわかっている場合、結果がランダムであっても、計算と標準確率法則によって、関心のあるイベントの確率を生成できます。 これは、推論と確率の操作方法に関する知識に基づくトップダウンアプローチです。第2章では、これをデータ駆動型(ボトムアップ)統計モデリングと組み合わせる方法について説明します。

Goals for this chapter

In this chapter we will:

  • Learn how to obtain the probabilities of all possible outcomes from a given model and see how we can compare the theoretical frequencies with those observed in real data.

  • Explore a complete example of how to use the Poisson distribution to analyse data on epitope detection.

  • See how we can experiment with the most useful generative models for discrete data: Poisson, binomial, multinomial.

  • Use the R functions for computing probabilities and counting rare events.

  • Generate random numbers from specified distributions.

この章では、次のことを行います。

  • 特定のモデルから考えられるすべての結果の確率を取得する方法を学び、理論的な頻度を実際のデータで観測された頻度と比較する方法を確認します。

  • エピトープ検出に関するデータを分析するためのポアソン分布の使い方の完全な例を探索します。

  • 離散データの最も有用な生成モデル(ポアソン、二項、多項)を実験する方法を見ます。

  • 確率を計算、またまれなイベントをカウントするためにRの関数を使います。

  • 指定された分布から乱数を生成します。