概率密度函数 r语言概率密度图

离散型数据和连续型数据
上面提到的二项式分布、超几何分布、泊松分布都是离散型数据,即数据由单个数值组成,每个数值都有相应的概率。离散型数据往往可以用某种方式计数,可以取一个确切的值,所以离散型数据也叫数值型数据。

然而,并不是所有的数字数据都是离散的。有时,并不总是能够枚举数据集中的所有值。有时候,数据覆盖一个范围,这个范围内的任何值都可能成为事件结果。比如让你称几个苹果,已知这些苹果的重量在500g到800g之间,那么称出来的结果可能是500.1g,500.56g,600.36g等等。重量、长度等数据称为连续数据,通常通过测量而非计数获得。

概率密度函数 r语言概率密度图

对于离散概率分布,我们关心的是获得一个特定值的概率;对于连续概率分布,我们关心的是获得一个特定的概率范围,而概率密度函数是用来描述连续随机变量的概率分布的。

概率密度函数

概率密度函数f(x)是一个函数,通过它可以求出一个数据范围内连续变量的概率,它向我们展示了概率分布的形状。

连续随机变量的概率用面积来表示。为了求特定数值范围的概率,可以先画出概率密度函数。函数图下面和这个特定数值范围之间的面积就是这个特定数值范围的概率,线下的总面积必须等于1。例如:

1.要计算概率,先求f(x)。

f(x) * 20 = 1,= & gtF(x) = 0.05(概率密度函数)

2.再求面积,求概率。

假设我们要求P(x & gt;5),如下图所示

p(x & gt;5)=(20-5)* f(x)= 15 * 0.05 = 0.75

所以在处理连续数据时,计算的是一个数值范围内的概率,用图形中的面积来表示。

理解概率密度函数是计算连续概率分布的基础,下一节将详细解剖正态分布。

免责声明:本站所有文章内容,图片,视频等均是来源于用户投稿和互联网及文摘转载整编而成,不代表本站观点,不承担相关法律责任。其著作权各归其原作者或其出版社所有。如发现本站有涉嫌抄袭侵权/违法违规的内容,侵犯到您的权益,请在线联系站长,一经查实,本站将立刻删除。

发表回复

登录后才能评论