概率基础——指数分布

介绍

指数分布是一种连续概率分布,描述了独立随机事件之间的时间间隔。它常被用来模拟随机事件的等待时间,例如到达下一位顾客的等待时间、设备故障的间隔时间等。指数分布具有无记忆性的特点,即在给定时间内没有发生事件并不会影响下一次事件发生的概率。

理论及公式

指数分布的概率密度函数(PDF)为:

f ( x ; λ ) = λ e − λ x f(x;\lambda) = \lambda e^{-\lambda x} f(x;λ)=λeλx

其中, x ≥ 0 x \geq 0 x0 表示时间间隔, λ > 0 \lambda > 0 λ>0是指数分布的参数,也称为速率参数。参数 λ \lambda λ 表示单位时间(或单位长度)内发生事件的平均次数。

指数分布的参数

  • 速率参数 λ \lambda λ:单位时间(或单位长度)内发生事件的平均次数。速率参数 λ \lambda λ越大,事件发生的速率越快;速率参数 λ \lambda λ越小,事件发生的速率越慢。

举例

假设某个公交车站的乘客到达时间间隔符合指数分布,参数 λ = 0.1 \lambda = 0.1 λ=0.1,即平均每10分钟会有一个乘客到达。我们希望了解乘客到达的等待时间分布情况,以便优化公交车站的客流管理。

Python绘制不同参数的概率密度曲线

接下来,我们将使用Python来绘制不同参数的指数分布的概率密度曲线。

import numpy as np
import matplotlib.pyplot as plt
from scipy.stats import expon

# 定义不同参数的速率参数
lambdas = [0.5, 1, 2]

# 生成x轴的取值范围
x = np.linspace(0, 5, 1000)

# 绘制概率密度曲线
plt.figure(figsize=(10, 6))
for lam in lambdas:
    y = expon.pdf(x, scale=1/lam)
    plt.plot(x, y, label=f'lambda={lam}')

plt.title('Exponential Distribution PDF with Different Lambda')
plt.xlabel('x')
plt.ylabel('Probability Density')
plt.legend()
plt.grid(True)
plt.show()

概率基础——指数分布-LMLPHP

以上代码将绘制出三条不同参数 λ \lambda λ的指数分布概率密度曲线,参数 s c a l e = 1 / λ scale=1/\lambda scale=1/λ。从图中可以看出,不同参数的指数分布曲线具有不同的速率,速率参数 λ \lambda λ 越大,曲线下降越快,事件发生的速率越快。
对指数型随机变量进行采样生成,对 λ = 1 \lambda=1 λ=1的指数分布进行采样生成,代码如下:

from scipy.stats import expon
import matplotlib.pyplot as plt
import numpy as np

expon_rv = expon()
expon_rvs = expon_rv.rvs(size=100000)
x = np.linspace(0, 10, 1000)
plt.plot(x, expon_rv.pdf(x), 'r', lw=3, alpha=0.6, label="$\\lambda$=1")
plt.hist(expon_rvs, bins=100, density=True, alpha=0.75, edgecolor='black')
plt.grid(ls='--')
plt.legend()
plt.show()

概率基础——指数分布-LMLPHP

总结

本文介绍了指数分布及Python实现,利用了函数包的各个方法计算出各个理论统计值,利用采样样本数据计算出来的值和理论值基本算都是相等的。

02-24 22:49