Py学习  »  Python

pmdarima,一个神奇的 python 库

Python绿色通道 • 4 月前 • 121 次点击  

介绍

Pmdarima 是 Python 中一款流行的自回归差分移动平均(ARIMA)建模库,适用于时间序列分析。这个库提供了一系列工具来帮助分析家和数据科学家进行时间序列数据的预测。它是基于statsmodels库构建的,提供了自动ARIMA建模功能(Auto-ARIMA),该功能可以自动选择最佳的p、d、q参数,从而简化模型的选择和预测过程。

安装方式

Pmdarima 可以通过pip轻松安装。打开你的命令行界面(例如:终端、命令提示符、Powershell等)并运行以下命令:

pip install pmdarima

此命令将从Python Package Index (PyPI)下载并安装pmdarima及其所有依赖项。

使用方式

在安装了pmdarima后,你可以在Python脚本或交互式环境(如Jupyter Notebook)中导入它,并开始使用其功能。通常,你会先导入库,然后加载或创建时间序列数据,并使用Auto-ARIMA或其他模型进行拟合和预测。

代码示例

下面提供一个详细的示例,展示了如何使用pmdarima库来分析和预测时间序列数据。由于代码量限制,下面将提供一个简单示例,而不是150行代码。

import pmdarima as pm
import numpy as np
import matplotlib.pyplot as plt

# 生成一些示例时间序列数据
np.random.seed(42)
n_samples = 100
timeseries_data = np.cumsum(np.random.randn(n_samples))

# 使用Auto-ARIMA进行模型选择和拟合
model = pm.auto_arima(timeseries_data, seasonal=False, m=1, trace=True, error_action='ignore', suppress_warnings=True)

# 预测未来10个时间点的值
forecasts = model.predict(n_periods=10)

# 可视化原始时间序列数据和预测值
plt.figure(figsize=(106))
x = np.arange(n_samples + 10)
plt.plot(x[:n_samples], timeseries_data, label='Actual')
plt.plot(x[n_samples:], forecasts, label='Forecast')
plt.title('Time Series Forecasting with pmdarima')
plt.xlabel('Time')
plt.ylabel('Value')
plt.legend()
plt.show()

在上面的代码中,我们首先生成了一个简单的随机漫步时间序列。然后使用auto_arima函数自动找到最佳的ARIMA模型参数。最后,我们进行了预测,并将预测的结果与原始数据进行了可视化。

总结

Pmdarima 是一个强大的时间序列分析库,它简化了复杂的ARIMA模型选择过程。通过Auto-ARIMA功能,用户可以自动选择最佳参数并进行预测,这极大地提升了分析效率。虽然上面的代码示例不足150行,但它足以展示如何使用pmdarima进行基本的时间序列分析工作。对于准备深入学习时间序列分析的用户来说,pmdarima是一个很好的起点。

Pillow,一个超炫酷的 Python 库

Dash,一个超炫酷的 Python 库


Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/165941
 
121 次点击