基于时间序列数据的预测历史悠久,远在人工智能出现之前。
体育专家会研究一支球队在一段时间内的表现,并预测他们是否会在某种球队结构下赢得某项比赛。这意味着理解“什么是时间序列预测?”并不难。
在现代,时间序列预测技术处理人类无法理解的大量数据。
因此,需要计算机模型。可以使用各种时间序列预测方法,例如简单移动平均线、指数平滑法、霍尔特冬季法等,但在本教程中,我们将更多地关注基础知识。
在统计学中,预测是统计推断的正常组成部分。
统计学中经常使用一种称为预测推断的方法。这成为时间序列预测的基础。
这种推断的原理就是简单地将历史中可用数据的趋势拉向未来并绘制预测值。
例如,如果两年前的面包价格是 1 美元,一年前是 1.5 美元,而今天是 2 美元。因此,我们“预测”明年的价格将是 2.5 美元。
当然,我们可能错了,现实世界的问题远比三年的面包价格复杂得多。但这里的目标是对此有一个好的了解。
时间序列预测的步骤 时间序列预测的步骤 - 图片来源 - siva analytics
有不同的时间序列预测方法适合不同的人,但总体过程及其步骤保持不变。
定义问题
再次参考我们的太阳辐射数据,问题可以是“预测 2050 年的辐射强度并根据预测值制定碳调节政策”。
因此,2050 年的高辐射值将意味着更严格的碳排放法。
准备数据 数据准备是任何数据科学活动的标准步骤。准备工作包括清除数据中的任何重复值或不准确的杂质值。
具体到时间序列的情况,准备甚至可能包括准备时间间隔,例如每日、每周等。
分析时间序列 虽然分析和预测是分开提及的,但没有分析就无法进行预测。我们只有了解价值历史中的模式,才能预测未来的价值。
|