Autoformer 与分解式架构——在泽微AI/泽微一号上提升长序列预测精度

2021-02-21

💡 LSTF 的挑战：复杂的时间模式与耦合

在长序列时间序列预测（LSTF）任务中，数据往往包含复杂的季节性（周期性） 和 趋势性 模式。这些模式相互耦合，使得模型难以同时有效地捕获长期趋势和精细的周期波动。

上一篇我们介绍了 Informer 模型如何通过稀疏注意力解决计算效率问题。而 Autoformer 则进一步聚焦于模型设计，引入了分解式架构来提高预测精度和可解释性。

标准的 Transformer 模型直接将时间序列视为一个整体进行 Attention 计算，这带来了几个问题：

Autoformer 提出了一种全新的、基于分解式（Decomposition） 的 Transformer 架构，以显著提升 LSTF 的预测精度和效率。

深度分解架构（Deep Decomposition Architecture）：
- 原理：Autoformer 在模型内部集成了经典的时间序列分解思想。它使用一种移动平均平滑（Moving Average Smoothing） 模块，将输入的时间序列在每个编码器层之前，递归地分解为趋势-周期（Trend-Cyclic） 部分和季节性（Seasonal） 部分。
- 效果：模型可以针对性地处理不同模式：季节性部分由特殊的 Attention 机制处理；趋势部分则由堆叠的自注意力层学习。这种分离处理提高了模型的精度和可解释性。
自相关机制（Auto-Correlation Mechanism）：
- 原理：Autoformer 摒弃了传统的点积 Attention，转而使用序列的周期性作为度量，通过快速傅里叶变换（FFT） 来识别序列的主导周期。然后，模型基于这些主导周期进行 Attention 计算（即：在周期内进行子序列加权求和）。
- 效果：将注意力计算的复杂度从 $O(L^2)$ 降低到 $O(L \log L)$ ，且效率高于稀疏注意力，因为它是基于可解释的周期性进行计算，更能捕获 LSTF 的内在规律。
生成式预测：与 Informer 类似，Autoformer 也采用了解耦的生成式解码器，允许模型在一步前向传播中同时预测未来的所有时间步，加快了推理速度。

Autoformer 的分解架构和自相关机制虽然优化了理论复杂度，但在实际运行中，FFT 运算和大量的矩阵操作依然需要强大的计算资源。泽微AI（或 泽微一号）平台提供了理想的运行环境：

高性能 GPU 支持：平台配备的 NVIDIA A100/H100 等 GPU 提供了强大的并行计算能力，确保复杂的 FFT 和矩阵操作能够快速执行。
软件优化：平台集成了优化的 PyTorch/TensorFlow 环境，以及加速 FFT 运算的库，确保 Autoformer 模型在底层计算上达到极致效率。
集群可扩展性：对于超大规模或多任务 LSTF 预测，用户可以利用平台的分布式调度系统，轻松扩展到多卡多机，实现大规模并行预测。

Autoformer 模型通过其深度分解架构和自相关机制，提供了一种处理 LSTF 任务的优雅解决方案。它不仅将计算复杂度降低到 $O(L \log L)$ ，更重要的是，通过分解式处理，显著提高了长序列预测的精度和模型的鲁棒性。

泽微AI/泽微一号 平台是运行 Autoformer 等 LSTF 模型的理想选择，我们提供强大的算力支撑和优化的软件栈，助力您在复杂的时序数据分析中实现更高的预测价值。