An Artificial Trend Index for Private Consumption Using Google Trends
TL;DR 精炼摘要
本文利用谷歌趋势数据与机器学习技术,为秘鲁私人消费构建了实时先行指标。研究发现,“食品”和“旅游”搜索类别能有效识别消费模式,显著提高预测准确性,降低误差,凸显分段使用此类数据对宏观经济预测的重要性。
摘要
In recent years, the use of databases that analyze trends, sentiments or news to make economic projections or create indicators has gained significant popularity, particularly with the Google Trends platform. This article explores the potential of Google search data to develop a new index that improves economic forecasts, with a particular focus on one of the key components of economic activity: private consumption (64% of GDP in Peru). By selecting and estimating categorized variables, machine learning techniques are applied, demonstrating that Google data can identify patterns to generate a leading indicator in real time and improve the accuracy of forecasts. Finally, the results show that Google's "Food" and "Tourism" categories significantly reduce projection errors, highlighting the importance of using this information in a segmented manner to improve macroeconomic forecasts.
思维导图
论文精读
中文精读
1. 论文基本信息 (Bibliographic Information)
- 标题 (Title): 使用谷歌趋势构建私人消费的人工趋势指数 (An Artificial Trend Index for Private Consumption Using Google Trends)
- 作者 (Authors): Juan Tenorio, Heidi Alpiste, Jakelin Remón, Arian Segil
- 隶属机构 (Affiliations):
- Juan Tenorio, Heidi Alpiste: 秘鲁应用科学大学 (Universidad Peruana de Ciencias Aplicadas)
- Jakelin Remón: 秘鲁天主教大学 (Pontificia Universidad Católica del Perú)
- Arian Segil: 国立圣马尔科斯大学 (Universidad Nacional Mayor de San Marcos)
- 发表期刊/会议 (Journal/Conference): 本文目前发布于
arXiv,这是一个开放获取的预印本平台,常用于物理学、数学、计算机科学等领域。arXiv上的论文通常未经同行评审,但能让研究者快速分享其最新成果。 - 发表年份 (Publication Year): 2025年 (根据 arXiv ID
2503.21981推断,表示于2025年3月提交)。 - 摘要 (Abstract): 近年来,利用趋势、情绪或新闻数据库进行经济预测或创建指标的做法日益流行,特别是
Google Trends平台。本文探讨了利用谷歌搜索数据开发新指数以改善经济预测的潜力,重点关注经济活动的关键组成部分——秘鲁的私人消费(占GDP的64%)。通过选择和估计分类变量,并应用机器学习技术,研究证明谷歌数据可以识别模式,从而生成一个实时的领先指标并提高预测准确性。最终结果表明,谷歌的“食品”和“旅游”类别搜索数据能显著减少预测误差,突显了以分段方式使用此类信息对改善宏观经济预测的重要性。 - 原文链接 (Source Link):
-
发布状态: 预印本 (Preprint)
2. 整体概括 (Executive Summary)
-
研究背景与动机 (Background & Motivation - Why):
- 核心问题: 在秘鲁,官方的私人消费数据发布存在显著的时间延迟(平均45天),这使得分析师和政策制定者无法及时应对消费趋势的变化,影响了经济决策的有效性。
- 问题重要性: 私人消费是秘鲁经济的基石,占其国内生产总值 (Gross Domestic Product, GDP) 的61%至66%(如图像7和图像8所示)。因此,准确、及时地掌握其动态至关重要。现有的领先指标(如家庭调查)同样存在1到3个月的发布延迟,无法完全解决问题。
- 创新思路: 本文提出,
Google Trends平台提供的高频、实时的搜索数据可以作为消费者意图的代理变量 (Proxy Variable)。因为人们在做出购买决策之前,往往会先在网上搜索相关信息。利用这些数据,可以构建一个领先于官方数据的经济指标,实现对私人消费的“即时预测” (Nowcasting)。
-
核心贡献/主要发现 (Main Contribution/Findings - What):
- 主要贡献:
- 提出并构建了一个名为**“人工消费趋势指数” (Artificial Consumption Trend Indicator, ACTI)** 的新月度指标,专门用于预测秘鲁的私人消费。
- 系统性地比较了多种方法(传统计量经济学模型和机器学习模型)在利用
Google Trends数据构建指标时的表现,证明了神经网络模型的优越性。
- 关键发现:
-
与主成分分析 (PCA) 和动态因子模型 (DFM) 等传统方法相比,循环神经网络 (Recurrent Neural Networks, RNN) 和人工神经网络 (Artificial Neural Networks, ANN) 能够更准确地捕捉私人消费的复杂、非线性动态和季节性模式。
-
数据的分段处理至关重要。并非所有
Google Trends数据都有同等的预测能力。研究发现,将搜索词按消费类别(如食品和旅游)进行细分,并分别构建指标,能比使用一个总的综合指数更显著地降低预测误差。
-
- 主要贡献:
3. 预备知识与相关工作 (Prerequisite Knowledge & Related Work)
- 基础概念 (Foundational Concepts):
- 谷歌趋势 (Google Trends): 是谷歌提供的一款免费在线工具,用于分析特定关键词在一段时间内的搜索热度。它不提供绝对搜索量,而是提供一个标准化的指数(0到100),表示一个词的搜索量相对于该地区总搜索量的比例。这使其成为衡量公众兴趣和意图的强大工具。
- 领先指标 (Leading Indicator): 是一种在整体经济活动发生变化之前就发生变动的经济统计数据。例如,消费者信心指数被认为是一个领先指标,因为消费者信心的变化可能会预示未来消费支出的增减。本文旨在创建一个基于
Google Trends的新型领先指标。 - 非结构化数据 (Unstructured Data): 指没有预定义数据模型或未以预定方式组织的数据。
Google Trends的搜索查询、社交媒体帖子和新闻文章都属于非结构化数据。将这些数据转化为可用于经济分析的量化指标是当前研究的一个热点。 - 神经网络 (Neural Networks): 是一种模仿人脑神经元网络结构的计算模型。它由多个相互连接的“神经元”层组成,能够学习数据中复杂的、非线性的关系,非常适合处理像经济时间序列这样动态变化的复杂数据。
- 前人工作 (Previous Works):
- 传统方法 - 消费者信心指数: 许多研究(如 [5], [6])证实,基于调查的消费者信心指数(如美国的
MCSI和CCI)在一定程度上可以预测消费支出。然而,其他研究(如 [9], [10], [12])指出,这些指数的预测能力有限,尤其是在经济稳定时期,或在使用实时数据进行样本外预测时表现不佳。 - 创新方法 - 使用
Google Trends:- 在美国,[13] 和 [14] 的研究表明,加入
Google Trends变量的模型在预测私人消费方面显著优于仅依赖传统信心指数的模型。 - 在西班牙 ([15])、中国 ([16]) 等地,研究也证实了本地化搜索数据(如百度的搜索数据)在提高消费预测准确性方面的价值。
- 在秘鲁和周边国家,已有研究使用
Google Trends预测就业 ([17])、汽车销售 ([18]) 等其他经济变量,为本文的研究奠定了基础。
- 在美国,[13] 和 [14] 的研究表明,加入
- 传统方法 - 消费者信心指数: 许多研究(如 [5], [6])证实,基于调查的消费者信心指数(如美国的
- 技术演进 (Technological Evolution):
- 数据源的演进: 从依赖政府发布的、低频、有延迟的官方统计数据和调查数据,演变为利用高频、实时的另类数据 (Alternative Data),如
Google Trends、信用卡交易数据和新闻文本。 - 分析方法的演进: 从传统的线性计量经济学模型(如向量自回归
VAR模型),演变为能够捕捉复杂非线性关系的机器学习模型,特别是神经网络 (ANN, RNN)。
- 数据源的演进: 从依赖政府发布的、低频、有延迟的官方统计数据和调查数据,演变为利用高频、实时的另类数据 (Alternative Data),如
- 差异化分析 (Differentiation):
-
地域聚焦: 本文专门针对秘鲁经济体,解决了该国官方数据延迟的具体痛点。
-
方法对比: 与许多只采用单一模型的研究不同,本文系统地比较了多种方法(
PCA,DFM,Stepwise,ANN,RNN),为选择最优模型提供了实证依据。 -
强调数据细分: 本文的核心洞见之一是**“分而治之”**,即对不同消费类别的
Google Trends数据进行细分处理,而不是将其混为一谈。这在相关文献中是一个重要的补充。
-
4. 方法论 (Methodology - Core Technology & Implementation Details)
本研究的核心是通过处理 Google Trends 数据,并利用不同的统计和机器学习模型,构建一个能有效预测私人消费的指数。
-
方法原理 (Methodology Principles):
- 数据处理:
Google Trends的原始数据是相对搜索热度指数。为了使其适用于时间序列分析,研究首先通过对数变换来稳定方差,然后计算对数差分,以捕捉相对变化并消除季节性影响。 - 模型构建: 利用处理后的多组
Google Trends时间序列数据作为输入,构建一个综合指数(即ACTI)。研究对比了多种降维和建模技术,从线性的PCA、DFM到非线性的ANN和RNN,旨在找到最能捕捉消费动态的模型。
- 数据处理:
-
方法步骤与流程 (Steps & Procedures):
- 关键词选择: 通过文献回顾和专家判断,初步选择了约130个与秘鲁消费相关的搜索关键词(见附录
Table A.5)。 - 数据提取与预处理: 使用 Python 的
Pytrends库提取2007年至2024年的月度搜索数据。对数据进行对数变换和差分处理。 - 最终词条筛选: 最终为构建
ACTI选择了26个与私人消费直接相关的词条和23个与商业和服务相关的词条(见附录Table A.6)。 - 指标构建与模型比较: 使用以下四种核心方法将筛选出的多维
Google Trends时间序列数据合成为单一的ACTI指数:- 主成分分析 (Principal Component Analysis, PCA)
- 动态因子模型 (Dynamic Factor Models, DFM)
- 人工神经网络 (Artificial Neural Networks, ANN)
- 循环神经网络 (Recurrent Neural Networks, RNN)
- 模型优化: 通过交叉验证 (Cross-Validation) 对每个模型的超参数进行校准,以找到最优配置,防止过拟合。
- 稳健性分析: 将构建好的
ACTI指数(按消费类别细分)纳入一个两阶段的预测模型中,评估其在样本外预测私人消费时的表现,并与基准模型进行比较。
- 关键词选择: 通过文献回顾和专家判断,初步选择了约130个与秘鲁消费相关的搜索关键词(见附录
-
数学公式与关键细节 (Mathematical Formulas & Key Details):
- 主成分分析 (Principal Component Analysis, PCA):
- 定义: 一种线性的降维技术,旨在将一组相关的变量转换为一组线性不相关的变量,即主成分。其目标是用更少的变量来解释原始数据中的大部分变异。
- 公式:
- 符号解释:
- :原始数据矩阵,每行是一个观测值,每列是一个
Google Trends搜索词序列。 - :特征向量矩阵,其列是 的协方差矩阵的特征向量。
- :主成分矩阵,其列是新的、不相关的变量。第一个主成分解释了最多的方差。
- :原始数据矩阵,每行是一个观测值,每列是一个
- 动态因子模型 (Dynamic Factor Models, DFM):
- 定义: 一种用于多元时间序列的统计模型,假设大量观测到的时间序列的动态可以由少数几个共同的、不可观测的潜在因子来解释。
- 公式:
- 符号解释:
- :在时间点 观测到的变量向量(即所有
Google Trends序列的值)。 - :在时间点 的不可观测的潜在因子向量。
- :因子载荷矩阵,表示每个观测变量与潜在因子之间的关系。
- :每个时间序列的特定误差项。
- :在时间点 观测到的变量向量(即所有
- 人工神经网络 (Artificial Neural Networks, ANN):
-
定义: 如图1所示,ANN由输入层、一个或多个隐藏层和输出层组成。每个神经元接收来自前一层的输入,进行加权求和,然后通过一个非线性激活函数得到输出。通过反向传播算法调整权重来最小化预测误差。
该图像是图示,展示了一个人工神经网络的处理结构,包括输入层、多个隐藏层和输出层,说明数据如何在各个层级之间传递和处理。 -
损失函数 (Loss Function): 在回归问题中,通常最小化均方误差 (Mean Squared Error, MSE)。
-
符号解释:
- :网络的所有参数集合(权重和偏置)。
- :样本数量。
- :第 个样本的真实观测值(如真实的私人消费)。
- :第 个样本的输入向量(如所有
Google Trends序列的值)。 - :神经网络对输入 的预测值。
-
- 循环神经网络 (Recurrent Neural Networks, RNN):
-
定义: 如图2所示,RNN是ANN的一种变体,专门用于处理序列数据。其关键特征是神经元之间存在循环连接,使得信息可以在时间步之间传递,从而让网络具有“记忆”能力,能够捕捉时间序列中的长期依赖关系。
该图像是一个示意图,展示了一个包含输入层、两个隐藏层和输出层的神经网络结构,图中蓝色区域标记的为两个隐藏层,表示其节点和连接关系,右下角标注“in RNN”,暗示该结构为递归神经网络的一部分。 -
隐藏状态更新公式:
-
符号解释:
-
:在时间点 的隐藏状态(网络的“记忆”)。
-
:前一个时间点
t-1的隐藏状态。 -
:在时间点 的输入。
-
:分别对应于隐藏状态和输入的权重矩阵。
-
:偏置项。
-
:非线性激活函数(如
tanh或ReLU)。
-
-
- 主成分分析 (Principal Component Analysis, PCA):
5. 实验设置 (Experimental Setup)
- 数据集 (Datasets):
- 数据来源:
Google Trends平台,针对秘鲁地区。 - 目标变量: 秘鲁的月度私人消费数据。
- 时间跨度: 月度数据,从2007年1月到2024年10月。(注意:这个结束日期超出了当前时间,表明这可能是作者设定的研究截止日期或预测范围)。
- 数据划分: 采用交叉验证策略,将数据分为训练集(2008.01 - 2014.08)、验证集(2014.09 - 2022.05)和测试集(2022.06 - 2024.10)。
- 数据来源:
- 评估指标 (Evaluation Metrics):
- 均方误差 (Mean Squared Error, MSE):
- 概念定义: MSE 衡量的是模型预测值与真实值之间差值的平方的平均值。它对较大的误差给予更高的权重,是回归任务中最常用的损失函数和评估指标之一。MSE 的值越小,说明模型的预测越准确。
- 数学公式:
- 符号解释:
- :预测的总次数。
- :在时间点 的真实观测值。
- :在时间点 的模型预测值。
- 均方根误差 (Root Mean Squared Error, RMSE):
- 概念定义: RMSE 是 MSE 的平方根。与 MSE 相比,它的优点是其单位与原始数据的单位相同,因此更易于解释。例如,如果目标变量是美元,那么 RMSE 的单位也是美元。RMSE 越小,表示模型预测精度越高。
- 数学公式:
- 符号解释:
- 所有符号含义同 MSE。
- Diebold-Mariano (DM) 检验:
- 概念定义: DM 检验是一种统计检验,用于比较两个不同预测模型的预测准确性。其原假设是两个模型的预测误差序列具有相同的均值,即两个模型的预测能力没有显著差异。如果 p-value 小于显著性水平(如0.05),则可以拒绝原假设,认为一个模型显著优于另一个。
- 数学公式:
- 符号解释:
- :两个模型预测损失(如平方误差)之差的序列。
- :损失差异序列的均值。
- :损失差异序列的方差的估计值。
- :观测数量。
- Giacomini-White (GW) 检验:
- 概念定义: GW 检验是 DM 检验的一种扩展,它评估的是模型的条件预测能力 (Conditional Predictive Ability)。与 DM 检验评估模型的平均表现不同,GW 检验可以判断一个模型是否在特定条件下(例如,在经济衰退期或高波动期)始终优于另一个模型。
- 数学公式:
- 符号解释:
- :在时间点 两个模型预测损失的差异。
- :样本外数据集的大小。
- 均方误差 (Mean Squared Error, MSE):
- 对比基线 (Baselines):
-
PCA (主成分分析): 代表了线性的、无监督的降维方法。
-
DFM (动态因子模型): 代表了经典的宏观经济时间序列分析方法。
-
Stepwise Least Square: 一种传统的变量选择和线性回归方法。
-
这些基线模型代表了在引入复杂的非线性模型(如神经网络)之前,研究者通常会采用的传统统计和计量经济学方法。
-
6. 实验结果与分析
-
核心结果分析 (Core Results Analysis):
-
模型初步比较 (Figure 3):
-
图像3和图像4共同构成了
Figure 3。在图像3中,通过极坐标图展示,PCA Indicator(紫色线)波动剧烈且无规律,而DFM Indicator(蓝色线)过于平滑,两者都未能很好地拟合实际的Private Consumption(红色线)的动态。 -
相比之下,在图像4中,由
RNN(绿色线)和ANN(在图中标记为RNA,应为ANN,橙色线) 生成的指标与实际的私人消费曲线高度重合,准确地捕捉了其趋势和季节性波动。这初步证明了神经网络模型在捕捉消费数据复杂模式方面的优越性。
该图像是一个极坐标图,展示了图3中私营消费与PCA指标及DFM指标的对比,时间范围涵盖2008年至2018年,反映了不同指标随时间的变化趋势。
该图像是一个极坐标系图表,展示了私消费(Private Consumption)与两种神经网络指标(RNN Indicator和RNA Indicator)随时间(月-年)变化的趋势对比,反映了模型预测与实际数据的拟合度。
-
-
波动性分析 (Figure 4):
-
图像5展示了不同指标的波动性。左侧图 (a) 显示了各指标与其条件方差的关系,右侧图 (b) 则直观展示了
RNN Index的方差曲面。这部分分析旨在更深入地理解不同指标的统计特性。
该图像是包含两个子图的图表,展示图4中不同指标的波动性分析。左侧图(a)为条件方差 三维散点图,右侧图(b)为方差 的三维曲面图,分别描绘时间、指标值和方差的关系。
-
-
超参数优化 (Hyperparameter Calibration):
-
研究采用了严谨的交叉验证策略来优化模型参数,如下表转录的
Table 2所示。Table 2: Cross-Validation Strategy for Parameter Optimization (转录)
Training dataset 2008m1-2014m08 Validation set 2014m09-2022m5 Testing set 2022m06-2024m10 ←−→ Fold 1 Fold 2 Fold 3 Fold 4 Fold 5 ← ← -
下表转录的
Table 3展示了不同模型超参数的搜索范围和最终选定的最优值,这保证了模型比较的公平性和有效性。Table 3: Priors and Range of Hyperparameters (转录)
Modelo Hyperparameter Range Optimized Value PCA Number of Components 2 a 12 6 DFM Number of Factors / Series Length 2 a 10 / 0.01 to 2.5 4 / 1.2 RNA (ANN) Number of Hidden Layers / Number of Neurons 2 to 64 / 6 to 256 32 / 64 RNN Number of Hidden Layers / Number of Neurons 2 to 48 / 6 to 256 / 2.5 to 6.5 24 / 32 / 2.1
-
-
-
稳健性分析与关键发现 (Robustness Analysis):
-
这是论文最重要的部分,验证了
ACTI指数的实际预测能力。研究将Google Trends数据按消费类别(食品、交通、旅游等)分别构建指标,并加入到一个两阶段预测模型中。 -
Table 4(如下转录)的结果清晰地表明:- 所有包含
Google Trends信息的模型都显著提高了预测准确性。 “Total” 行显示,使用所有类别数据构建的综合指标,其MSE(1.69) 和RMSE(1.12) 是所有模型中最低的。 - “食品” (Food) 和 “旅游” (Tourism) 类别表现最佳。
Tourism模型的MSE(2.02) 和Food模型的MSE(2.35) 都非常低。这符合直觉,因为食品是日常消费的核心,而旅游则是反映可支配收入和消费者信心的重要领域。 - 统计显著性:
p-value (DM)和p-value (GW)列的值大多远小于0.05,这表明加入Google Trends指标的模型在统计上显著优于仅使用传统领先指标的基准模型。
Table 4: Evaluation of Prediction Statistics (转录)
Models Estimate MSE RMSE p-value (DM) p-value (GW) Food 0.614 2.35 1.40 0.029 0.002 Transport 0.241 3.61 6.45 0.057 0.017 Tourism 0.795 2.02 0.98 0.005 0.032 Recreation 0.713 4.51 5.62 0.026 0.014 Personal care 0.727 3.56 6.61 0.049 0.059 Total 0.791 1.69 1.12 0.001 0.002 - 所有包含
-
7. 总结与思考 (Conclusion & Personal Thoughts)
-
结论总结 (Conclusion Summary):
Google Trends是构建高频经济指标的有效工具: 本研究成功证明,利用谷歌搜索数据可以构建一个领先指标 (ACTI),有效改善对秘鲁私人消费的实时预测。- 神经网络模型表现更优: 在处理复杂、非线性的搜索数据时,
RNN等神经网络模型比传统的线性模型(PCA,DFM)更具优势,能够更准确地捕捉经济动态。 - 数据细分是关键: 对
Google Trends数据进行分类处理(如按“食品”、“旅游”等消费类别)是提升预测能力的关键。一个统一的、同质化的方法可能无法获得最佳结果。这表明,需要根据预测目标和经济变量的特性,量身定制数据处理和建模策略。 - 对政策制定的启示: 政策制定者可以利用这类高频指标,更敏捷地监测经济脉搏,及时发现消费趋势的异常变化,从而为应对潜在的经济事件提供早期预警。
-
局限性与未来工作 (Limitations & Future Work):
- 局限性:
- 数据质量与稳定性:
Google Trends数据本身可能存在噪声。例如,一个与消费无关的热点新闻事件可能会导致某个关键词的搜索量异常飙升,从而干扰模型。 - 搜索行为的演变: 用户的在线搜索行为模式可能会随时间变化,这可能影响模型的长期稳定性。
- 因果关系: 研究证明了
Google Trends与消费之间的强相关性,但并未建立严格的因果关系。
- 数据质量与稳定性:
- 未来工作:
- 扩展到其他变量: 可以将此方法应用于预测其他重要经济变量,如就业、通货膨胀或特定行业的经济活动。
- 更高频率的数据: 探索使用日度或周度的
Google Trends数据来构建更高频率的经济活动指标。 - 融合多源数据: 将
Google Trends数据与新闻文本、社交媒体情绪、信用卡交易数据等其他另类数据源相结合,可能进一步提高预测的准确性和稳健性。
- 局限性:
-
个人启发与批判 (Personal Insights & Critique):
- 启发: 这篇论文为数据稀缺或发布延迟严重的新兴市场提供了一个极具实践价值的解决方案。它展示了如何创造性地利用公开可得的“大数据”来弥补传统经济统计的不足。**“数据细分”**的理念尤其具有启发性,提醒我们在数据分析中不能一概而论,深入理解数据背后的行为逻辑至关重要。
- 批判:
- 关键词选择的主观性: 论文中提到关键词的选择基于“文献回顾和专家判断”,这引入了一定的主观性。未来研究可以探索更自动化的、基于数据驱动的关键词选择方法,例如使用自然语言处理技术从相关经济报告中自动提取关键词。
- 模型可解释性: 神经网络模型虽然预测性能强大,但通常被视为“黑箱”,其内部决策过程难以解释。对于经济决策而言,理解“为什么”模型会做出某个预测与预测“什么”同样重要。论文并未深入探讨模型的可解释性问题。
- 时间范围的合理性: 论文使用的数据截止到2024年10月,这是一个未来的时间点。这可能是作者为了展示模型在完整年份上的表现而设定的范围,但对于一篇在2025年之前发表的论文来说,这部分数据应被视为样本外预测或模拟,而非历史回测,这一点需要在解读时特别注意。
相似论文推荐
基于向量语义检索推荐的相关论文。