诺奖得主罗默反思宏观经济学困境-徐瑾|经济人读书会-财新网

「徐瑾说」

2018年诺贝尔经济学奖没有冷门。

得主为美国耶鲁大学经济学家威廉•诺德豪斯与纽约大学经济学家保罗•罗默，

获奖理由是创新、气候和经济增长的研究。

小伙伴们，赶紧晒猜中的记录吧。

两人得奖实至名归，尤其罗默更是这些年大热门。

大家都知道罗默是内生经济增长理论的创始人。

他的结论是知识和创新可以刺激经济增长，这算是这几十年影响最大的论文之一。

按照罗默学生谢丹阳教授的介绍，罗默1986年发表在《政治经济学杂志》有三大贡献：

“一是强调了知识这类带有外部性属性的生产要素可以导致收益递增的总体产出函数，使得经济增长可以长期持续下去甚至增长可以越来越快，这一点一反此前《增长的极限》等书中描述的担忧；

二是探讨了如何将收益递增和市场完全竞争统一在一般均衡模型中去；

三是阐明了在此情形下市场竞争机制将导致次优结果，因此政府应当通过征税和补贴等组合手段对市场进行干预，将这些外部性内生化，从而重新达至社会最优。 ”

有意思的是，罗默这些年引发关注，除了他的学术贡献，以及去世行履职新闻，更在于他对于宏观经济学的反思。

他说，“问题并不是宏观经济学所说的与事实不符。真正的问题是其他经济学家并不在意宏观经济学家不关心事实本身。”

金融危机之后，宏观经济学面临很多反思，尤其对于货币的忽视引发很多思考。

以罗默的地位，确实可以自由发言，但是他的反思，还是值得主流经济学思考，这也许将是明天的希望。

今天推荐的文章也来自于其2017论文“The Trouble with Macroeconomics”。

当然，对于罗默批评的批评也有不错的，我会转在星球。

更多独家分析，我会在星球分享

译者：秦蒙，校对：齐昊来自一瓣与 CPEER微信公众号。

问题并不是宏观经济学所说的与事实不符。真正的问题是其他经济学家并不在意宏观经济学家不关心事实本身。比起坚定地维护错误，冷漠的容忍一个明显的错误对科学更具有腐蚀性。

如果我必须在背叛科学和背叛朋友间做出一个选择，我希望我有勇气背叛我的朋友

——保罗•罗默

摘要：在过去三十多年中，宏观经济学发生了倒退。如今，宏观经济学对识别问题的处理并不比20世纪70年代早期更值得信任，但它却因为更加不透明而逃避了质疑。宏观经济学的理论家们忽略了明显的事实，假装不知道诸如“紧缩的货币政策可以引起经济衰退”这样简单的道理。他们的模型把宏观变量的波动归因于假想的原因，而这些原因不受任何个人行为的影响。通过把宏观经济学与物理学中的弦理论进行比较，我们可以看到在科学中的一种一般的失败模式——当对德高望重的领导者的尊重演变成对权威的顺从，当这种顺从取代了客观事实在科学真理中的最终决定性地位时，这种失败模式就会发生。

李·斯莫林（Lee Smolin）只是注意到，在他二十五年的研究生涯中，物理学在其核心问题上没有任何进展，于是他开始写作《物理学的困境》（Smolin，2007）一书。然而，宏观经济学的困境更加严重——我已经观察到超过三十年的知识倒退了。

20世纪60年代到70年代早期，许多宏观经济学家对识别问题不屑一顾。他们没有意识到，在一个方程组中根据变量的观测值对变量间的因果关系做出判断是多么困难。到20世纪70年代末，宏观经济学家认识到了这个问题的严重性，但是正如卡纳瓦和萨拉（Canova and Sala，2009）在近期一篇文章的标题中指出的那样，我们现在“回到了原点（Back to Square One）”。目前的宏观模型使用令人难以置信的识别假设以得到令人困惑的结论。为了让本文的读者感受一下这些结论有多么奇怪，我们可以看看一位重要的宏观经济学家在一篇发表于2010年的文章中是如何评述的：

“……出于公开透明的目的，我必须承认，我自己并不完全相信货币的重要性，除了在严重通货膨胀的情况下。”

一、事实

如果想要对“货币政策并不重要”这一观点做一个直截了当的检验，那么沃尔克（Volcker）的紧缩政策就是可用于检验的事件。要记住，美联储直接控制着基础货币，即公众持有的通货与银行存款准备金之和。美联储可以通过买卖有价证券来调控基础货币。

图1给出了在沃尔克紧缩政策前后20年中历年的基础货币和消费价格指数（CPI）。图1上半部分的实线（在线版本是蓝线）是基础货币。实线下面的虚线（在线版本是红线）是CPI。这两个变量的初始时间为1960年，其初始值都标准化为1，所以纵轴表示了倍数，每向上移动一小格意味着变量是以前的2倍。由于纵轴表示的是倍数，所以通货膨胀率就是CPI曲线的斜率。

图1下半部分更详细地给出了每年的通货膨胀率，如图中的长虚线所示。图中的直虚线是对沃尔克紧缩政策前后通胀率的线性拟合。图1上下两部分都用阴影标明了美国国家经济研究局（NBER）所判断的经济收缩时期。我用颜色更深的阴影标明了沃尔克紧缩政策时期的两次衰退。从上下两图中可以看到，通胀的水平和趋势在两次衰退发生时出现了突然的变化。

当一个银行向另一个银行借入准备金时会按照名义联邦基金利率支付利息。如果美联储让准备金变得稀缺，联邦基金利率就会上升。表明货币政策宽松程度的最佳指标是实际联邦基金利率，即名义联邦基金利率与通胀率之差。在沃尔克担任美联储主席的时候，实际联邦基金利率比战后任何时期都要高。

沃尔克担任美联储主席两个月后，他采用了一种非同寻常的行为，召开新闻发布会宣布美联储将改变其运行方式。在克里斯蒂娜•罗默和大卫•罗默（Christina Romer & David Romer，1989）的研究中对导致这一变化的美联储内部商讨进行了总结。美联储官员预计这一变化会引起“联邦基金利率的迅速上升”并“抑制经济中的通胀压力”。

在图2中，横轴的时间以1979年8月沃尔克上任时为0时刻。图2中的实线（在线版本是蓝线）显示实际联邦基金利率在沃尔克上任后不久从接近于0增长到了5%左右。实际联邦基金利率是名义联邦基金利率减去图2中断点线（在线版本是红线）所表示的通胀率之后的结果。断点线表示月度同比通胀率，即CPI在12个月之中的增长率。虚线（在线版本是黑线）表示失业率。与GDP数据不同的是，月度失业率数据是可得的。在第一次衰退期间，随着失业率从6.3%增长到7.8%，产出下降了2.2%。在第二次衰退期间，随着失业率从7.2%增长到10.8%，产出下降了2.9%。

图2的数据对美联储官员所预料到的事件提出了一种简单的因果解释：

1.美联储致力于实现高于现行通胀率约500个基点的名义联邦基金利率，只在第一次衰退期间偏离了这一目标。

2.较高的实际联邦基金利率降低了产出，增加了失业。

3.通胀率下降了。要么是较高的失业率与较大的产出缺口相结合导致了通胀率下降，要么是美联储的行为改变了人们的预期导致了通胀率下降。

如果美联储能够使利率发生500个基点的变化，那么对货币政策重要性的质疑就是很可笑的了。面对图2的数据，对“货币政策并不重要”这一教条保持忠诚的唯一途径就是证明不管美联储的官员怎么想，他们并没有改变联邦基金利率；改变联邦基金利率的是一种虚构的冲击，这种冲击使得利率恰好在这个时间恰好提高了那么多，使得美联储的官员误认为是他们自己改变了利率。

据我所知，没有经济学家认为提高沃尔克任期内实际利率的是一种虚构的冲击，但许多人却赞成那些表达这种观点的模型。

二、后真实模型

在基德兰德和普利斯科特（Kydland & Prescott，1982）建立起真实经济周期模型（RBC）后，宏观经济学家习惯了这样一种观点，即宏观变量的波动是由虚构的冲击造成的，而不是由人们所采取的行为造成的。究其本质，RBC模型依赖于两个恒等式。第一个恒等式将通常的增长核算残差定义为产出Y的增长率与生产投入指数X的增长率之差：

众所周知，阿布拉莫维茨（Abromovitz，1956）将这一残差称为“对我们无知程度的衡量”。为了表示对他的敬意，也为了提醒我们自己的无知，我把变量A称为“燃素”。

第二个恒等式，即货币数量论，将流通速度v定义为名义产出（即实际产出Y与价格水平P之积）与货币总量M的比值：

真实经济周期模型将经济衰退解释为“燃素”的外生性下降。给定产出Y，货币总量M的变化所产生的唯一影响就是价格水平P的同比例变化。在这个模型中，货币政策的效果是那么微不足道，正如普利斯科特在明尼苏达大学教给研究生的那样：“就理解经济问题而言，邮政经济学比货币经济学还要关键”（Chong，La Porta，Lopez-de-Silanes，Shliefer，2014）。

真实经济周期模型的支持者把这一模型的微观基础当作模型的主要优势之一。这样问题就来了：这一模型所采用的负面“燃素”冲击并没有微观证据支持，对负面“燃素”冲击究竟是什么意思也没有合理的理论解读。

在一封私人信件中，一个曾与普利斯科特在明尼苏达大学有过交往的人告诉我一个故事，在我们都变得麻木之前帮助我记住了遇到“负面技术冲击”是什么样子的：

“普利斯科特邀请我担任他的一个学生预答辩的第二考官……我还没有见过或想过世上还存在那个学生所做的校准工作。我认为出于很多原因这种工作没有什么科学价值，但是在学生报告进行的过程中，我还算认真地去理解报告内容。当轮到我提问时，我（甚至没有去想技术性冲击这个概念并不是那个学生的研究所针对的问题）问道：“这些技术性冲击是什么？普利斯科特紧张地就好像刚刚中了一颗子弹。在经过了大约四五秒的尴尬后，他咆哮着说：“技术性冲击就是那拥挤的交通。”（我们所在的房间能够看到外面一座桥上在午后时段的拥堵，这座桥在几十年之后垮塌了。）很显然，倘若他真正所想的东西有效说明了这个概念的话，我是会听下去的……”

这段引文特别能够反映的是，倘若有任何人严肃对待微观基础的问题，那么这种懒惰的理论构建就会得到遏制。假定一个经济学家认为交通拥堵是对宏观波动打的一个比方，或者认为交通拥堵就是宏观波动的原因，那么显然，这种理论继续发展的方向就是去探讨司机们决定何时开车以及走什么路线。从这些决策的相互作用中就会出现看起来随机的交通流量波动。这是考察波动的一种合理方式。这种方式与假设存在一种虚构的、不是由人的行为所造成的交通冲击是完全对立的。

作为对虚构冲击的回应，标准的辩护会引用米尔顿•弗里德曼（Milton Friedman，1953）来自于未知权威的方法论主张，即“理论越重要，其假设就越不切实际（p.14）”。近些年来，“所有模型都是假的”这一论断似乎已经被普遍用作一种理由来抛弃那些与流行模型不相符合的事实。

这些来自方法论的托辞，这些“无法令人信服的”对事实的抛弃，反映出模型对真理不置可否的关系，这种关系远远超越了后现代主义的讽刺，使得这些模型应该得到它们自己的标签。我给它们起名叫作“后真实模型（post-real models）”。

三、动态随机一般均衡模型（DSGE）对RBC核心模型的扩展

（一）更多虚构的冲击

一旦宏观经济学家认为采用一个虚构的冲击变量是合理的，他们就会使用更多这样的变量。由此，连同我建议名字一起形成了一个“大观园”：

一种一般型的“燃素”：能够增加由给定投入生产的消费品数量。

一种“投资专用”型“燃素”：能够增加由给定投入生产的资本品数量。

一种“巨魔”：能够随机改变支付给所有工人的工资。

一种“小鬼”：能够随机改变产出的价格水平。

“以太”：增加投资者的风险偏好。

“热质”：使人们想要减少闲暇。

（二）粘性价格

为了让货币政策有可能产生作用，DSGE的经验模型用粘性价格“妆扮”RBC模型。粘性价格使货币政策有可能影响产出，但是，拟合或校准的模型所得出的结果从来没有远离RBC的教条。也就是说，即使货币政策有作用，它的作用也非常小。

正如我将说明的，当模型中变量的数量增加时，模型识别问题将会更为糟糕。在实践中，这意味着计量经济学家在决定出现什么结果上具有更大的自由度。

识别问题的意思是：为了得到结果，计量经济学家必须要在方程组中加入除数据之外更多的东西。我把加入的东西称为“未知真相的事实（Facts with Unknown Truth Value，FWUTV）”，是为了强调以下这一点：虽然计量的估算过程把FWUTV假设为已知真相的事实，但是估算过程并没有反映出真相是什么。当前，DSGE经验模型的做法是通过“校准”一些参数的值加入一些FWUTV，或施加紧绷的贝叶斯先验分布。正如布兰查德（Blanchard，2016）所观察到的那样：“在很多情况下，紧绷的先验分布最多具有较弱的合理性，估算结果所反映的更多是研究者所施加的先验分布而不是似然函数。”

这个说法细想起来极为恐怖。对一个参数施加的先验分布可以对其他参数的结果产生决定性影响。这意味着，计量经济学家可以去搜寻一些先验分布施加给看似次要的参数上，以找到那些给经济学家所关心的参数带来预料结果的先验分布。

（三）一个例子

斯迈茨（Smets）和乌特斯（Wouters）的模型（以下简称SW模型）被誉为DSGE计量经济方法的一个突破性成果。斯迈茨和乌特斯把模型应用于包括沃尔克紧缩政策时期在内的一段美国历史时期的数据，得出了以下结论：

……货币政策冲击在所有情况下只对产出的预测变化中的一小部分产生影响。（p.599）

……货币政策冲击只对通货膨胀波动产生一小部分的影响。（p.599）

……[在对产出和通胀的相关性的解释中]：货币政策冲击不起作用的原因有两个，其中之一是货币政策冲击对通胀和产出变化只产生一小部分的影响。（p.601）

在这个模型中，重要的不是货币而是虚构的冲击力。下面就是两位作者关于这些冲击力的说法，我只是修改了斜体字的部分：

“需求”冲击，比如以太（亦称为风险溢价、外生支出）和投资专用型燃素（亦称为技术性冲击）在很大程度上解释了短期产出预测的变化，而巨魔（亦称为工资加成）或热素（亦称为劳动供给）以及产出专用型燃素（亦称为技术性冲击）在相对较小的程度上解释了中长期产出预测的变化……第三，通胀的变化大部分受小鬼（亦称为短期价格加成冲击）和巨魔（亦称为长期工资加成冲击）所驱使。（p.587）

在随后的一篇文章的评论中（Linde，Smets，Wouters 2016，脚注16），文章的作者强调了虚构的驱动力给后真实宏观经济学所带来的自由度（同上面一样，我只增加了斜体字部分）：

小鬼的价格加成和巨魔的工资加成在解释SW模型中的通胀和实际工资变动时的突出作用受到了查理、基欧和迈克格莱坦的研究（Chari，Kehoe & McGrattan，2009）的批评，他们认为这两个因素的解释力过大了。然而，加里、斯迈茨和乌特斯（Galí，Smets & Wouters，2011）的研究说明价格加成冲击的解释力大小可以通过允许热素（亦称为对家庭偏好冲击）的存在而大幅度减小。

四、识别问题

由于允许虚构冲击的存在而使模型含有更多变量的建模策略使得识别问题更加严重。这给决定怎样获得实证经验的结果提供了更大的自由度。

（一）最简单的供求模型中的识别问题

考虑任何有关识别问题的方式就是先把它放到一个有供给曲线和需求曲线的市场中去考虑。假设我们有图3中的数据，纵轴是工资的对数值w，横轴是劳动量的对数值l。为了预测一项政策变化的影响，经济学家们需要去了解劳动需求的弹性。在这里，识别问题的意思是：只根据这些分散的点无法计算劳动需求的弹性。

为了生成图中的数据点，我用一个带有随机冲击的对数线性需求曲线和对数线性供给曲线生成数据。然后，我尝试只用这些数据来估计其背后的曲线。我建立一个具有供求曲线和独立误差项的模型，然后用我的统计软件计算供求两条曲线的截距和斜率。结果，统计软件报错了。（软件工程师严肃地向我确认，这是在表示错误。）

接下来，我施加了“供给曲线是垂直的”这一限制条件，即在模型中加入了一个未知真相的事实（FWUTV）。（说的更明确一些，这个限制条件是真是假你们是不知道的，因为我并没有告诉你们我所知道的用于生成数据的曲线的真实情况。）有了这个FWUTV，统计软件得出了结果，如图3下半部分粗线（在线版是蓝线）所示。如果统计软件不报错，这个可接受的做法就好像一个人在说“这个模型被识别了”。

再下一步，我通过施加“供给曲线穿过原点”这一限制条件加入了另一个不同的FWUTV。模型再一次被识别，统计软件没有报错。这时得到的结果如图3下半部分细线（在线版是红线）所示。

你并不知道这两个FWUTV是否为真，但你知道至少其中有一个一定是假的，但估计结果并不能告诉你哪一个可能是假的。因此在没有任何额外信息的情况下，根据统计软件是否报错来进行识别所得出的需求弹性是毫无意义的。

（二）参数量放大问题

假设x是关于m个变量观测值的一个向量。我们将m个变量之间相互作用的线性联立方程模型写为：

矩阵S对角线上的数值为0，因此等式说明了x的每一项等于其他各项的一个线性组合，加上一个常数，再加上一个误差项。为简单起见，假设基于其他一些信息来源，我们知道残差εt在每一个时期都是独立产生的。同时假设x的任何一项都不是其他项的滞后值。这个等式有m⊃2;个参数要估计，因为矩阵S有m(m-1)个非对角线斜率参数，且常数c有m个元素。

这个系统中的误差项可能包括遗漏变量，这些遗漏变量会影响已经观测到的变量。因此，假设“x中不同变量所对应的误差项是不相关的”这一判断是没有一个先验基础的。（供求曲线误差项不相关的假设是另一个FWUTV，我把它混入了产生图3下半部分曲线的估算过程中。）这意味着，我们必须用对x的方差－协方差矩阵的样本估计所得出的所有信息，来计算描述ε的方差－协方差矩阵的参数。

因此，这个方程组需要从m个方程中计算m⊃2;个参数，这些方程让x的期望值等于从观测数据得出的x的平均值为：

SW模型一共有7个变量，就有7⊃2;=49个参数要估算，但只有7个等式，因此模型内需要加入42个FWUTV才能保证统计软件不报错。

（三）加入预期使得识别问题变得加倍糟糕

在卢卡斯和萨金特（Lucas & Sargent，1979）对传统凯恩斯主义模型的批判中，他们通过引入一套新的“跨方程限制条件”提出理性预期将有助于解决识别问题。

为了看看预期影响决策时会发生什么，假设预期工资对劳动供给有一个影响，且这个影响独立于现时的工资，因为人们是根据预期工资决定是否参加现时劳动市场的。为了体现这个影响，劳动供给等式中必须包含依赖预期工资的一项。

一般来说，我们可以在原来的线性系统中加入另一个m*m的参数矩阵B来体现μ(x)的影响：

这样的变化对匹配数据中的均值的m个方程式带来了一点变化：

从这些m个等式中，现在的挑战是计算多一倍的参数，也就是2m⊃2;个参数。在一个有7个变量的方程组中，这意味着有2*7⊃2;-7=91个变量需要通过时间序列x之外的信息来确定。

此外，如果参数没有变化或者误差分布没有变化，x的期望值将保持不变，即使x有再多的观测值，即使我们知道所有关于S中的斜率系数的知识，从中也不能解出常数项c。

所以，允许预期有可能影响行为会使识别问题变得至少双倍糟糕。这可能是西姆斯（Sims，1980）写下面的话时心里所想的事：“然而在我看来，理性预期对识别所具有的颠覆作用比起人们已经认识到的还要严重。”西姆斯写于1980年的文章在今天仍然重要，它也注意到我在前面部分提出的问题，也就是说参数的数量是模型中变量数量的平方；同时，西姆斯写于1980年的文章将从预期项中无法分离出常数项这一问题归因于索洛（Solow，1974）的研究。

五、对待识别问题上的倒退

后真实宏观经济学家并没有对卢卡斯和萨金特（Lucas and Sargent, 1979）所说的识别问题给予认真的关注。他们仍然依赖于FWUTV。他们目前所做的一切似乎是为了寻找加入FWUTV的新方式。

（一）自然实验

面对一个估计劳动需求弹性和供给弹性的挑战时，弗里德曼和施瓦茨（Friedman & Schwartz，1963）的方法是寻找两个相邻的时期。这两个时期条件非常相似，除了有这样一个变化，使之前的劳动供给曲线相对于之后发生了位移。为了找到这样的两个时期，他们会仔细审视历史证据，并在散点图中加入信息。

如果历史环境真的提供了这样一对时期，那么他们就会忽略所有其他数据点，仅基于这两个时期的一对数据点进行估计。如果卢卡斯和萨金特（Lucas & Sargent，1979）的观点——识别问题是宏观经济学的经验分析中最重要的问题——是正确的，那么抛弃那些数据就是有道理的。比起一个有着更小的标准误的无意义的估计来说，一个有着较大标准误的有意义的估计是更好的。

弗里德曼和施瓦茨的方法加入了一个其他人可以对其真伪进行评价的事实。这个方法允许对证据进行积少成多的科学分析。当然，允许这种科学分析意味着要让结果面向批评和修正。

当我读研究生时，我对弗里德曼和施瓦茨关于准备金增加的观点印象深刻——他们声称，准备金增加造成了1938-1939年严重的经济衰退。克里斯蒂娜•罗默和大卫•罗默（Christina Romer & David Romer，1989）挑战了这种对历史以及大萧条阶段其他几个时期的解读。他们认为最可靠的识别信息应来自于战后时期，尤其是沃尔克紧缩政策时期。目前我对美国货币政策对产出影响的估算更依赖于最直截了当的实验，即沃尔克紧缩政策时期。

（二）通过假设识别

随着凯恩斯主义宏观经济学模型建立者在他们的模型中增加变量的数量，他们就会碰到“从m个等式中估算m⊃2;个参数”的问题。这些经济学家们以给许多参数赋值的方式加入FWUTV来回应这个问题，主要做法就是将参数赋值为0。如卢卡斯和萨金特所注意到的，在很多情况下，不存在独立的证据可以检验这些FWUTV的真伪。但值得称赞的是，凯恩斯主义模型的建立者对于他们对模型的处理是公开透明的。

（三）通过数学推导识别

卢卡斯和萨金特（Lucas & Sargent，1979）似乎提出解决识别问题的一个关键就是，数学推导可以确定联立系统中的一些参数。但是解决识别问题意味着加入可检验其真伪的事实，然而数学并不能建立这样一个事实，而且从来不能，永远也不能。

在实践中，数学所做的就是让FWUTV远离对识别问题的讨论。凯恩斯主义者往往说：“假设P为真，那么这个模型就被识别了。”依赖于微观基础的作者会说：“假设A……假设B……等等，所以我们证明了P为真，那么这个模型就被识别了。”

为了在劳动市场的例子中用足够的“假设A……假设B……等等”说明这个过程是怎样进行的，想象一个代表性当事人从消费得到的正效用为

从劳动得到的负效用为

劳动负效用取决于由随机变量γ表示的“以太”水平的波动。

产出Y=πAL的生产技术就是劳动乘以流行水平的“燃素”π，再乘以一个常数A。社会计划者的问题就是：

为了导出劳动供求曲线，我们将上面的最大化问题分离成由工资W连接的两个分开的最大化问题：

接下来，对虚构的随机变量γ,π做一些分布假设。具体来说，假设他们是对数正态分布，即

在一些代数转换后，最大化问题的一阶条件就还原为下面这个方程组：

上式中，lD是LD的对数，lS是LS的对数，w是工资的对数。这个方程组有一个标准的、弹性不变的劳动需求曲线，以及一条截距为0的劳动供给曲线——这好像是通过一只看不见的手做到的。

有了足够的数学推导，作者就会有足够的自信认为大部分读者将永远找不到FWUTV隐藏在模型中哪一部分。一个论文评审人如果不知道FWUTV是什么或者羞于开口问，那就不能说识别中的假设是不可信的了。

在这个例子中，FWUTV就是的log(γ)中值为0。误差项的分布假设是隐藏FWUTV的好地方，因为很少会有人关注这个地方。而且，如果一个批评者确实看到这是识别假设，他又如何能进一步赢得关于“以太”的真正期望值的争论呢？如果作者可以编造一个虚构的变量，“我说这样就这样”似乎成为了回答任何有关虚构变量属性问题的相当有说服力的答案。

（四）通过模糊处理识别问题

我从不明白识别是怎样在当前的DSGE经验模型中实现的。在某种程度上，DSGE经验模型依赖于上面一部分提到的通过推导处理识别问题的类型。DSGE经验模型也依赖于校准——校准其实是通过假设识别的别称。但我从不知道FWUTV是否会隐藏于模型的其他地方。报告这些经验结果的论文并不讨论识别问题。例如，在斯迈茨和乌特斯（Smets & Wooters，2007）的文章中，并没有“识别”这个词出现。

为了重新做出那个模型的结果，我阅读了作者使用的统计软件Dynare的使用指南。在介绍贝叶斯方法的优点时，使用指南上写到：

第三，先验信息的加入也会帮助识别参数。（p.78）

这是一个启示。使用贝叶斯方法意味着你的统计软件永远不会报错。

回想起来，这一点应该很容易看到。为了生成图3中的细线，我使用了一个FWUTV作为限制条件，即供给曲线的截距为0。这就像给截距的分布加上了一个紧绷的先验条件。如果我把先验条件放宽一点，并用贝叶斯估计取代最大似然估计，我应该得到一个几乎相同的需求弹性值。

如果我这样做，贝叶斯估计过程将表明供给曲线截距的后验分布接近于我所加入的先验分布。因此用专业术语讲，我可以这样说“数据并没有给供给曲线截距的值提供信息。”但另一方面我可以说“需求曲线的斜率有一个不同于它的先验分布的后验分布。”通过省略，读者会推断是数据包含了关于需求弹性的信息，如同似然函数所做的那样，可事实上是在供给函数的截距上施加的先验条件将需求曲线的弹性固定下来并产生了一个紧绷的后验条件。通过改变我加进供给曲线的先验条件，我可以改变我得到的需求弹性的后验条件，直到得到我喜欢的那个弹性。

先验条件就是FWUTV的向量，这对我来说是一件新鲜事。但是，一旦理解了这件事并且开始认真阅读后，我意识到这在计量经济学家之间是一个公开的秘密。在本文引言部分中提到的那篇论文中，卡纳瓦和萨拉（Canova & Sala，2009）写道“不加批判地使用贝叶斯方法，包括使用并没有真正反映分布不确定性的先验分布，这会隐藏识别所存在的毛病。”奥纳茨基和威廉姆斯（Onatski & Williams，2010）表明，如果你将不同的先验条件加入早期的SW模型，你会得到不同的结构性估计结果。伊斯科里弗（Iskrev，2010）、科缪恩杰和恩格（Komunjer & Ng，2011）注意到，如果没有任何来自先验条件的信息，SW模型就是不可识别的。瑞克（Reicher，2015）赞同西姆斯在讨论哈坦纳卡（Hatanaka，1975）的结果时的观点。鲍梅斯特和哈密尔顿（Baumeister & Hamilton，2015）指出，在一个利用贝叶斯办法估计的供求市场的双变量自回归模型中，“即使有无限的样本数据，任何关于需求弹性的推断也只能来自于先验分布”是非常有可能的。

六、关于经济学家和物理学家的问题

从“当经济学家试图回答宏观经济学中的一些标准问题时会做什么”的元问题（meta-question）中，可以帮助我们分离出这些标准问题，比如美联储是否会增加实际联邦基金率。元问题的一个例子就是“为什么宏观经济学家开始用虚构的驱动力解释波动”。另一个例子就是“为什么他们似乎忘记了已经被发现的关于识别问题的事情”。

我发现一个更具有启示性的根本问题就是“为什么粒子物理学中的弦理论家们和后真实宏观经济学家们之间有如此惊人的相似之处”。为了说明他们的相似性，我将复制斯莫林（Smolin，2007）在其书的第16章所列出的弦理论家们的七个鲜明特点：

1.极大的自信；

2.一个异常牢固的群体；

3.对团体的认同感类似于对宗教信仰或政治平台的认同感；

4.本团体和团体外专家间强烈的界限感；

5.对不在本团体的专家们的想法、观点和工作的漠视和无视；

6.倾向于乐观地解释证据，倾向于相信夸大的或不完全的结果陈述，忽视理论可能是错误的可能性；

7.对一个研究项目应该涉及风险的程度缺乏认识。

斯莫林的观点中一个令人惊讶之处就是他拒绝弦理论家们提出的借口，即弦理论家们之所以不注意数据是因为没有可行的方法在弦理论所考虑的层次上收集关于能量的数据，斯莫林在其书第13章提出了一个令人信服的理由，认为对于大量未被解释的事实来说，如果理论家们想要解决，那就可以被解决。在物理学中和在宏观经济学中也一样，对事实的忽视应该被理解为是一种主观选择。

斯莫林的观点几乎完全与马里奥•邦奇（Mario Bunge，1984）提出的人类集体努力的分类法相一致。邦奇首先将“研究”领域和“信仰”领域区分开来。在研究领域，例如数学、科学和技术，追求真理是协调手段。而在信仰领域，如宗教和政治行动，则是权威协调团体成员的努力。

通过权威协调并非天生不好。有时候我们也别无选择。废奴运动就属于信仰领域，就是依赖于权威来做出决定，这些决定诸如运动的成员是否应当将受监禁的罪犯视为奴隶。一些权威人士必须做出决定，因为既没有一个合乎逻辑的论证，也没有任何事实能让运动的成员独立解决问题。

在邦奇的分类法中，伪科学是信仰领域的一个特殊类别，它声称自己是科学。由于信仰领域不同于研究领域由规范来维系，因此它很危险。因为规范通过社会互动传播，混入科学家队伍的伪科学家们可以破坏科学生存所需的规范。受人敬重的人在塑造一个领域的规范上异常重要，特别是能给这一领域带来新成员的教师这一角色。出于这个原因，一个对科学领域有效的防御办法就是让最受人尊崇的研究者恪守最高标准的科学品性。

七、忠诚可以腐蚀科学规范

这种不应该采纳的科学的失败模式是指，当有些人受自身利益驱动时，对科学的威胁就产生了。人们总是受自身利益的驱使的。如果科学要求它的参与者是无私的圣人，那它永远也不会存在。

就像市场一样，科学是一个使用竞争把个人私利导向集体利益的社会制度。问题是，在科学中的竞争就像市场竞争一样容易出现互相勾结。

卢卡斯、普利斯科特和萨金特推动了后真实宏观经济学的发展。1980年以前，他们对宏观经济学理论做出了重要的科学贡献。当这些贡献引起可能是讽刺的、蔑视的、过了头的批评时，他们就都“躲到了洞里”。结果，他们发展出了一种忠诚的纽带，这种忠诚在很多社会环境下都是令人钦佩而富有成效的。

下面两个例子说明了忠诚可以在科学中引入偏见。

防止失联，扫码关注《经济人读书会》

（一）例1：卢卡斯支持普利斯科特

在卢卡斯于2003年在美国经济学协会的主席演讲中，他强烈支持了普利斯科特关于“货币经济学是微不足道的”的观点。

这个态度与卢卡斯于1995年所做的诺贝尔获奖演讲很不一致，他在1995年的演讲中对认为“货币政策确实重要”以及这个观点给宏观经济理论带来挑战的原因做了一个细致的讨论。这个态度也与卢卡斯（Lucas，1994，p. 153）对鲍尔和曼昆（Ball & Mankiw，1994）的一篇论文的评论不一致。在那个评论中卢卡斯写道，科克莱恩（Cochrane，1994）提出了一个准确的观点，即“至少对战后的美国来说，关于货币不稳定性的真实效果的重要性及性质很少可以说是牢固确定下来的。”

科克莱恩指出，如果货币按照他的向量自回归模型所认为的那样具有系统性影响，那么，比起“评价使货币政策更加可预测可以如何进一步稳定产出”来说，研究诸如最后贷款人角色的货币政策以及存款保险这样的金融制度是更加重要的。根据科克莱恩（Cochrane，1994，p.331）的观点，如果上述评价得到的结果是货币政策的好处很小，那么“可能不是答案错了，而是我们问错了问题。”

然而，卢卡斯（Lucas，2003，p.11）考察了使货币政策更可预测的效应，并得出了潜在福利收益确实很小的结论，规模“大约是消费的万分之几。”

在卢卡斯对他2013年出版的论文集的介绍中写道：他2003年演讲的结论是在美国的战后时代，货币因素并不是“这一时期实际不稳定性的一个主要来源，也不是说货币因素并不重要，或者说货币因素从来也没有重要过。我赞同弗里德曼和施瓦茨对1929-1933大萧条时期的观点，而且这也是我现在看到的雷曼破产后2008-2009年经济衰退的方式。”（Lucas，2013，p. Xxiv，italics in the original）事实上，他退了一步并承认了科克莱恩的观点，也就是研究美联储作为最后贷款人的角色是更重要的。

卢卡斯（Lucas，2003）也冒险支持了普利斯科特（Prescott，1986）的估计结果：84%的产出变动是由于“燃素”或称技术冲击造成的，即使科克莱恩的同一结果显示这个估计的t值大约为1.2，所以标准误置信区间包含了从0％到100%的所有值。事实上，科克莱恩报告说，试图通过其他方法估计这一结果的经济学家们得到了从0%、0.002%、0.003%到Prescott估算的约80%的各种各样的估计值。

相对于他在演讲前后的文章，对于卢卡斯在2003年的演讲中对普利斯科特的强烈支持来说，我所能看到的唯一解释就是他在尽他自己最大的努力支持他的朋友普利斯科特。

（二）例2：萨金特支持卢卡斯

超越科学要求之外的第二个例子就是萨金特为卢卡斯（Lucas，1980）关于货币数量论的一篇文章提供的辩护。在1980年的文章中，卢卡斯估计了名义货币的需求，并且发现它与价格水平成正比，与货币数量论的预测一致。他发现了一种过滤数据的方法，用他所关注一个历史时期的美国经济数据（1953-1977）来得到货币数量论的结果，并且似乎暗示这样的结论：任何施加到他的过滤方法中的识别假设都必须是正确的，因为用这些假设得出的结论支持了货币数量论。怀特曼（Whiteman，1984）说明了如何明确找出卢卡斯的过滤方法所对应的那些识别假设。

萨金特和苏瑞可（Sargent & Surico，2011）重新审视了卢卡斯的方法，并且表明当这个方法被应用到Volcker紧缩政策时期后的数据上时，这一方法产生了完全不同的结果。他们表明变化可能产生于货币供给过程的变化。

在论述这个论点的过程中，他们用最有利的方式描述卢卡斯在1980年的文章。卢卡斯写道，他的研究结果对“在何种程度上用纯古典的、货币的驱动力来理解评估战后的通胀和利率的程度”（Lucas，1980，p.1005）是有意义的。萨金特和苏瑞可对这句话做了不太合理的解释，他们说“卢卡斯的目的……正是为了说明他的结果依赖于1953-1977年这一时期的货币供给过程。”（p.110）

他们还误读了卢卡斯关于货币数量论可能会不成立的条件所做的评论。从上下文可以清晰地看出卢卡斯的意思是指，对于他的过滤方法所去除的高频变动来说，货币数量论将不再成立。这并不是如萨金特和苏瑞可所认为的那样是一个警告，即如果美联储采用一个不同的货币供给规则，过滤方法将产生不同的结果。

对萨金特和苏瑞可的结果最简单的描述就是，只有在关于货币供给的严格限制假设下，使用卢卡斯的估计量，货币需求中价格水平的指数就是可识别的（即得到了真实参数的一致估计量）。萨金特和苏瑞可并没有通过这个方式描述他们的结果。事实上，他们从没有提过识别问题，即使他们估计自己的结构性DSGE模型，因而他们可以进行政策实验并询问“如果货币供给规则改变会发生什么”这一问题。他们表示，他们依赖于贝叶斯估算方法，并且像往常一样，一些参数具有紧绷的先验条件，这些先验条件产生了非常相似的后验条件。

倘若是一个传统的凯恩斯主义者在1980年写了一篇文章，提供了一个估计出的货币需求曲线，这个曲线作为方程可以被加入一个1970年老式的多方程凯恩斯主义模型中，我估计萨金特会对这样一篇文章做出更清晰的回应。尤其是，我怀疑在这种情况中，他就不会在脚注2中对某个人（可能是一个论文评审人）提出的识别问题做这样一个含糊的回应了：

此外，就像我们正在使用模型一样，DSGE模型就是被设计成使用跨方程限制的模型，这些跨方程限制源自卢卡斯（Lucas，1972）和萨金特（Sargent, 1971）所提倡的理性预期模型的方式，以解释包含通胀的回归将如何依赖于货币和财政政策规则。我们认为，我们正在以模型设计者所想要的一种方式使用我们的结构模型（p.110）。

当卢卡斯和萨金特（Lucas & Sargent，1979，p.52）写道“任何人如果声称具有给出定量经济政策建议的能力，那么就必须解决时间序列的结构模型中的识别问题”时，他们使用“任何人”这个词意味着，没有人可以得到拒绝回答识别问题的通行证。没有人会说“我们知道我们在做什么。”

八、回到原点

我同意卢卡斯和萨金特（Lucas & Sargent，1979）的严厉批评，即以前大型凯恩斯主义宏观模型依赖于并不可信的识别假设。现在的情况更严重。宏观模型使假设更不可信、更不透明。

我也同意卢卡斯和萨金特对那些凯恩斯主义模型的预测做出的严厉批评，比如说通胀率的增加将引起失业率的下降的预测。而卢卡斯（Lucas，2003）提出了一个事实论断，其错误更严重：

我此次讲座的论点是，宏观经济学在这个原始意义上已经成功了，即它预防衰退的核心问题已经解决了，所有实践中的目标都已经解决了，而且事实上已经解决很多年了。（p.1）

使用全球产量损失作为一个度量标准，2008-2009年金融危机表明，比起凯恩斯模型有错的预测，卢卡斯的预测是更严重的失败。

所以，卢卡斯和萨金特对凯恩斯主义宏观模型的以下判断同样适用于后真实宏观模型，适用于生成后真实模型的程序：

这些预测非常不正确，并且以前它们基于的原则从根本上说是缺陷的，这些现在是明摆着的事实……

……处在经济周期中的当代学生面临的任务是整理残骸……（Lucas &Sargent，1979，p.49）

九、我的元模型（meta-model）

在关于宏观经济学状况的各种评论中，我关于宏观经济学倒退成为伪科学的悲观评价处于十分极端的位置。大多数评论承认宏观经济学存在改进的空间，也赞同稳步的推进，这个进步起码是用看重更复杂的工具的后真实模型的标准来衡量的。元问题很自然要问的一个问题就是为什么很少有人说我所说的这些话，以及我所做的评论是否是一个应该被拒绝的异类。

要用模型来解释我为什么做出不同选择，那就应该追溯到不同的偏好、不同的价格或不同的信息上。其他人也看到相同的文章并且已经参与相同的讨论中，所以我们可以消除信息不对称。

在初步的分析中，假设所有经济学家有相同的偏好似乎是合理的。我们都从做好我们工作的专业精神中得到满足。做好工作意味着当有人做了一个似乎是错误论断的时候应当公开反对。

当做出错误论断的人是一个受人尊敬的、具有斯莫林列举的特点的团体领导者时，存在一个与公开反对相关的代价。这个代价对我来说是比较低的，因为我不再是一个学术研究者。我是一个实践者，这意味着我想让有用的知识起作用。我不在乎我是否再次在重要经济学期刊上发表文章或赢得任何专业荣誉，这些对实现我的目标没有太大的帮助。于是，在具有斯莫林提出的特点的团队中，成员所面临的威胁对我来说并不适用。

一些在私下谈话中同意关于宏观经济学现状描述的经济学家们在公开场合下并不会这么说。这也符合基于不同代价的解释。他们中的一些人也劝阻我不要公开反对，这种劝说需要其他一些解释。

如果他们不得不亲眼看到批评一个受人尊敬的领导者所引起的不愉快的反应，他们可能觉得这对他们来说也是一种代价。毫无疑问不愉快反应的情绪是激烈的。在我批评了卢卡斯的一篇文章后，我有机会遇到了一个非常生气以致于一开始气得说不出话的人。最终，他对我说，“你这是在谋杀Bob。”

但我的感觉是，问题比逃避更严重。一些我认识的经济学家们似乎已经开始吸收后真实宏观经济学家们积极推进的规范，即公开批评一个权威人士对任何人来说是一个严重违反品行准则的行为，而无论事实是真是假、预测是对是错，还是模型是没有意义的都不足为虑。

一个不能批评的权威机构所设置的规范有助于人们作为一个追求政治、道德、宗教目的信仰领域的成员而互相合作。就像乔纳森•海特（Jonathan Haidt，2012）观察到的，这种类型的规范具有存在价值，因为当一个群体的成员受到另一个群体攻击时，这个规范帮助成员们发起协同防御。这个规范由两个内在的道德观念支持，一个道德观念鼓励我们服从权威，而另一个则迫使人们自我牺牲以捍卫神圣的纯洁。

科学，以及其他所有的研究领域都由启蒙运动催生，因这些内在的道德观念上的“一切从零开始”而存活下来。成员们培养的是一切都不是神圣的和权威应该永远受到挑战的信念。在这个意义上，比起笛卡尔或牛顿，伏尔泰对启蒙运动的研究领域的知识奠基更加重要。

拒绝对权威的任何依赖，一个研究领域的成员只通过保持对真理矢志不渝的追求来协调成员各自独立的研究成果。通过来自对大量公开披露的事实和逻辑的独立评价形成的基本共识，这种对真理的追求才能逐步建立起来。这些事实和逻辑的评价来自于崇尚开诚布公表达异议的人，来自于接受自己错误的人，以及抓住机会推翻权威的错误论断的人。

即使科学运作良好，它也不是完美的。涉及到人的事物都不是完美的。科学家们致力于追求真理，即使他们知道绝对真理永远不会被揭示。他们所希望的是确立判断一个论断是不是真理的共识，这种共识的宽松程度如同在股票市场上确立一个公司的价值。这个共识可能会误入歧途，也许偏差还会持续很长一段时间。但最终，它会被自由挑战共识的反叛者和仍然认为正确的事实很重要这一共识的支持者拉回到真实中来。

尽管存在明显缺陷，科学已经相当擅长于生产有用的知识了。科学也是协调很多人的信仰的一种好方式，也是不使用强制在亿万人中间建立共识的唯一方式。

十、经济学今后的困境

一些经济学家表明后真实宏观经济学是一潭死水，完全可以忽略它，并以此来反击我的担忧；毕竟，“有多少经济学家真的相信极其紧缩的货币政策对实际产出没有影响呢？”

对于我来说，这揭示了一个令人不安的盲点。问题并不是宏观经济学所说的与事实不符。真正的问题是其他经济学家并不在意宏观经济学家不关心事实本身。比起坚定地维护错误，冷漠的容忍一个明显的错误对科学更具有腐蚀性。

可悲的是，在早期职业生涯做出重要科学贡献的经济学家们走上了一条远离科学的道路。当这些经济学家们是我所认识的和我所喜欢的人的时候，当那么多其他我所认识的人将这些领导者当做偶像崇拜的时候，我这么说是很痛苦的。

但科学和启蒙运动的精神是人类最重要的成就。他们比我们任何人的感情都重要的多。

你可能不会和我分担我对科学的追求，但是问问你自己：你想要你的孩子被更忠于朋友而不是医学的医生诊治吗？如果不想，你为什么会期待那些想要答案的人们在知道我们更忠于朋友而不是事实后还会继续关注经济学家们呢？

很多人似乎很欣赏福斯特（E. M. Forster）的论断：对于他来说，他的朋友比他的国家更重要。对于我来说，如果他这样写，“如果我必须在背叛科学和背叛朋友间做出一个选择，我希望我有勇气背叛我的朋友”，我将更钦佩他。

作者徐瑾，文章来自微信公众号“徐瑾经济人”（econhomo）

话题：