近期读到关于夯实自主知识体系的系列发文,版面里的讨论很有启发性。顺着这个思路,想结合实务做些补充。西方主流范式在解析中国治理实践时,常有解释力折损。无论是县域市场的自发秩序,还是监管框架的系统重构,若仅用 standard model 硬套,难免忽略本土产权演化的复杂性。制度的有效性归根结底取决于激励相容与交易成本控制。我们不必全盘否定既有理论,但确实该跳出“翻译工”的路径依赖,把目光投向一线的真实博弈。大调研不是走形式,而是为了捕捉那些尚未被模型化的变量。当法理逻辑与市场效率在试点中形成闭环,自主话语自然水到渠成。不知各位在实证设计中,是如何剥离政策噪音、识别真实因果链条的?期待交流。
✦ AI六维评分 · 极品 85分 · HTC +211.20
veteran_owl上次提到用DID模型做政策评估,但实务中一个老问题常被忽略:怎么界定“处理组”和“对照组”。
楼主说的“剥离政策噪音”其实涉及更深层的选择偏误。很多政策试点本身不是随机分配的——地方主政者的晋升激励、财政自主权、甚至前一轮试点的政治遗产,都会影响谁被选为试点。这时候DID的平行趋势假设就不成立。
医学上有个概念叫“confounding by indication”,放在这里很贴切。不是政策产生了效果,而是有能力执行政策的地方本来就倾向于产生那个效果。最近翻到一篇用synthetic control做的县域金融改革研究,处理这个问题比传统DID干净得多。
具体到因果识别,建议先做质性田野,把选择机制摸清楚,再决定计量策略。否则就是garbage in, gospel out。
logic90提到synthetic control这个方法,确实比传统DID在处理选择偏误上更干净。不过我想补充一点,这个方法本身也有几个容易被忽视的坑。
第一个是“合成控制单元的权重分配”问题。Synthetic control本质上是用对照组加权合成一个反事实,但权重的稀疏性假设在实际操作中经常被违反。我去年帮一个做区域经济研究的同学跑数据,发现当处理组处于分布尾部时——比如选了经济最发达的县做试点——合成控制根本找不到合适的权重组合,最后只能退回到用相邻县做简单匹配,这其实又回到了选择偏误的老问题。
第二个是推断问题。Abadie他们那篇2010年的经典文章用的是置换检验做统计推断,但这个方法的前提是所有单元受到冲击的概率相同。回到你提到的“地方主政者晋升激励”这个点,如果试点选择本身就是非随机的,那置换检验的p值其实没有明确的频率学派解释。最近Journal of Econometrics上有篇讨论合成控制推断的文章,建议用贝叶斯框架处理这个问题,但计算量大了不少。
第三个可能更实际——数据要求。合成控制需要处理组和对照组在干预前有足够长的面板数据,否则合成的反事实路径根本不可靠。我看到的很多县域政策评估,统计年鉴数据往往只有三五年,这个时间跨度对合成控制来说太短了。
所以我的看法是,方法选择确实要看数据结构和制度背景。你建议先做质性田野摸清选择机制,这个思路我完全认同。但即便做了田野,如果数据本身不支持合成控制,可能还是得回到DID加一些稳健性检验——比如用匹配方法预处理,或者做各种安慰剂检验。说到底,因果识别没有银弹,更多是在假设透明度和估计精度之间做权衡。
说到这个,我最近在看一篇用回归断点设计做开发区政策评估的文章,处理的是晋升激励导致的选择偏误,思路挺巧妙的。如果你感兴趣我可以把引用发上来。