《城市群视角下的产业共聚与产业空间治理:机器学习算法的测度》评阅书及修改说明

更新时间:2023-06-19 19:23:39 阅读: 评论:0

鹿鞭的功效
《城市群视角下的产业共聚与产业空间治理:机器学习算法的测度》评阅书及
作者修改说明
发表信息
陈露,刘修岩,叶信岳,胡汉辉.城市群视角下的产业共聚与产业空间治理:机器学习算法的测度[J].中国工业经济,2020(05):99-117.
外审意见1及作者修改说明
奶茶大全
本文考察城市群的共聚水平,虽已有较多学者使用其他指数进行探讨,但本文的可取之处是借鉴最新的Billings and Johnson(2016)具有矢量特征的基于机器学习Wasrstein距离算法的共聚指标,对于国内研究产业集聚的补充具有一定的意义。但目前本文在方法的使用上尚未明确体现出用该方法的必要性和特殊性,需要进一步的完善和补充。提供以下问题供编辑部和作者参考:
(1)本文的方法如果可以处理MAUP问题的话,可能并不适合用于人为划定城市群之后,再进行城市群之间进行比较,因为这样可能会人为创造行政边界问题,即各个城市群之间的边界。论文首先将各个城市群作为独立的一个整体,然后再将各个独立的整体进行比较,可能已经人为划定了行政边界,仅处理了各个城市群内部的边界问题。
回复:第一个问题涉及空间尺度的选取与基于行政区划处理产业共聚测度的合理性问题。首先感谢审稿专家提出的这一问题,对此我们作出如下回答:MAUP问题为可更改地理单元问题,与这一问题会相关的是该问题相伴而来的可加总问题。这一问题的提出主要针对基于区位选择模型理论度量的EG指数(Ellison和Glaer,1997)。EG指数的测度存在的主要问题是,具体地理单元的产业集聚或者共聚的测度是相对于全国来说的,譬如,江苏省的某一产业的集聚与共聚与否是相对于全国来说的,并且最终所有省份的结果加总为1。这种受到行政单位划分影响带来的可加总的问题被广泛诟病。针对这一问题,Duranton和Overman (2005)在基于微观地理信息、距离高斯线性核密度函数与反事实构建样本的基础上构建了产业集聚DO指数,而这一指数没有相对这一概念,只是在一个选定空间尺度上判断某产业集聚或共聚与否。本文提出的指数特征与DO指数是一致的,也没有相对概念,因而本文的产业共聚指数的测度方法是不受空间尺度约束的,即在任意空间尺度与空间划定下均可以进行测度,即符合Delgado et al.(2016)提出的“对任意空间分类变化的无偏性特征”。注册表清理软件
我们需要讨论的是究竟在哪一空间尺度下进行测度是较为合适的问题。Duranton和Overman (2005,2008)的DO指数测度数据和产业共聚指数的测度数据均来自于英国,其使用Kernel 密度函数而产生的距离分布的中位数为180公里。关于产业共聚的测度目前国内学者只使用EG指数进行测度,尚未见到运用DO指数或者本文使用的指数进行产业共聚测度的研究。近些年来,国内学者对基于DO指数的产业集聚测度是随着地理信息系统的不断发展而逐渐开始应用,较为典型的是何玉梅等(2
012)、袁海红(2014)、陈柯等(2018)、邵朝对等(2018)的研究,这些研究均是基于企业的微观地理信息而进行的一定区域范围内单个产业DO指数的测度。这其中,大部分是基于全国空间尺度下进行的测度(何玉梅等,2012;陈柯,2018;邵朝对等,2018),其距离分布的中位数分别为2000公里、3000公里与1100公里,很明显,如此大的空间尺度下,产业集聚指数可能会捕获产业集群之间的距离。也有基于单个城市(北京)空间尺度下进行的测度(袁海红,2014),其距离分布中位数为35公里,实际上在这城市行政空间尺度下的克服MAUP问题并没有意义。需要指出的是这些空间尺度的选择都是机械照搬DO指数的结果,并不能体现这一指数的本意。英国有其独特的地理特征:一是四面环海且国土面积不大,二是地理与城市分布均匀。显然,这两点对于中国这么广袤且复杂
的地理环境的国家来说并不符合。综上并结合中国的实际,本文选择城市群这一空间尺度下进行产业空间分布的测度,主要理由如下:一是新时代下产业空间新形态正在不断突破传统行政边界,逐步形成以核心城市为枢纽、多城市产业协同发展的产业空间新格局,因而基于城市群尺度的产业共聚测度具有一定的现实意义;二是城市群可以模拟出“四面环海”的相对隔绝的地理空间特征,在城市群之间的非城市群城市可以作为产业分布的缓冲区域,克服MAUP问题的同时使得研究产业共聚具有实际经济意义;三是同一城市群的地理特征与城市分布相对均质,土地面积适中,不存在较大的差异。因而城市群是一个较为合适的空间尺度。
(2)将各个独立整体的城市群分开进行测算后再进行横向比较是否具有可比性?正如论文方法所介
绍,反事实比较需要基于整体内部的信息随机生成模拟产业区位集,作者在各自具有不同区位分布信息特征的城市群进行相应的反事实判断可能存在相应的问题。如果要使各个城市群之间的比较有意义,审稿人以为,各个城市群比较的随机生成模拟产业区位集需要是一样,即基准的尺子需要保持一致,对此论文是如何处理的。
回复:第二个问题是关于基于蒙特卡洛模拟的反事实检验的样本选定标准问题。首先感谢审稿专家提出的这一问题,我们的回答是本文的产业共聚指数的在各个城市群之间是可比的。
对此解释如下:本文的反事实样本的选取标准为:“产业区位集~k必须满足两个条件,第一
个条件是产业~k的企业数量与产业k的数量应当相同;第二个条件是选取随机产业区位集策
略是从空间上所有已知的企业所在点的集合中进行抽取”。如果是DO指数的测度思想,各个城市群必须基于相同的距离尺度进行对比,这是因为该指数基于距离的核密度分布,通过反事实样本构建全局与局部距离置信区间带,因而各个行政区域规模的大小会导致各个城市群产业集聚结果存在比较偏差。但是,本文的产业共聚指数是并不是基于距离测度的,构建反事实样本的目的是为了验证该指数的原假设H0:在基于产业j空间分布既定的情况下,产业j和产业k之间不存在空间分布相似性。因此各个城市群下通过反事实样本回答这样一个问题:产业j和产业k在该空间尺度下分布相似可能性有多少,该可能性与城市群的特征并无关联,是一个与企业距离和城市群规模无关的无量纲数,因此该指
活闹鬼数在城市群间可以直接对比。
(3)目前论文还未体现出该最新方法的矢量独特性,运用该方法探讨共聚的必要性,应该发更大篇幅对其独特性及其呈现出来的事实特征进行分析和解读。同时,在与其他共聚指标具有可比的维度上进行必要的测度比较。上述内容应该作为论文的重点分析。
回复:第三个问题是关于产业共聚指数的矢量性运用问题。我们作出如下回复:
第一,关于体现该方法的矢量独特性,本文在文章中第四部分进行了一定篇幅的阐述。一是对产业共聚的总体水平分析中,针对产业间双向共聚、单向共聚的数量、比例都进行了分析;二是城市群共聚水平的差异分析中,对不同城市群的双向共聚特征进行了重点讨论;三是城市群产业结构差异分析方面就完全基于产业共聚的方向性进行区域支柱产业的分析,本文还使用这一特性对长三角产业集群的结构进行了描绘。为了突出本文对该方法矢量特性的使用,本文修改了文章中这一方面的阐述方式。
第二,针对运用该方法探讨共聚的必要性,对此本文解释如下:产业共聚与产业集聚有本质
差别,产业空间共聚强调跨产业空间分布的依赖、联结与互动关系,而产业空间集聚侧重产业总体或者单个产业的空间分布形态。产业共聚能够更好的描绘出某一区域内的相近或相关联产业的空间结构关系。产业共聚与产业集聚的重要的差别是产业共聚具有方向性,产业共聚可以与生态学中的群落的
相互关系进行类比,生态学家指出,两个群落的关系如果是为了某种正向的关系而彼此依赖被称为群落间的正相互关系,在群落的正相互关系中有偏利共生(Commensalism)、原始共生(Protocooperation)和互惠共生(Mutualism)的区别,偏利共生指两个群落接触时一方有利,一方无影响,分开时一方有害,一方无影响;原始共生是指接触时彼此有利,分开时彼此无影响;互惠共生是指接触时彼此有利,分开时对彼此都有害(Odum,2004)。这种群落之间共生的方向性在总结产业群体行为特征时也有一定的适用性,这体现在跨产业企业群体的彼此接近都是为了获取某些正向利益,例如马歇尔外部性或者雅各布外部性,而这种产业群体的靠近是存在明显的方向性的,这一特征在企业选址过程中得到充分的体现,举例来说,A行业中企业的地址选择会考虑特定的B行业中企业的位置,但是B行业的企业在选址时是否会考虑A行业内企业位置是不确定的。在传统的产业共聚研究中,通过上述的EG或者DO指数进行的产业共聚测度都认为两个产业是共同集聚的(陈国亮和陈建军,2012),或者说是所谓协同集聚的(陈曦等,2018),这显然不太符合产业共聚存在单向共聚的实际情况。
为了更直观的表现产业集聚与产业共聚的差别,我们利用图像进行进一步说明,如图所示,本文通过随机模拟举出四种特殊的例子,图(a)中的两个产业在空间上均为分散,且两者间不存在依赖关系;图(b)中两个产业虽然也为分散,但是每一个蓝色产业点的附近均有红色产业点,反之亦然,因此我们可以认为虽然两个产业都分散,但是两个产业互为相互依赖,可以直观粗略的发现两者之间
存在空间相互依赖关系;图(c)中两个产业从单个产业来说都为集聚,但是在两个产业间的空间分布毫无关联;图(d)中两个产业均为集聚,但是红色产业点更依赖蓝色产业点,反之则不是,因此可以看出这种依赖的方向性特征。这种两个产业间的依赖关系通过EG指数和DO指数都是无法测度的。我们十分认同审稿人提出的与其他如DO指数、EG指数等测度指标间进行比较研究的必要性,但一方面是通过DO 指数进行21个城市群的测度工作量十分浩大,且由于篇幅所限,本文并没有针对其他指标的测度比较进行研究,后续可以另文讨论。
(a)(b)橱窗设计说明
(c)(d)
(4)现象解释上。在各个城市群产业共聚水平差异上,关于经济发展的关系与理论和现实并不太一致,可能需要进一步解读;
回复:第四个问题是关于产业共聚指数的矢量性运用问题。首先感谢审稿专家提出的这一问题和建议。我们也认同专家提出的意见,另外一位审稿专家也提出的“东部沿海城市群尤其是长三角和珠三角城市群的产业共聚指数相对较低,可能和上述地区企业竞争相对激烈有关”的建议。我们对原文进行了修改,在实证部分加入了行业竞争效应的考察,结果发现行业竞争程度从两个方向均对产业共聚产生抑制,支持了经济发达地区产业共聚偏低可能是由于行业竞争导致的假设。当然,这一现象背后可能包含着区域规模经济集聚力与竞争效应分散力多重作用的结果,类似于一些学者发现的中国产业集聚在2004年前后呈现“先集聚后分散”的特征(文东伟和冼国明,2014),产业共聚可能也存在着“先共聚后分散”的周期特征。
(5)数据上。2013年工企是2000万以上较大规模企业,代表性较弱;
回复:第五个问题是关于数据使用的问题。我们对此表示认同。工业企业数据的数据可得性使得本文只能局限于研究这些样本,我们使用2007年的数据进行测度并与2013年的结果进行比对,对比结果来看,两年的共聚水平结果基本一致且稳定。
(6)第五部分进行影响因素分析的必要性并不充足,因为作者指标的突出特征在于共聚的矢量性,但构造的各个影响因素与现有文献一致并没有明显的矢量特征,目前数据还较难构造与本文指标相匹配的影响因素,建议剔除。作者可以选取时间跨度较长的两年进行事实特征比较,集中篇幅回答本文指标显现出来的矢量特征,看能不能有较为新颖的发现,也能够丰富论文的分析层次。
回复:第六个问题关于实证的必要性以及对动态结果的展示问题。对此,我们对实证部分进行了重大修改,一是通过2012年139部门投入产出表得到了具备方向性的投入产出指标,全面验证了马歇尔外部性;二是加入行业竞争指标;三是使用滞后三期的数据消除数据的内生性问题。同时,本文测度了2007年的产业共聚结果进行时间演变的分析,一方面测算的时间将近一个多月,另一方面两年共有100万个结果的规律总结的难度较大,本文只是在原文基础上做了一些比较粗略的定性比较分析,文章重点侧重于对这一指数的应用介绍上。我们认为通过实证的定量分析可以有效弥补定性分析的不足,互为补充。本文也在未来的研究展望中提出了进一步发掘产业共聚指数方向性特征的问题,在本文中由于篇幅与时间所限,只进行了这些内容的讨论。
打架子鼓(7)关于反事实检验的样本选定标准问题。作者回答了本文选择的反事实的标准是“产业区位集必须满足两个条件,第一个条件是产业的企业数量与产业k的数量应当相同;第二个条件是选取随机产业区位集策略是从空间上所有已知的企业所在点的集合中进行抽取”。但审稿人更关心的是,作者测度了21个城市群,是不是基于这21个城市群内部各自的反事实进行模拟的?。比如长三角的反事实模拟是基于长三角已知所有企业的空间分布集合,珠三角的反事实模拟是基于珠三角所有已知企业的空间分布集合,因为“第二个条件是选取随机产业区位集策略是从空间上所有已知的企业所在点的集合中进行抽取”,长三角和珠三角两个所有已知的企业所在点的集合特征应该是不同,那如何可比?作者需要详细厘清比较的过程?
宝宝百日宴回复:由于上次的回复中都没有全面对这一问题进行详细解释,给审稿人带来了困惑,我们深表歉意,在此我们对这一问题进行进一步解释和说明,希望能为您释疑。
1. 从计算原理角度对指数可比性的解释
我们认同您的观点:不同城市群由于地理与人文社会环境的差异,产业空间分布会有所差异。但这对本文测度的共聚指数的可比性影响不是很大。这是因为本文的产业共聚指数Coagg 是回答了一个假设检验问题——原假设H0:在基于产业j空间分布既定的情况下,产业j 和产业k之间不存在空间分布相似性。
吾尝跂而望矣为了验证这个假设是否成立,我们通过蒙特卡洛模拟进行验证,观察1000次模拟中发生原假设的频率,譬如1000次模拟中发生原假设的次数是50次,则我们可以说在95%的置信度下拒绝原假设,接受备择假设H1:在基于产业j空间分布既定的情况下,产业j和产业k 之间存在显著的空间分布相似性。而此时我们定义共聚指数Coagg(j,k)为0.95,这是蒙特卡洛模拟时违背原假设的发生频率,这样的定义决定该指数是一个连续函数,我们通过这个频率发生的高低来近似代表两个产业间方向性共聚发生的可能概率。
本文反事实样本的第二个条件所说的反事实样本就是当前所测度空间上的全体样本,就是您所理解的21个城市群各自基于各自的总体样本。例如长三角城市群2013年一共有约10万家企业,这10万家企
业就是在计算长三角共聚指数时的反事实样本全集。本文在介绍方法时采取了一般性的数学论述,在整个方法介绍过程中复平面是统一的。
关于蒙特卡洛模拟次数的问题,理论上模拟的次数越多,这个数值会越精确,但是次数达到一定的数量后,结果就会趋于稳定。根据数学学科前人研究的经验,1000次是一个较为恰当的模拟次数。虽然各个城市群的总体样本规模存在一定差异,应当采取各自的模拟次数,但是本文为了统一标准,所有城市群均采用1000次的模拟方式,1000次模拟对于样本量最多的长三角来说都是适用的,因此对于其它城市群来说结果只会更稳定。
我们举一个通俗的例子来解释计算原理:假设我们通过长相的相似性来判断小王是不是小王的父亲亲生的?我们要回答这个问题也可以通过本文的方法来计算,首先我们计算小王与小王的父亲的面部相似距离(可以通过Wasrstein距离实现),然后我们假设随机找来的路人应该与小王没有血缘关系因而面部特征应当差别更大,进行1000次蒙特卡洛模拟抽样后,如果950个人都比小王的父亲与小王的面部差别更大,那么我们可以说在95%的置信度下,小王是小王的父亲亲生的,我们定义父子俩有血缘关系的可能性近似是0.95。问题是,这1000个随机的路人应当如何抽取?为了保证结果的科学性,我们要控制这些路人与小王父

本文发布于:2023-06-19 19:23:39,感谢您对本站的认可!

本文链接:https://www.wtabcd.cn/fanwen/fan/89/1045898.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:产业   共聚   进行   空间
相关文章
留言与评论(共有 0 条评论)
   
验证码:
推荐文章
排行榜
Copyright ©2019-2022 Comsenz Inc.Powered by © 专利检索| 网站地图