多值无序分类变量与连续变量的相关性检验问题.docx

上传人:p** 文档编号:115271 上传时间:2022-12-30 格式:DOCX 页数:3 大小:47.25KB
下载 相关 举报
多值无序分类变量与连续变量的相关性检验问题.docx_第1页
第1页 / 共3页
多值无序分类变量与连续变量的相关性检验问题.docx_第2页
第2页 / 共3页
多值无序分类变量与连续变量的相关性检验问题.docx_第3页
第3页 / 共3页
亲,该文档总共3页,全部预览完了,如果喜欢就下载吧!
资源描述

《多值无序分类变量与连续变量的相关性检验问题.docx》由会员分享,可在线阅读,更多相关《多值无序分类变量与连续变量的相关性检验问题.docx(3页珍藏版)》请在第壹文秘上搜索。

1、互助问答第26期:多值无序分类变量与连续变量的相关性检验问题问题:因变量是多值无序分类(2以上,不是0,1那种)数据,自变量是一个连续变量。我要想看是否显著相关应该用什么检验?答案:(1)如果只是想看相关性的话,可以不必区分因变量和自变量,用多值无序分类数据作为因子,连续变量作为OUtCome,用F检验(ANoVA)就可以了。如果F检验显著,则说明组间(0,1,2-)具有显著性差异,然后用组内相关性测算相关强度。这种方法可以通过Stata的anova命令来实现。(2)检验相关性也可以采用非参数检验的办法。(3)当然你也可以使用回归的方法来检验相关性。第一种回归:直接做连续变量对多值无序分类数据

2、影响的回归,观察两个变量的显著性就可以了,因为两个变量的两个变量的相关性等价于直接单元回归。所使用的Stata命令为regy0第二种回归:首先把多值无序分类数据作为自变量,设置一组虚拟变量建模;然后把连续变量当因变量,联合检验所有的系数都等于0就可以了。所使用的Stata命令为regyxlx2x(n-l)0第三种回归:采用多值无序logit/probit回归,控制其他变量,以多值无序分类数据为因变量,以连续变量为自变量,观察其估计系数的显著性。可以通过Stata的mlogit命令来实现。学术指导:张晓崛老师本期解答人:中关村大街编辑:冷萱杨芳Hollian统筹:芋头易仰楠技术:知我者互助问答第

3、27期:面板数据的Stata设置问题问题L我的论文主题是FTA对东道国吸引外资的影响研究(FDl用的是两国之间的流量),因此,我的数据是三维的,也就是年份+东道国+母国(详细数据见图片-回归数据)。现在我想使用双固定效应模型(同时固定时间和个体),于是我就将(东道国+母国)进行编码,把其看成一个个国家组合,并且引入新的标量id,同时对其赋值(1、2、3.、)。问题:在我进行回归时,使用Xtsetidyear时出现乱码,请问老师该怎么解决呢?T.21O*072005同不艮H丑I2006HTSttI 20S RTRHJL I 2008阿尔及利亚!2010 RJFRMiE I2012 RrRWffi

4、 I2013 HTSRIL I 20M阿不&汹丑!2015 RTM 12016 WR J2004 MTKtt 02005 WTRHJL 12006 RTRWtt i 2007网宇及M交12008 RTRHtt 1 2012网军及利在12016 MrSUtt 12004 RlT及杷IL 12005 HTRHtt 12007 HTWfi Ieas同拉的MX同归国阿按伯H台昌长国 同拉宫背t:国 阿拉伯M白色十国RiifiFsas 网拉SHzn妖OQ _河拉伯RN西七国埃及WR康及康及 埃及 使国 逢g 检国1.87I*HN29niN6S113o 395*11 4.i0t*ll 4.241*11 3

5、.771411 37n*ll 8.412*10 9.6(*10 1.1S*11 .*n 1.73l*ll XOC*ll 3.5*11 X 83*12 2.87B”2 331298.521.4898.631.6298.30 0.T2 8.21 0.669T.64 O. SO 9T,38 0.13 96.89 819 W. 94 0.1694.63 O. IB H. 24 0.34 S,?9 1.06 98.52 1.4898.63 1.6298.30 0.T2S.21 O. M 9T.38 0.13 M2 0.3 9T. 79 1.05W. 52 1.4898.30 0.T248.810*oe4

6、T.II00748.01011*0838.4103*08M.9L03B*033.2I09t*030.2100623.2103*0821.0103B*040.110tt04T.21071*0848.810aoe47.110Tpg8.010tt*036.9I0IE+821.010tt040.1I011*094T.210Rg4T.110小835-0.57W83yT536 F6S15T2O5 38 -O.T17335O45 ” -0.758805919 40 -O. 820243278 43 -0.84004424 43 -O. t61TT90fi2 43 -O. 82731574S 43 -O. 8

7、33936483 43 853095466 3Srp. 627Sl9岸置ES8539-O. 758805919 43 -0.84OO4424S 43 -0.853095466 35 H). 62740158935 93 热 F.7335043xtsetyearidrepeatedtimevalueswithinpanel:(451);答案1:该错误提醒你,在设置面板过程中年份和个体并不是一一对应的,存在着个体对于多个年份的现象,即某年之内存在着个体重复的现象,这一问题的出现于你的设置个体方式有直接关系,你把(东道国+母国)最为整体来设置个体,将忽略两国的先后顺序,那么其中某一年内可能对应着多个

8、个体,从而使得面板设置出现错误。修改方式两种:第一,建议将东道国与母国分开进行设置个体idl、id2,然后将两者字符相加新的id,将与年份一一对应,重新设置;第二,不需要设置面板,不要使用XtSCt命令,而选择reghdfe命令,reghdfeyX,absorb(个体年份)VCe(CIUStCr个体),建议作者对reghdfe进行了解。当然,作者也可以使用duplicatesdropidyear,force将重复的个体予以删除,然后再进行设置就可以了。问题2:请问各位编辑,门限回归和断点回归有什么区别?答案2:门限回归与断点回归的重要区别在于两种计量思想的差异。对于门限回归,其主要考虑到变量X

9、对y的影响存在着非线性关系,以往的OIS只是考虑到X对y的平均作用,而忽略了影响的异质性,基于此,门限回归更多地研究X在不同阶段对y作用的大小,同时门限回归还可考虑到X对y的影响是否还受到第三变量Z的作用,是否随着z的变化X对y的作用也将发生改变,这些都是OlS中所不能体现出来的。对于断点回归,该方法的提出更多地是针对因果推断的净效应,选择合适的分类变量来对样本进行分类,例如考察上大学是否会影响工资收入。对于这一命题的检验有很多方法,但断点的思路是比较500分(假如高考分数线为500分,以下是不能上大学的)左右人群的工资收入水平来说明上大学的影响,之所以选择500分左右的原因在于,断点假设在500分左右的人群在智商、能力等方面非常相似(有必要的检验)、不存在差异,故而工资差距完全来自于上大学,这便是断点回归的思想。以上的介绍就是这两种计量方法在思想出发点的不同,除此之外,具体操作检验等也都存在着差异,对于不再展开。学术指导:张晓崛老师本期解答人:JieXie小大帝编辑:小大帝统筹:芋头易仰楠技术:知我者

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > IT计算机 > C/C++资料

copyright@ 2008-2023 1wenmi网站版权所有

经营许可证编号:宁ICP备2022001189号-1

本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。第壹文秘仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知第壹文秘网,我们立即给予删除!