Q群答疑20200316

时间 20200316 16:00-17:20

地点 三群(518180837)

更多内容可关注微信公众号:邱宗满

1.使用模型59,X、M和Y为连续变量,已经标准化,W为分类变量,虚拟化了,但是输出结果里,有的地方95%CI超出1,如何理解?
Q群答疑20200316

答:由于W为分类变量,相当于未标准化变量,所以结果的95%CI里面有超过±1是可以理解的,也可以接受,说明不同分组的回归系数差异较大。由于虚拟变量的基准组是可以更换的,如果不想要这样子的结果,可以重新编码,更换W的基准组。

2.自变量四个维度,两个中介变量,想知道自变量哪个维度通过中介对因变量的预测作用更明显,是分别将自变量各个维度与其他变量放进process检验呢,还是先用一元线性逐步回归检验出自变量哪个维度对因变量的预测作用更明显,再用process检验中介效应?

答:首先要确认一下自变量的四个维度相关高不高,如果相关高,可能适合直接加成总分,当做一个变量进行分析(大部分多维量表在实际应用中仍然是用的总分);如果自变量之间相关低,则适合拆开进行检验。如果需要筛选自变量,可以在相关分析的时候进行。相关分析时,与Y不显著的,可以剔除。

3.使用Mplus的报错如下,如何解决?
Q群答疑20200316

答:可能是因为“DATA”底下的数据文件路径里存在中文,可以放到全英路径里,数据名称也改为全英文。很多软件都没有中文版,也不支持中文,所以最好总是用英文。

4.自变量可以是5分类变量吗?

答:可以。

5.以下的相对效应比如何算?因为有遮掩效应,是计算间接效应/直接效应吗?
Q群答疑20200316

答:存在遮掩效应的时候,可以考虑只报告直接效应和所有的间接效应,然后,对所有效应取绝对之后相加,当做总效应,使用每个效应除以这个总效应就可以得到百分比。因为这样子计算出来的总效应和X单独对Y的总效应不一致,所以这个时候就不建议报告总效应和总间接效应了。也可以计算间接效应/直接效应的百分比,但是有时候间接效应较大,会超过100%,显得不太美观。此外,这种比值并不总是需要报告的,如果我们的标准化总效应只有0.1,而中介效应0.09,占比为90%,那也不见得有多大意义!效应数值是更为权威的间接效应效果量。

6.Amos中调节变量是连续变量,然后分组成高低两组。最后看的时候是不是看哪条cr值显著就是哪条路径存在调节?还有就是此时高低组的中介模型有的中介效应不存在了,怎么解读呀?

答:一般来说,不要轻易把一个连续变量认为分成高低组。无论是连续变量还是分类变量,都可以直接作出交乘项,检验交乘项是否显著就可以了。如果要分组,那可以对模型施加限制,设定两个组的回归系数相等,或者使用语法计算两个回归系数差异的Bootstrap检验是否显著,以此来判断调节效应。

  1. 并行中介这样报告还差点啥吗?
    Q群答疑20200316

答:由于SEM进行检验,中介可以按以下方式报告:①X→Y总效应(也可以不要);②整个模型的回归系数;③中介效应Bootstrap检验的CI(一般很少有人报告中介的p值)。由于两个中介是同一个大概念底下的近似概念,可以加残差,但是加了残差以后,这个模型应该是饱和模型,没有拟合度才对?

8.做交叉滞后一定要做等值嘛?下面这个地方不显著,是否就不能做交叉滞后?是不是因为发展速度太快?
Q群答疑20200316

答:如果能做一下等值,最好就做一下,但是很多人其实也没做。回归很低也可以做交叉滞后,重点在于解释结果。例如,在这里,同一个变量两个时间点差异很大,可能是由于这个概念是一个短时间的状态之类的,例如心情,一个人在两个时间点的心情甚至可以不怎么相关。除此之外,概念本身的发展速度(如你所说)也会影响,但肯定不止于此,测量的时间长度等也会影响。需要寻找相应的可能原因进行解释。

9.验证性因子分析时,因为个别维度因子载荷的平均值达不到0.7,但都大于0.5 所以AVE小于0.5,有0.4几,其它拟合指标都好,这种情况下可以吗?

答:可以的,虽然没有0.5,但也处于“可接受”的范围内,不要提及0.5的确切标准,至于能不能接受,让读者自己判断。

10.类似这种的二阶模型,题目太多,会在多大程度上影响拟合度,如果把题目进行打包分析的话会不会好一点呢?
Q群答疑20200316
答:即使模型很大,也不一定拟合度就差,但是拟合度变差的概率肯定更大一些。模型的拟合度很大程度上与量表质量有关,模型卡方值很大程度上来源于测量误差的残差相关。如果对题项进行打包,正常来说模型拟合会更好一些,因为残差的数量减少了。(残差即图中红色框的东西,只画了部分)

11.做有调节的中介的时候,用process跑,都把他们标准化后跑结果显著了,可没有标准化后跑,结果跟原先标准化的结果不一样,会有影响么?

答:正常来说,标准化与非标准化的结果显著性是一样的!而且这是同一软件,同一算法。如果原来显著后来不显著了,那可能是因为显著性比较弱,原本就处于p=0.05的边缘。要是真的差异很大,那肯定数据方面有什么问题,需要好好检查一下。

12.模型里存在缺失值,使用Mplus的全息极大似然估计,学习网络上对自变量加“[ ]”,括号内为自变量,不知道这是哪种估计方法?对缺失值怎么处理呢?

答:极大似然法ML在处理缺失值的时候就成了全息极大似然估计。所以,这种估计方法你已经自己说了。存在缺失值的时候,首先看比例,如果比例特别大,例如百分之四五十,那可能这批数据就不能用了。如果比例很低,例如百分五,那甚至可以直接删除。如果比例中等,例如百分之二十,那我们可以先进行缺失值分析,看看是不是随机缺失,是的话,可以删除也可以插补,如果不是,就难了。

13.以往大多数研究都采用连续变量而非分类变量作为调节变量。分类变量不像连续变量一样有大小之分,因此需要选定基准组进行比较,再进行解释,那以某一组(A)为基准,另一组的调节项显著(BCD三个组只有B组显著),要怎么解释呢?

答:正常来说,先给出回归方程,如果有调节项显著,process可以输出简单斜率,此时的简单斜率会有4个,也就是A、B、C和D组各有一个回归斜率,我们只需要解释这4个斜率,以及不同组之间的斜率是否存在差异就够了(也就是调节项)。

14.做量表开发,效度检验时,维度相间关系数有个别为0.0x,这个可以吗?

答:量表子维度相关这么低也是可以的,只要能符合理论解释就行。

15.饱和模型是否需要报告卡方自由度比之类的指标?

答:饱和模型的自由度为0,没有这些指标,无需报告。

16.process做model 15,其中调节变量为三分类变量,自变量为二分类变量,这种情况是否合理,因为没有看到这方面的文献,但是调节变量为连续变量的文献有,有文献可以推荐吗?

答:这是完全可以的。做问卷的一般不怎么会用分类变量作为主要的变量进行分析,所以我们自然很少见到这样的,我也没见到。可能有一部分将实验和问卷联合起来分析的文章里比较可能存在分类的自变量与调节变量。

17.交叉滞后分析T1和T2的变量是正相关,但是交叉滞后分析结果显示其回归系数变为负数,如下图中标黄的地方,不知道是否有可能?
Q群答疑20200316

答:完全有可能,遮掩效应就是这样的。当然,我们在已发表的论文中实际见到的很少,因为这并不好进行解释也不容易被接受,所以很多这样的结果可能就雪藏了,存在发表偏倚。(共线性也可能导致这种情况)

18.用spss软件作回归分析,得到某个模型是“部分中介”,用AMOS对潜变量分析,是“完全中介”,这样的结论不一样,是什么原因呢,只报告一个方法?还是两种方法都报告?

答:SPSS里面用的是观察变量,量表总分;AMOS里面用的是潜变量,因子得分;因此结果不总是一致。一般来说,选择其中一种方法进行报告就行。此外,当代中介分析里,一般不说“部分中介”与完全中介。较早的中介检验方法中,认为直接效应(即X和M一起对Y做回归时X的回归系数)不显著,而中介显著的情况下称为“完全中介”。但是,我们知道,回归的显著性与样本量有关。假如我们100样本时,X→Y系数为0.2,不显著;但我们样本为500时,可能X→Y还是0.2,却显著了。同样的系数大小,按照这个逻辑,有时候是部分中介,有时候是完全中介,那就有点矛盾了(这是其中一点)。所以,我们报告中介时,只需要提供回归分析的表格,以及中介的Bootstrap检验结果即可,无需强调是部分中介还是完全中介。

19.如果添加了控制变量后,调节效应不显著,不加的话边缘显著,我是不是可以分别做一下,说明情况 原假设还能说成立吗?

答:首先,在相关分析的时候,我们需要看控制变量与主要的模型变量相关是否显著,有多大。如果在这一步,控制变量与主要变量没什么关系,那后续是可以不加入模型的。如果一定要加入模型,而且加入后不显著,那就真的没有什么别的方法了,增大样本量试试。样本量越大,标准误越小,越容易显著。

  1. 这种结果效应是不是太低了?
    Q群答疑20200316

答:不一定低。由于这是非标准化数据,各个变量的取值范围不同,自变量取值范围大,而因变量范围小的时候,就容易出现回归系数特别小,但是却显著的情况。因此,建议对变量进行标准化后,再做一次分析。

21.论文中讲到,对多重中介进行检验时,可以进行对比中介效应检验,具体如何操作呢?
Q群答疑20200316

答:如果是用process,则软件自动输出;如果是用AMOS和Mplus,则我们一般都会写出所有中介的代码,例如ind1、ind2等等,只需要将两个相减,仍采用Bootstrap检验即可。Bt的CI中包含0,则两条特定中介之间没有差异。

22.我的数据是从统计年鉴获得1998年——2017年的数据,数据的效度和信度都达标了,但是拟合度一直不好,通过拉残差拟合度也不好,应该怎么办呢?
Q群答疑20200316

答:这并不属于我的领域,我并不清楚这样子是否合理,因为这些数据是自相关的,每一年数据都和前一年有关。我在QQ群里见过很多想拿面板数据做潜变量的,但是大都失败了。如果一定要用AMOS或者Mplus做,那就只能通过释放残差相关来提升拟合。(建议看看连玉君或者阳义南老师是否有做过这方面的东西,他们的公众号分别是“Stata连享会”和“结构方程模型Stata”,可能与这方面的数据处理比较有关,而且同时涉及结构方程模型)

23.用model 14做的有中介调节,调节变量三分类,我的结果中汇报了有调节中介回归,中介效应检验,简单斜率检验,我还需要报告什么结果吗?结果都做出来了,分类2不调节,13都调节,中介效应都显著,但是在讨论的时候感觉很艰难,有没有什么指导呢?

答:数据分析的时候需要报告回归方程、调节效应、简单斜率、调节效应图、中介效应的Bootstrap检验(或者调节中介的Bt检验)。在讨论的时候,可以分段讨论。大体上可以讨论X与Y(第一段),X→M、M→Y和X→M→Y(第二段),加入调节变量后的结果(第三段),这些结果带来的启发(第四段),局限和展望(第五段)。讨论的时候还可以有更详细的分段。具体的讨论内容,以X→Y的第一段为例,可以参考一下逻辑。

X→Y的讨论逻辑,假如X=同伴关系,Y=手机成瘾:

本次研究中发现,同伴关系对手机成瘾存在XX影响,与前人研究结果一致(给出参考文献)。同伴关系是一种XXXX(描述一下,给出参考文献)。当同伴关系较差时,个体XXXXX,在外界XXX,缺爱XXXX。而手机上提供了XXXX(描述功能,也可以给出参考文献)。因此,同伴关系差的个体容易使用手机,在虚拟的网络世界中寻找XXXX。而同伴关系好的个体,与朋友联系多,XXXXX,较不容易沉迷在手机世界中。XXX的XXX理论也可以用来解释X与Y的关系。XX理论认为,XXXXX。而同伴关系可以看做XX的一种,当同伴关系XXX的时候,则XXXX,导致个体对手机XXXX。

  1. 多个自变量,1个中介变量,这样的模型能这样做吗?问卷出来的拟合度会好吗
    Q群答疑20200316

答:当然是可以做的,至于拟合度好不好就不清楚了。对于我们一般人来说,结构方程模型的拟合度很大程度上取决于我们所使用的问卷质量(也包括收集问卷的方法,这与前者是一般人研究中对模型拟合的最大的影响因素了)。(此外,当时忘了说,模型自变量数量太多,可能会有较多不显著,一般能有两三个重要的自变量就够了)

25.用process 模型14做的调节效应,非标准化可以出结果,但是标准化出不来?
Q群答疑20200316

答:具体原因我也不清楚,可以建议的尝试有①修改变量,②将数据拿到其他电脑上试一试(试试不同版本的SPSS和process是否可以跑出来)。

26.我的模型有两个自变量,两个因变量。两个自变量是一个大概念底下的相似概念,因变量同。要做自变量以及自变量之间的交互项分别对两个因变量的线性回归。假设框架怎么画图?我的图被审稿人批评的有点惨。
Q群答疑20200316

答:理论模型、假设模型和数据分析模型是有区别的。在假设模型中,每一条假设要对应一条关系,在你的模型图里,H1a和H1b都写在一条线上,那怎么知道这是谁对谁的影响呢?假设模型可以参考以下画法(括号内的符号可以没有),ppt即可完成:
Q群答疑20200316

27.我使用健康状态作为调节变量,在写论文讨论的时候不知道怎么写,也很难找理论,有什么建议吗?

答:健康状态是生理,而我们一般研究的很多变量都是心理的,可以尝试寻找生理影响心理的相关理论。理论方面无法传授,完全看你读过多少东西,读得多也就知道的多,要么就是回到自己的参考文献里找找他人是否有用理论来解释。当然,我们可以在谷歌学术上通过一些搜索技巧限定出某些文献,然后快速浏览是否与我们要找的有关。比如,通过intitle:“health”,就可以限定搜索结果产生论文标题中含有“health”的文献,下图中我同时限定两个词,可以看到,都是与健康相关的理论。我们还可以通过限定更多词或者其他技巧来精确搜索结果,然后快速浏览,寻找我们所需要的文献。
Q群答疑20200316