您的位置: 首页 > 文章 > 如何理解 95% 置信区间？

如何理解 95% 置信区间？

分类: 文章 • 2024-02-27 15:56:21

对于置信区间一直不了解，很难懂，哪位大神可以通俗易懂地解释一下，最好举个例子，谢谢！

关注者

3,198

被浏览

456,107

关注问题写回答

3 条评论

分享

邀请回答

85 个回答

默认排序

看图学数学，公众号：matongxue314

1,107 人赞同了该回答

置信区间，就是一种区间估计。

先来看看什么是点估计，什么是区间估计。

1 点估计与区间估计

以前很流行一种刮刮卡：

如何理解 95% 置信区间？

游戏规则是（假设只有一个大奖）：

大奖事先就固定好了，一定印在某一张刮刮卡上
买了刮刮卡之后，刮开就知道自己是否中奖

那么我们起码有两种策略来刮奖：

点估计：买一张，这就相当于你猜测这一张会中奖
区间估计：买一盒，这就相当于你猜测这一盒里面会有某一张中奖

很显然区间估计的命中率会更高（当然费用会更高，因为风险降低了）。

接下来，我们看看置信区间是如何进行区间估计的。

2 置信区间

我们通过对人类身高的估计来讲解什么是置信区间。

2.1 上帝视角

对于人类真实的平均身高，我们是没有办法知道的，因为几乎不可能把每个人都统计到。

但这个数据肯定是真实存在的，我们可以说，上帝知道。

在这里我们引入了上帝视角，即上帝看到的人类身高的真实分布。

假设人类的身高分布服从如下正态分布（如何理解 95% 置信区间？）：

如何理解 95% 置信区间？

也就是说全体人类的平均身高为145cm，为了表示只有上帝可以看到，我把真实分布用虚线来表示：

如何理解 95% 置信区间？

2.2 点估计

作为愚蠢的人类，我们只能在人群中抽样统计：

如何理解 95% 置信区间？

比如下面是一次抽样数据，我把算出来的样本均值（记作如何理解 95% 置信区间？）画在图上（蓝色的点）：

如何理解 95% 置信区间？

如何理解 95% 置信区间？就是对真实的的一次点估计。

通过一次次的抽样，我们可以算出不同的身高均值的点估计：

如何理解 95% 置信区间？

如果我们关闭上帝视角，我们分辨不出哪个点估计更好：

如何理解 95% 置信区间？

区间估计可以改进此问题。

2.3 置信区间

置信区间，提供了一种区间估计的方法。

下面采用如何理解 95% 置信区间？置信区间来构造区间估计（什么是置信区间，这个我们后面解释）：

如何理解 95% 置信区间？

通过如何理解 95% 置信区间？置信区间构造出来的区间，我们可以看到，基本上都包含了真实的，除了红色的那根。

关闭上帝视角，我们仍然不知道哪一个区间估计更好：

如何理解 95% 置信区间？

但是，和点估计比较：

点估计和区间估计，都不知道哪个点或者哪个区间更好
但是，按照置信区间构造出来的区间，如果我构造出100个这样的区间，其中大约有95个会包含

这就好像用渔网捞鱼，我知道一百次网下去，可能会有95次网到我想要的鱼，但是我并不知道是不是现在这一网：

如何理解 95% 置信区间？

剩下的问题就是如何理解 95% 置信区间？置信区间是如何构造的。

3 置信区间

假设人群的身高服从：

如何理解 95% 置信区间？

其中如何理解 95% 置信区间？未知，已知。

我们不断对人群进行采样，样本的大小为如何理解 95% 置信区间？，样本的均值：

如何理解 95% 置信区间？

根据大数定律和中心极限定律，如何理解 95% 置信区间？服从：

如何理解 95% 置信区间？

我们可以算出以如何理解 95% 置信区间？为中心，面积为0.95的区间，如下图：

如何理解 95% 置信区间？

即：

如何理解 95% 置信区间？

也就是，如何理解 95% 置信区间？有的几率落入此区间：

如何理解 95% 置信区间？

我们以如何理解 95% 置信区间？为半径做区间，就构造出了置信区间。按这样去构造的100个区间，其中大约会有95个会包含：

如何理解 95% 置信区间？

那么，只有一个问题了，我们不知道、并且永远都不会知道真实的如何理解 95% 置信区间？是多少。

我们就只有用如何理解 95% 置信区间？来代替：

如何理解 95% 置信区间？

4 总结

总结一下：

置信区间要求估计量是个常数
也被称为置信水平，是统计中的一个习惯，可以根据应用进行调整

编辑于 2018-07-27

赞同 1.1K99 条评论

分享

收藏感谢收起

哲学初学者

收录于编辑推荐 · 763 人赞同了该回答

看见两位哲学界前辈

关注了这个问题。其实我不知道你们的关注点在哪里——是单纯地想了解统计学，还是有自己的哲学关切。如果是后者，我十分愿意谈一谈置信区间的哲学意蕴。它或许能为人们理解置信区间提供一个有趣的知识背景，或者满足一部分人的求知欲。当然，对科学哲学不感兴趣而只想在数学层面理解置信区间的人则完全没有必要阅读。

关于置信区间在数学层面上的解释，各个答案已经说得不错了，我想这里没有必要再介绍置信区间是什么了。我想介绍的是，我们为什么需要置信区间，以及它为什么通常是95%。由于时间和能力有限，涉及到的很多专业的问题我无法探讨，所以只想给出一个大家都看得懂的概要。

我们知道，置信区间不是一个孤立的概念，它是统计学理论（具体来说是内曼-皮尔逊统计推断理论）中的一环。而统计学理论往往是为科学服务的，这是因为现代科学注重数量层面，并且往往涉及个别和一般。所以我们的讨论落在科学哲学的层面也就不奇怪了。当然，这些讨论对于不被称为科学的统计应用也是有效的。我们会从看似不相关的科学哲学问题说起，最后讨论到置信区间。

说起科学，它想要做的工作很多，它可能包括提出对个别现象的解释，对未来的预测，等等。然而，更吸引人的是提出关于总体的理论，而解释和预测也往往依赖于普适理论。关于这种普适理论，我们首先想到的范例就是牛顿力学。然而，我们如何提出一个普适理论呢？

在这里我们发现，人类具有一个根深蒂固的局限性——我们不能一下子就如同上帝一样认识全体，而只能一个一个地观察个体。因此，认识总体似乎只能通过从个别到一般的方法，即归纳。然而，休谟告诉我们，从有限的经验观察中是无法得出关于总体的理论的。这很好理解：就算你看到10000只天鹅是白的，你也不能下定论说“天鹅都是白的”，因为第10001只就可能是黑的。如果从个别到一般是不行的，那么我们是否有办法绕开个别而直接得到一般——比如，通过神启等方式？波普会告诉你，这并不解决问题。发现的逻辑和验证的逻辑是不同的，就算你通过神启发现了总体的规律，可是面对怀疑时你还需要验证它的正确性，而这必然还要回到个别。

那么怎么办呢？波普说，我们无法通过有限的个例证实一个理论，但我们可以证伪它！比如，如果我们发现了1只黑天鹅，那么“天鹅都是白的”这个理论就被证伪了。这样，所有被接受的理论就不是证实无疑的理论，而是尚未被证伪的理论。而科学与非科学的界限，就在于是否具有可证伪性。

这就是波普的证伪主义。相信很多知乎用户都对此了解，我经常看到知乎用户在谈论科学问题时诉诸可证伪性。然而故事还没完呢——证伪真的像想象中那么简单吗？

证伪主义可能面临至少三个问题：

（1）科学理论往往不是孤立的，而是相互支持的。当科学理论建立在其他理论或假设的基础上时，我们不知道被证伪的是这个理论还是它所依靠的前提。

（2）它将一些我们通常认为是科学的东西排除在科学之外——比如达尔文的进化论就不具有可证伪性。

（3）统计推断往往不具有可证伪性。

涉及置信区间的，就是第三个问题。统计学也想得出关于总体的结论，而它作出推断的方式和我们之前所说的都有所不同。在统计学中，我们为了知道总体数据的某些特性，往往采用抽样的做法，用样本估计总体。这种估计，很难被证实，因为我们往往不掌握总体的数据；它也同样很难被证伪，因为统计推断是关于总体数据特征的推断，无法用任何一个单独的个体数据证伪。

我们可以想象这样一个例子：我用一定量的样本数据估计出全体知乎用户的平均年龄为28岁，那么——显然，你举出“White是20岁”来证伪是无效的，因为我们这里谈论的是平均；如果你收集了一组样本，其平均年龄为35岁，是否能够证伪呢？也不行，因为我们谈论的是总体。仿佛，我们在这里完全没有办法确定关于总体均值的估计是否正确。

你可能会想到，假设为了验证关于总体均值的估计，我随机抽取了1000000组样本，其均值都与28有一些差距，这是否能够证明总体均值不是28呢？当然不能。我们仍然不能确定地说总体均值不是28，不过，我们可以说总体均值是28的可能性不大。你一定明白了，这里我们能够谈论的只能是可能性。所以在这类问题中，我们接受或拒绝一个理论，不是因为它被证明了是正确或错误的，而是因为它很可能正确或很可能错误。

“很可能”的界限在哪里？波普是不赞成以概率数字来表示正确或错误的可能性的，不过在科学的实践中我们往往需要明确的标尺，这还是要求助于数学。统计学家们想出了办法，他们往往（人为地）估计总体数据的分布情况，然后（人为地）构造统计量，最后将统计量同预先（人为地）设定的标准相对比，以此决定我们是否应该接受/拒绝一个统计推断。鉴于其中检验方法和标准都是十分“人为的”，所以不得不承认由此得出的结论是“方法论上的真理”。置信区间，便是这样的一种人为设定的接受/拒绝理论的标准。读到这里，你已经明白置信区间从何而来了。

那么置信区间为什么通常是95%呢？其实，这个数字并不是必然的，而是人为设定的。置信水平的设定是有影响的——如果我们对置信水平要求过高，我们可能会拒绝实际上是正确的理论（犯了I类错误）；如果我们对置信水平要求过低，我们可能会接受错误的理论（犯了II类错误）。并没有一个万全之策能够让犯两种错误的可能性同时降低，我们必须做出选择。鉴于我们更加不喜欢犯II类错误，所以我们习惯于把置信水平设置在高水平。人们觉得95%是合适的，它的涵义是当总体呈正态分布时估计值落在总体均值左右两个标准差范围内的概率的近似值。详见https://en.wikipedia.org/wiki/68%E2%80%9395%E2%80%9399.7_rule。关于置信区间的问题，我想说的就这些。

最后说些闲话。首先，如果没有意识到以上问题，我们很可能会像前期维特根斯坦那样简单地所认为科学就是所有真命题的总和。而以上讨论让我们认识到，即使是科学，也并不是具有坚实确定性的，它可能需要方法论的支持。所以，科学更像是一个游戏，我们制定规则然后玩它。其次，我想借用后期维特根斯坦的标准米比喻——有一件东西你不能说它是一米长，它就是巴黎的标准米。同样，你不能说科学方法论是真还是假，因为我们用方法论来衡量真假。最后，也不要为我们在某些问题上无法获得完全确定的真理而感到悲伤——我们毕竟不是上帝，或许我们的智慧只能做到这种程度吧:)。

（完）

======

注：评论区有很多朋友认为，此答案在数学上犯了一些错误。我对数学了解不深，很感谢大家的批评。各位读者请只看此答案的哲学部分就好。

编辑于 2016-11-07

赞同 76363 条评论

分享

收藏感谢收起

孤独的学习着

17 人赞同了该回答

关于置信区间，一种普遍的错误理解是：总体待估计参数（比如说均值）以一定的概率落在置信区间内。这种理解的错误在于，总体的待估计参数是确定量而非随机量，而对于确定量来说，其落在某个区间内的概率非0即1.

正确的理解是：以相同的抽样方式，获得N组抽样样本，每一组抽样样本点数为M，对于每一组抽样样本，按某一置信度，比如说95%，计算出置信区间，那么将会有0.95*N组所计算出来的置信区间中包含有总体待估计参数值。

下面我们以具体的实验来说明这个问题。

例：以掷均匀骰子为例，X表示骰子朝上的数值，那么X概率分布为：

如何理解 95% 置信区间？

如何理解 95% 置信区间？

如何理解 95% 置信区间？

由于总体的方差已知，这里采用z-score方法计算出95%置信度所对应的critiacl value值c为1.96.则对于每一组样本，X均值的置信区间为

（如何理解 95% 置信区间？ , ）.

其中M为样本点数。

如何理解 95% 置信区间？

下面我们进行实验。实验主要步骤如下：

按照骰子的分布，随机生成M=1000个随机数作为采样样本，求出样本平均值以及95%置信区间，判断真实均值是否在置信区间中。
重复1的过程 N=1000次。
统计出真实均值在置信区间中的次数cnt，计算比值rate=cnt/N。
重复1~3步骤100次。

Matlab代码如下：

M = 1000;          %采样点数
N = 1000;          %采样组数
mu = 3.5;          
delta2 = 35/12;    %掷骰子问题理论均值及方差
c = 1.96;          %置信度95%所对应的critical value，由于总体的方差已知，这里采用z-score计算critical value
T = 100;           %重复实验次数
rate = zeros(T,1); %保存每次实验真实值落入置信区间中比例
for t = 1:T
    cnt = 0;           %统计真实值落入置信区间中的次数
    for i = 1:N
        S = randi(6,M,1);   %采样点集合
        S_mean = mean(S);   %使用样本点估计出来的均值
        CI_upper = S_mean + c*sqrt(delta2/M);          %置信区间上界
        CI_lower = S_mean - c*sqrt(delta2/M);          %置信区间下届
        %判断理论均值是否落在置信区间内
        if(CI_lower < mu & mu < CI_upper)
            cnt = cnt + 1;
        end
    end
    rate(t) = cnt / N;
end
%画图
% figure(1)
% plot(rate)
% axis([1 100 0 1])
% xlabel('实验次数')
% ylabel('真实值落入置信区间中比例')

如何理解 95% 置信区间？

实验结果可以看出：对于每一次实验，1000组采样中，有950次左右置信区间会包含真实值。

综上，不同的样本集具有不同的置信区间，置信区间是随机变量。那么，求某一个样本集的置信区间究竟有什么意义呢？在实际应用中，当我们需要研究总体的某些特征时，以总体的均值为例，由于无法获得全体数据，我们通过采样来获得样本，样本均值作为总体均值的一个点估计，而该样本的置信区间作为总体均值的一个区间估计。这里我们以95%置信度为例，那么由这个样本计算出来的95%置信区间能够说明什么呢？通过上面实验，1000个样本集计算出来的1000个置信区间，其中有大约950个置信区间包含有真实值，换句话说，当我们由具体某一个样本集计算出来的置信区间包含有真实值的可能性为0.95。所以利用置信区间可以一定程度上对于真实值的取值范围有所了解。

发布于 2017-09-30

赞同 173 条评论

分享

收藏感谢收起

Data Scientist

收录于编辑推荐 · 312 人赞同了该回答

很多答案当中用关于真值的概率描述来解释置信区间是不准确的。我们平常使用的频率学派（frequentist）95% 置信区间的意思并不是真值在这个区间内的概率是 95%。真值要么在，要么不在。由于在频率学派当中，真值是一个常数，而非随机变量（后者是贝叶斯学派），所以我们不对真值做概率描述。对于这个问题来说，理解的关键是我们是对这个构造置信区间的方法做概率描述，而非真值，也非我们算得的这个区间本身。

换言之，我们可以说，如果我们重复取样，每次取样后都用这个方法构造置信区间，有 95% 的置信区间会包含真值 (*)。然而（在频率学派当中）我们无法讨论其中某一个置信区间包含真值的概率。

实际上，在特定的情形中 (^) 我们甚至可以直接断定一个参数不在一个 95% 置信区间中，即使我们构造这个区间的方法完全正确。这更说明我们不能说参数在某一个区间内的概率是多少。

只有贝叶斯学派才会说某个特定的区间包含真值的概率是多少，但这需要我们为真值假设一个先验概率分布（prior distribution）。这不适用于我们平常使用的基于频率学派的置信区间构造方法。

更多的解释可以参考：
https://en.wikipedia.org/wiki/Confidence_interval#Misunderstandings

评论里的补充解释：
换种方法说，假设我们还没有取样，但已经制定好取样后构造 95% 置信区间的方法。我们可以说取样一次以后，获得的那个置信区间（现在还不知道）包含真值的概率是 95%。然而在取样并得到具体的一个区间之后，在频率学派框架下就无法讨论这个区间包含真值的概率了。

取样前能讨论，取样后却无法讨论，这可能让很多人感到很不自然。扩大来说，传统频率学派对已经发生，但我们不知道结果的事件的讨论存在困难。虽然这个问题通常在应用上无伤大雅，但确实有不少学者因此寻求对概率的不同解释。

______________________
* 也许你会说这么描述就相当于说某个置信区间包含真值的概率是 95%。那我只能说你必须寻求频率学派以外的对概率的解释。这是一个很深奥的哲学问题：）
^ 参见 http://stats.stackexchange.com/questions/26450/why-does-a-95-ci-not-imply-a-95-chance-of-containing-the-mean 中的回答

编辑于 2016-01-26

赞同 31234 条评论

分享

收藏感谢

老特拉福德梦想家

老特拉福德梦想家

23 人赞同了该回答

经典统计学的核心思想就是用样本去估计总体；总体的参数是未知的，不可测度或难以测度，注意它是固定了的数值；
为了估计这个总体的参数，我们就要通过样本来构造统计量，注意它是一个随机变量。随机变量的意思是随着你样本选取的不同，具体到每一个样本的统计量的统计值也不尽相同。这个随机变量的统计值就是对总体参数的点估计，由于样本估计总体总是会存在一定的偏差，所以我们为了更好的估计总体参数，于是用到了置信区间。
95％的置信度的意思是如果你从总体中抽取100个不同样本，每个样本都用相同的统计量构造的置信区间(注意:由于样本不相同，这些置信区间的范围也不尽相同)，那么有95个置信区间包含了总体参数的真值。
最关键的是要理解统计量是随机变量而总体的参数是一个实实在在的数值

发布于 2015-10-28

赞同 235 条评论

分享

收藏感谢如何理解 95% 置信区间？

知乎用户

25 人赞同了该回答

置信区间是一个随机的区间。所谓随机，就是指端点为随机变量，这个随机变量通常是一个统计量，当抽取不同的样本时就对应不同的值，从而对应不同的区间。对于某些样本来说，对应的区间包含参数真值，另一些不包含。若在100次随机抽样中构造的100个区间如果95次包含了参数真值，那么置信度为95%.

发布于 2016-01-13

赞同 251 条评论

分享

收藏感谢

现在几点了

sb

403 人赞同了该回答

首先，重要的事情说三遍：

置信区间是随机变量！
置信区间是随机变量！
置信区间是随机变量！

感谢大家点赞
---------------------------------------------------
看了下前面几个答案，写的不短，赞的人也不少，但是完全没觉得讲清楚什么是置信区间，甚至好多错误观点。

最可能出现的对置信区间的错误理解：

95%置信区间有95%的概率包括真实参数

。以前在学校教过应用统计，所以我来给个简明专业的答案吧：

理解置信区间，有几个基础统计概念要搞清楚，抛开这些概念去理解置信区间就是扯淡。置信区间是谁的置信区间？这个问题搞清楚了么，置信区间是来参数的置信区间，参数又是什么的参数？
参数是总体（population）的参数，置信区间是怎么算的？是通过样本（sample）算的，样本和总体又有什么联系？
1）总体，就是全部数据。可以假设总体服从某一分布，比如正太分布。一个正太分布是由两个参数唯一确定的，平均值和方差，这两个参数都是固定的数值，而不是变化的。
2）（随机）样本，样本就是从总体里面得到的数据，比如从一个正太分布，我们可以得到0.54，这个0.54就是一个样本。很重要的一点：一个样本未必只有一个值，我们完全可以得到一个样本(0.1,-5,12),这个样本有3个值，3 就是这个样本的size。
3）参数估计，实际中，总体什么分布往往不知道，但是我们可以做假设，比如假设人的体重是正太分布，做了这个假设，那接下来的问题是这个正太分布参数是多少？也就是平均值和方差怎么算，解决这个问题就是参数估计，统计里有很多方法，不展开说了。但是参数估计是从样本来估计的，这是关键的一点：样本——>总体的参数。
4）不同样本估计的参数一样么？没有理由一样，所以问题来了，不同样本估计的总体不一样，怎么办？区间估计，也就是给定一个区间，让总体参数被包括其中。但是总体参数一定被包括么？显然也不一定，这取决于样本，如果恰好选了某些样本，可能估计的参数和总体相距甚远。

最后一点，也是最重要一点，很多自称搞统计的人也理解错误，就是怎么解释置信区间呢？
5）比如给定一组参数，算出来总体平均值的置信区间[a,b]，是不是说总体平均值有95%的概率在这个区间内？这样理解是逻辑混乱的结果，没搞懂什么是常数，什么是随机变量这些基本问题。
首先，总体参数，是一个常数，只是你不知道，是unknown constant，不知道不代表随机，完全两个概念。然后，一旦估计出区间，这区间也是确定的，参数也是确定的，不存在任何随机问题，那么现在大家应该清楚答案最开始说对置信区间最大的误解”95%置信区间有95%的概率包括真实参数“的问题在哪了。

那么正确的解释是怎样的？可以有很多种，这里直说一个解释：
95%置信区间，意味着如果你用同样的步骤，去选样本，计算置信区间，那么100次这样的独立过程，有95%的概率你算出来的区间可以包括真实参数值。

下图就是一个例子，抽样100次，计算总体参数的置信区间100次，多数情况置信区间覆盖了真实值，但是也有没有的情况。

如何理解 95% 置信区间？

一个类比，对置信区间包括真实参数的概率的错误理解相当于说守株待兔，已经选好一棵树，兔子撞上去的概率，兔子就是真是参数。正确的理解是，找到一棵有兔子的树的概率。树是什么？是样本，也是置信区间。

差别有些微妙！

################################################################################
欢迎关注微信公众号：机器会学习（id：jiqihuixuexi），精彩原创文章频繁更新！

编辑于 2016-10-05

赞同 40360 条评论

分享

收藏感谢收起

小白

6 人赞同了该回答

我认为应该是没有理解置信区间的含义。置信区间是说，当你不断改变样本的时候，有95%的机会，真实值落在我们的这个置信区间里。而不是仅仅局限在这次抽样。所以置信区间有意义。

发布于 2014-11-21

赞同 64 条评论

分享

收藏感谢

人们经常犯下这样的一种错误：把想象力的缺陷当成是对客观真理的深刻洞见

35 人赞同了该回答

谢邀……
这要从什么是“置信区间”谈起……
在那之前我们需要定义"随机变量"……随机变量是一个函数X，其定义域为所有被考察的独立事件组成的集合C，而其值域为一个数集，也就是X(c)=x……
现在我们把被考察的所有随机变量收集起来，把P(X(c)≤x)作为从所有满足条件“X(c)≤x”的随机变量到其概率值的函数，总有一个函数F(x)=P(X(c)≤x)……这就是所谓的“累积分布函数”……（从累积分布开始，可以构造出概率质量函数或者是概率密度函数，也可以构造出一个动差生成函数，此处不做进一步说明）……
一个累积分布函数将代表一个分布（一个概率质量函数或概率密度函数、一个动差生成函数，也可以代表同一个分布）……
现在我们假定一类测试的随机变量符合特定的一个分布f，而代表这一分布的特定函数（一般在有概率质量函数的时候使用概率质量函数，在有概率密度函数的时候使用概率密度函数）中除了x以外还有一些被考察的重要参数，将这些参数组成一个矢量θ……
假定我们进行了n次符合分布X的测试，得到的随机变量依次为X1到Xn，这里的“X1到Xn”就是样本，n就是样本容量……
假定我们不知道θ的值……对于θ有P(θ∈[L,U])这一概率……[L,U]就是“置信区间”……
利用X1,...,Xn的值，可以对θ进行“最大似然估计”，得到的结果记为Argmax L(θ)……
通过X所符合分布和n的值，有时可以计算θ所符合的分布……
根据Argmax L(θ)的值和θ所符合的分布，可以求出L和U，于是就求出了“置信区间”……
而95%置信区间，也就代表着P(θ∈[L,U])=95%……仅此而已……也就是L≤θ≤U的概率为95%……

尽管这一概念通常使用于正态分布上，但实际上适用范围要远远比正态分布要大得多……

关于其在正态分布上的应用……
正态分布的θ=(μ,σ^2)（这两个指标也是整个总体的均值和方差），而用n个服从同一正态分布的随机变量进行最大似然估计的结果是Argmax L(θ)=(x bar,s^2)（也就是样本的均值和方差）……
根据中心极限定理，当n趋于无穷时(x bar−μ)/(σ/sqrt(n))的分布收敛于标准正态分布……使用σ（总体的标准差）的最大似然估计值s（样本的标准差）来替代σ，根据标准正态分布，即可求出μ（总体的均值）的95%置信区间……

参考资料：

Hogg, Robert T; McKean, Joeseph; Craig, Allen T (2012-02-08). Introduction to Mathematical Statistics (7th Edition) . Pearson HE, Inc.. Kindle Edition.

编辑于 2015-11-14

赞同 356 条评论

分享

收藏感谢

专门倒腾数据

106 人赞同了该回答

用于理解的话你可以这样想:
你得出的置信区间就像一张大网，而你要推断的真值是海里的一条鱼（不动的鱼），你的网可以撒向任何地方，有可能能捕捉到那条鱼，有可能一无所获。95%是用来描述你捕获真值的概率的，你撒100次网，有95次捕到了真值，5次一无所获。
引用一下Gudmud R .Iverson的《统计学-基本概念和方法》p157关于置信水平的小结:
“置信水平为95%的意思是多次抽样中有95%的置信区间包含未知的参数值而另外的5%则不包含真值。至于在一次抽样得到的置信区间是包含总体参数的众多区间中的一员呢，还是属于个别不包含参数值的区间就不得而知了”
这就是统计学的魅力，虽然我不知道真值是否在区间中，但是我有95%的把握它在里面。
最后希望这个回答对你有用。

发布于 2014-11-02

赞同 1064 条评论

分享

收藏感谢

不会滑雪的会计师不是好的数据科学家

70 人赞同了该回答

要理解置信区间，首先要理解总体和样本的关系。统计学本质上是一门研究样本和总体关系的科学。为了说明白样本和总体等概念，这里用一个例子说明。假设一锅汤是总体，我们为了知道汤的味道，用勺子打了一小勺，这一小勺即是样本。一小勺能否正确反映出整锅汤的味道往往取决于汤是否均匀搅拌，放在统计学里则是有没有随机抽样。

理解了总体和样本之后，我们来讲置信区间。这里用另外一个例子来帮助理解。假设我们想知道某一个中学男生的平均身高。有两种方法

暴力方法：找出该中学的所有男生，记录他们的身高，求平均值。这种方法虽然准确，单成本巨大，实际上无法操作。
统计方法：随机抽100个男生作为样本，由这100个男生的身高平均值（估计值）来估算该中学男生的平均身高（真实值）。

用统计方法时，最容易想到是拿这100个男生的身高平均值作为该中学所有男生的身高平均值。但是用一个固定数值来作为推断结果很容易出错。况且抽样样本不同，所得到的平均身高肯定也会不同。这时候，统计学家们想到了一个狡猾的办法，就是用一个数值区间来表示推断结果。一个区间内包含真实值的概率当然大大增加。这里这个区间即为置信区间。但是因为抽样不同，我们获得的置信区间也会不一样。假设我们抽样了100次（每一次抽100个男生），那么我们可以获得100个不同的置信区间。95%置信区间表示的是，这100个置信区间中，有95个以上的区间包含了该中学男生的平均身高的真实值。

最后在这里说明一下容易产生的误区：95%置信区间表示真实值有95%的概率落到当前置信区间之内。这个说法是不准确的，真实值要么在区间内，要么不在区间之内。95%的置信区间表示，多次抽样所得到的多个置信区间里，包含真实值的区间占比。如下图所示，竖的虚线代表真实值，横的实线代表一个一个的置信区间，这25个置信区间中，只有1个（红色的线）不包含真实值，95%以上区间包含了真实值。

如何理解 95% 置信区间？

关于统计学的书籍：推荐 OpenIntro，这本书写的蛮通俗易懂的。这个答案部分参考了书中内容。

编辑于 2016-11-23

赞同 7023 条评论

分享

收藏感谢收起如何理解 95% 置信区间？

匿名用户

13 人赞同了该回答

如果你想问的是这个95%是针对谁的95%，那么可以这样理解：

为了估算某参数a，假设我重复随机取样再估算这一系列步骤n次(n足够大)，那么a的真实值落在这个95%置信区间内的次数大概是0.95n

发布于 2014-11-01

赞同 131 条评论

分享

收藏感谢如何理解 95% 置信区间？

知乎用户

作n次實驗得n個值, 95%置信區間即含其中n*0.95個值

发布于 2016-02-18

赞同添加评论

分享

收藏感谢

关注八卦的心理学硕士/猫厂做用研的/伪90后小清新

61 人赞同了该回答

对，就是答主想要的最通俗的举例~

ps，提前说明，我统计学不好，所以，我给的只是我的理解（但这个理解帮助度过了本科心理统计学、研究森考试、和研究生高级同统计学考试，所以应该也没大错~），希望帮助答主有个思路，最主要的是，回归教材。

假设你叫李三，你开一个猪脚店，你希望知道你每天卖出去多少碗猪脚，一般的思路是说，我记录30天每天卖多少，然后平均数得到一天卖100碗，ok，任务完成，这就是你想知道的答案。

然而，事实上，由于你样本量过小或者有极端值等等情况，使得你这个答案，和实际情况不太一致，你准备了100碗，结果今天有110个人来买，找谁哭去？这个时候，你就想，嗯，我应该指定一个范围，聪明！统计学家也这样想，那么这个范围怎么算，就是这里说的置信区间：

......手机答题公式里面有希腊字母打不出来求放过的分割线……

如果你猪脚店的均值100，方差30，那么标准误就是5.5，这时你的范围就是100-Za*30/5.5至100+Za*30/5.5之间，这个a就是置信系数，所谓95％的置信区间，就是在正态分布中，这个值是1.96，也就是算出来100-1.96*5.5至100+1.96*5.5之间，也就是89至111之间，嗯，对啦，李老板你就准备这个数就好啦~

什么，你说店里今天卖了112碗，哼，才不是我算错呢，是因为这个范围发生的可能性是95％啊，也就是说，出现在这个范围的可能性并不是100％呢~

李老板内心os：你tm在逗我？再说这么大范围我怎么备货？

想把范围缩小？没问题，把z变小好啦，不过事先声明z越小，这个a越小，也就是说，这个范围发生的概率就小啦~完全可以改，那，发生概率不到30％你不要怪我哟~

综上，置信区间其实是对真实情况估计的结果。重点是在于这个置信水平，置信水平越大，也就是说越可能包含真实结果，为了保证结果被包含，这个范围就越宽泛。

那是不是一定要95％？

不绝对，95％只是统计学上的约定俗成。能改，回看上上一段，你要冒着结果并不能大概率正确的风险~

编辑于 2016-02-03

赞同 6122 条评论

分享

收藏感谢如何理解 95% 置信区间？

知乎用户

9 人赞同了该回答

The ‘95%’ means that, in repeated sampling, we expect around 95% of calculated CIs to contain the true value of the parameter. Note, it does NOT mean that there is a 95% chance that the
interval will contain the true value in any one application (it either does, or it does not).

It's quite simple in English.

编辑于 2016-01-26

赞同 93 条评论

分享

收藏感谢

11 人赞同了该回答

看大家答的挺high，我也来！
在我看来，题主的问题分为两部分，一是置信区间，二是为啥这个区间一般取95%.

关于置信区间，每本统计学的书都会讲到，也会配上实例，题主可以多体会。这个概念其实可以归结为常识的数学表达。现实中，如果我们按常理推测有事情不会发生，可惜他确实发生了，那肯定是我们的推理依据错了。翻译成数学语言就是，一个小概率事件（发生概率<1-95%），从统计意义上说（根据过去数据建立的概率模型）不应该发生，结果发生了，那和这个小概率事件等价的命题就很大概率被拒绝（”错“的，就是我们的经验不支持这个结论）。
我一般是把这个方法类比为反证法，假设（小概率事件），推导出矛盾（不应该发生却发生了），那肯定是原假设有问题，不采纳。

偏个题，我特别喜欢拉普拉斯这句话， probability is nothing but common sense reduced to calculation. 统计也一样，都是一些常识转换成数学运算，理解它要从常识出发。

第二点，为啥一般取95%，这个数据大概是对应着20次重复，会出现一次小概率事件吧，1/20 说少也不少，我的感觉是这个数值应该是个经验数值（拍脑袋？），也可能是假设检验这套理论建立起来的时代引入的，符合当时的时代要求，具体也没看到过有讲这个的来历了。
不过完全可以不是95%，很多地方就推荐97%， 99%也是有的。那到底应该取多少好呢？这个问题是统计理论本身无法回答的。要按照实际需要来。
举个例子，一批产品，我们要求要判断这批产品合不合格，这就是一个假设检验的问题。那具体多少不良率才算不合格呢？要知道不良率定的越高，越容易达标，但是残次品多就卖毁招牌；如果不良率订低了，产品要返工，增加成本。所以这个不良率肯定是一个折衷，成本和品牌要兼顾。这就不是统计理论的问题了，是对市场的判断问题。
具体的比如，一般的汽车，我们要求它不出问题的概率 > 99% 就OK了, 那置信区间可以取99%; 一般电信系统，就是移动联通用的，行业标准是5个9，可靠率 > 99.99999%, 因为一般来说同一时间，电信公司要服务成千上万的用户，如果一分钟内有1千万用户接入，那掉话的用户应该 < 0.0000001*10^8 = 10个，要知道用户掉话可以去告电信公司的；而最高的标准是航天，可靠性7个9，因为这些东东飞出去了就基本上没法修了，要是出了问题损失就大了，更不用说如果是载人航天，人命关天。

发布于 2015-11-05

赞同 118 条评论

分享

收藏感谢

卖萌的饭盒

走吧薇恩，已经过去太久了，他们快忘了被暗夜猎手统治的恐惧了

2 人赞同了该回答

以下全是个人理解，如有错误请指正。95％置信区间验证的并不是求出的区间有95％的可能包含所要估计参数的值，而是在误差存在的情况下，我们构建的抽样方法和统计方法，有95％的可能能够构建出一个包含参数的区间。本质上说的是统计方法成功的概率，也就是说我们用这种方法抽取不同的样本，得到的结论可能不同，区间可能有很多，但是有95％的区间都包含参数，也就是成功的可能性为95％。

发布于 2016-01-23

赞同 2添加评论

分享

收藏感谢

2 人赞同了该回答

根据置信区间的定义和构造，95%的置信区间就是构造出来的区间覆盖真值的概率是95%，注意这里的区间是个随机变量，样本不同就会不同，随意一个样本根据已构造的区间估计代入计算，这个区间可能包含真值，也可能不包含，但大量的样本计算下来，就有95%这么多的区间包含真值。

发布于 2015-11-14

赞同 21 条评论

分享

收藏感谢如何理解 95% 置信区间？

知乎用户

3 人赞同了该回答

这个困惑每个学生都会有，我不做具体的解释，说一些别的。

我们用局部来估计整体，其实怎么说都行，反正没人能真的掌握到整体。那么如何证明我们估计的正确性，这是统计的底层思想，置信区间就是这种思想的重要组成部分。

换句话说，如果你在学习一本“概率与数理统计”的教材，到了统计部分，请不要用学数学的思想来学习。你现在需要理解的是一套全新的想法，置信区间是这套想法其中一环，整个假设检验就是要判定估计的合理性。

如果有机会接触机器学习的理论，你会知道，同样是局部估计整体，机器学习使用了另一套检验方式，也就是成长函数，那样又会是另一种思维模式。

再叮嘱一次，这不是数学，不要试图用数学思维去理解它，它并没有数学般的严谨。

发布于 2015-01-21

赞同 311 条评论

分享

收藏感谢

9 人赞同了该回答

看了几个回答，有的人回答侧重为什么是95%，有的人侧重如何理解这个概率，最后还是去看了看书，其实很简单的东西，我把两页精华贴出来。有知识背景的同学，直接看第二张图就ok。

如何理解 95% 置信区间？

如何理解 95% 置信区间？

编辑于 2017-12-10

赞同 91 条评论

分享

收藏感谢收起

学生

10 人赞同了该回答

我从公式推导的视角回答一下这个问题吧。假设总体的平均数已知为μ，标准差为σ，那么样本的平均数X服从(0，(X-μ)/σ)的正态分布，这里X是一个统计量。对于所有可能的X取值而言，有95%满足公式-1.96<=(X-μ)/σ<=1.96 ，对于另外的5%，则不满足。置信区间的公式为X+-1.96*σ ，即前面公式的变形，完全体为X-1.96*σ<=μ<=X+1.96*σ ，所以，仅有95%的X所构造出的置信区间，才包含总体真值，另外5%的X，绝对不满足此不等式。所以，我们不能说总体参数落入某一构造区间的概率为95%，而应该说，我们有95%的把握，确信总体均值包含在所构造的区间中。

应该比较好理解~

编辑于 2016-03-20

赞同 104 条评论

分享

收藏感谢

个人觉得这个和小概率事件的定义是密不可分的
要理解置信区间，不妨看看假设检验的三种方法，其实是同一种方法向着数据端演化来的。
（比如我要看0<x-1<2，这个不等式是不是对实验数据“2”成立了，方法三就相当于已经把x单独提取出来成了1<x<3了，发现2是成立的，这就是算置信区间的方法，其实原来0<x-1<2不等式才是体现小概率事件思想的）

方法一：（算显著性）判断数据是不是小概率
一开始我们就定义发生概率低于alpha=5%的事情为小概率事件（这个是人为取定的，或者1%）
假设推断就是在假设成立的条件下，去看实验数据是不是小概率事件，找枢轴量方法等等，如果是发生率是5%，啊哈，一次数据居然是小概率事件，这个不太可能出现啊，所以我会拒绝假设。

方法二：（算p值）判断数据折合为一个随机变量后在小范围的概率（见林青青同学的图）
同样p值，回到我们定义小概率事件的alpha时，如果alpha取太大，就更可能拒绝原来假设（发生概率10%你都认为是小概率而拒绝了，要求更严格），alpha太小容易接受，这时我们先不取定alpha的值，发现alpha取p这个值的时候刚好拒绝原假设，这个就是p值，p值是针对已有的数据得到的。Fisher等人支持直接用p值决定拒绝与否，习惯一般p小于0.01就强有力拒绝，等同于你用显著性判断方法一开始定义1%的是小概率事件，结果数据还发生了。
注意:这个p相当于折合到另一个随机变量取值在一个末端的小范围的概率，而不是指数据这样取发生的概率，数据的取值是连续的，只能用概率密度函数来描述，不能直接用概率。

方法三：（算置信区间）每次数据都去算个p值太麻烦了，约定好了alpha后，我直接把需要算的都先算好，得到一个区间，看数据统计量是不是在这个区间，不在就拒绝。
为了让判断更方便一些，我们直接得到一个区间来统计值是不是在此之内，95%置信区间就是对一个参数做出的假设范围，如果实验得到在这个范围，就可以说不再我们之前定义的小概率事件内，就说没有主够的理由拒绝。

发布于 2015-12-29

赞同添加评论

分享

收藏感谢

RA|大数据|交通模拟Aimsun|摄影爱好者|Js.Go.Python.R.Cpp

3 人赞同了该回答

举个栗子。
小X手机厂商承诺最高温度不超过40°C，作为消费者我们怎么检验呢？
假设我们有一百台小X手机，取一万台的平均最高温度，超过40°C就算不合格吗？
不，在概率上，我们假设一个95%的置信区间(confidence interval)。这个表明，假如我们每次测试一百台手机，测试无限多组，这些组里会有95%的平均温度值不超过40°C。

发布于 2016-06-02

赞同 31 条评论

分享

收藏感谢如何理解 95% 置信区间？

知乎用户

4 人赞同了该回答

首先举一个栗子，引入置信区间的概念：
假如你们家阳台下面有一个井盖，你从窗户中扔出一枚硬币，硬币可能落在井盖上，也可能落在井盖外面，这是个概率问题，但是有一个共识：井盖的半径越大，落在井盖上的概率也大。如果井盖的半径无限大，那么落在井盖上的概率就是1，如果井盖的半径趋近于零，那么落在井盖上的概率就为零。也就是说，给定一个概率值，就对应一个半径大小（假设抛硬币这件事情服从某种分布）。例如答主要求做一个井盖，使得硬币落在井盖上的概率是95%，那么我就会给你做一个半径为R的井盖（R为某个值），这个井盖边界以内的区域都是概率为95%的置信区间。一般来说，给定概率值越大，置信区间范围越大；概率值越小，置信区间范围越小。
另外，为什么一般都用95%呢？，这个与正态分布有关。
自然界许多概率分布问题都符合正态分布，甚至连考试调分老师都要强行正态分布。。。不过好在本人一般处于如何理解 95% 置信区间？的置信区间，嘿嘿。
正太分布就是下面这货

如何理解 95% 置信区间？

它由两个参数来决定，一个是如何理解 95% 置信区间？，另一个是，表示概率最大时所对应的x轴区间位置，表示曲线的高矮胖瘦（小，图像矮胖；大，图像瘦高，表示概率集中程度，如下图不同的和所代表的分布图像）

如何理解 95% 置信区间？

（注：以上图片源自百度图片）

一般来讲，我们只要知道事件发生区间为（如何理解 95% 置信区间？）的概率就够了，此时的概率由图1可知，反过来说，概率为95%时，置信区间约为（），所以95%就由此而来了。

编辑于 2016-01-26

赞同 42 条评论

分享

收藏感谢收起如何理解 95% 置信区间？

知乎用户

31 人赞同了该回答

这个问题涉及到区间估计，是点估计的升级版，不仅仅给出一个参数估值，还给出一个参数估值误差范围。大家可以自行查书或者百度。
###以下为原答案
详细来讲，这个问题可以拆分成几个问题，
1、什么情况下用到置信区间？（when，what）
2、为什么置信度(一般)取95%？
容我一一解释。

#####1、什么情况下用到置信区间？
举个简单的例子，
说我有1亿个球，有白的，有红的，这1亿个球就是“总体”。我想知道这个总体中，白球的比例，a。
那么问题来了，由于条件的限制，我没时间数一亿次。
咋办呢？
我随机取100个球，来估算a。这一百个球就是“样本”。
我假设抽取样本的过程是随机的，那么我就能根据样本的情况，按照某个标准得出一个样本统计值的范围，a落在这个范围的概率等于95%，这个范围就是a的95%置信区间。

#####2、为什么是95%？
我可以给出白球比例a的的100%置信区间[0,100%]，有任何意义么？
我也可以给出白球比例a的10%置信区间[60.1%，60.2%]，只不过有90%的概率a落在这个区间之外，这个区间有任何意义么？
置信度取100%或者太小都没有意义，那置信度为什么（一般）不多不少，恰恰要选择95%呢？

因为5%是小概率事件的标准（判断的概率标准可以取1%或5%，根据具体需要。但是一般不高于5%。）。如果a有95%的概率落在[60%,61%],那么a落在这个区间之外的概率只有5%。换句话说，“a落在区间[60%,61%]之外“这个事件就是小概率事件。
而一般在一次试验中，小概率事件不可能发生。

编辑于 2015-11-05

赞同 3112 条评论

分享

收藏感谢

金融媒体丨ENFP丨有问必回 | 随时私信小窗

22 人赞同了该回答

什么！！又是上课讲到的！！知乎好笔记啦啦啦~~~
先说短答案：95%的置信区间，有95%的可能性包含了那个只有上帝才知道的总体期望的区间是[5-10]小时。（假如你睡觉时间95%的置信区间是【5-10】个小时，那么【5-10】这个区间中恰好包含了真实平均睡眠时间的概率是95%）。
可能不如其他答案好理解，但是这是根据置信区间的概念得出的答案，因为置信区间就是根据这个理论基础求得的。
题主，你要炒栗子，我们在炒栗子之前先做一点准备工作。
中心极限定理：说的就是多个样本的平均数，他们的分布符合正态分布（什么是无偏估计？ - Zhang Calvin 的回答;）
所以真实的样本均值的分布如图

如何理解 95% 置信区间？

所以我们开始取平均值的时候不应定就取到均值的期望，但是从图中可以看出，离真实的均值越远概率也就越小。
还是不好理解，那我们先看道题：
有一个生产CD的厂商，我们从它的一批货中取出50个CD，做检测，最后发现其中的有10个次品。
求有95%可信度的次品率。
如何理解 95% 置信区间？ =10 样品中次品概率p=0.2
因为样本中次品数量均值的分布符合正态分布，所以有公式

如何理解 95% 置信区间？

95%的置信区间，所以100（1-α）=95 ，α/2=2.5 ，
查正态分布表（是百分比那个表，在下面）得到如何理解 95% 置信区间？ =1.96 ，
因为这个题中的CD次品数量符合二项分布，方差=np(1-p)
s/=p(1-p)=0.2*0.8=0.16 *(s/)=0.31
所以，这个所要求的真实次品个数在区间[9.69,10.31]的概率达到95%.

如何理解 95% 置信区间？

还有一点，就是
欢迎拍砖，不理解的地方再评论，共同探讨，有问必答。

其实大家假如看了评论就知道，我和@五仁馄钝有一点不愉快的争吵，首先我认错，我的语气确实不对，还带着自己的骄傲。
可能我真的实力智力欠佳，但是我一直抱着一颗感恩分享的心在知乎答题。
有时候我真的在这个没有人认识我的地方倾心吐意，有时候也只是写给自己，有时候也做自己的笔记本，并不没有把这里当成自己展现的平台。
知乎带给我很多，谢谢知乎。

另外五仁馄钝的评论我实在看不懂，求看懂的给个解释。

编辑于 2017-06-06

赞同 2234 条评论

分享

收藏感谢收起

岁月是一场有去无回的旅行好的坏的都是风景。

3 人赞同了该回答

简单的就是说，如果我们采用这个方法来估计参数，有95%的把握认为我们得到的结果是对的。

比如，我们要根据一系列样本来估计参数a
那么，我们可以定义这样的一个量：它由a表示，但它的分布，却不依赖于a。我们将这个量称作枢轴量。
例如，如果a是方差已知的正态分布的均指，设样本均值是如何理解 95% 置信区间？，那么，服从已知的正态分布，我们就可以称作b是枢轴量。

容易看出，枢轴量有两点性质：1.分布已知，2.包含未知参数的信息。

我们将估计a的枢轴量记作f（a，X），这里，X表示样本。因为枢轴量的分布已知，我们便有可能找到这样的区间[bl,bh]，使得如何理解 95% 置信区间？的概率大于95%，更近一步，如果能够求出和不等式等价的不等式，我们便可断定，a落在区间的概率不低于95%，即该区间是a的置信度为95%的置信区间。

编辑于 2018-02-20

赞同 3添加评论

分享

收藏感谢

DON'T PANIC!

8 人赞同了该回答

频率学派下认为，95%置信区间指的是在完全相同的100个平行世界里作此实验，平均意义上有95次，未知参数的真实值落在此置信区间内【1】。

【1】Y. Xue, A Statement at Kitchen When Boiling Instant Noodle at Midnight. Jan. 2016

发布于 2016-01-31

赞同 83 条评论

分享

收藏感谢

风机数据分析师

4 人赞同了该回答

最简单的思考方式，以均值的置信区间为例，你收集了一组样本得到了样本的实际均值，由这个推断得出的置信区间可理解为，如果你再去获取同样样本量的样本组计算其实际均值，那100个样本均值里面有95个都会落在前面计算的区间里面。可否理解

发布于 2016-01-07

赞同 4添加评论

分享

收藏感谢

道友你好

4 人赞同了该回答

一个关于置信区间通常的误解是，真值有95%的可能落在这个区间内。这种理解是错误的，给定一个区间，真值要么在里面，要么不在，没有随机性，这是个可以确定的事件。
正确的理解是，这一百个区间里，有95个是包含了真值的区间，有五个是无效的没有包含真值的区间。

发布于 2016-11-21

赞同 45 条评论

分享

收藏感谢如何理解 95% 置信区间？

知乎用户

3 人赞同了该回答

引自百度百科“置信区间”：

“置信区间是指由样本统计量所构造的总体参数的估计区间。在统计学中，一个概率样本的置信区间（Confidence interval）是对这个样本的某个总体参数的区间估计。置信区间展现的是这个参数的真实值有一定概率落在测量结果的周围的程度。置信区间给出的是被测量参数的测量值的可信程度，即前面所要求的“一定概率”。

这个概率被称为置信水平。举例来说，如果在一次大选中某人的支持率为55%，而置信水平0.95以上的置信区间是（50%,60%），那么他的真实支持率有百分之九十五的机率落在百分之五十和百分之六十之间，因此他的真实支持率不足一半的可能性小于百分之5。如例子中一样，置信水平一般用百分比表示，因此置信水平0.95上的置信空间也可以表达为：95%置信区间。置信区间的两端被称为置信极限。对一个给定情形的估计来说，置信水平越高，所对应的置信区间就会越大。”

发布于 2016-11-15

赞同 3添加评论

分享

收藏感谢

2 人赞同了该回答

其实置信区间用集合比较好理解：
统计推断，用样本估计总体，小集合⊂大集合。
95%置信区间，就是说95%的可能下，小集合得出的统计数据是反映大集合的。

发布于 2016-03-29

赞同 2添加评论

分享

收藏感谢

今天是星期天吗？

2 人赞同了该回答

说好的言简意赅呢！
95%的置信区间和90%、99%等等的置信区间其实都是统计学约定俗成的概率区间（为什么是95%见最高赞数回答），是拿来验证数据关系的，在做基础的商业数据分析时，肯定会用到。下面会举例。
首先，“95%的置信区间”翻译成白话文就是“有95%的理由相信”，样本检验里会记做“0.05的显著性水平下”（因为把概率记成小数：1-0.95=0.05）其实都是一个意思，即此数据（数值或概率）出现的概率大于或等于95%。
举个例子：
就好比你的考试成绩，如果你把你一整个学期的成绩列出来，求出均值、标准差然后开始做正态分布图，最后要做出你分数的95%的置信区间。假设80分的成绩就是你整个学期成绩的均值，那么可想而知，你的所有成绩都是在80分左右徘徊（如果数据越多，应该就有越多数据接近均值），套公式求出区间对应的数值呈现在正太分布图上大概是这样

如何理解 95% 置信区间？

（因为图形是对称的，最中间的是均值，95%的区域是虚线里的部分，虚线左右各自可以延伸到正副无穷，所以95%的置信区间在图上对应的数值，其实是利用两个1/2个5%求出来的，也就是图上所述的0.025）反正就是利用公式求两个数值。
假设！这两个数值求出来，一个是75一个是90，那么也就是说75分—90分就是你整个学期成绩的95%的置信区间。
用我的语言翻译成白话文就是：我有95%的理由相信，你可以考到75分到90分。
是不是有点奇怪？换句话就是，你有95%的成功性，考到75分至90分的成绩，这个成功性是根据你以往的数据得出的。

编辑于 2016-02-02

赞同 2添加评论

分享

收藏感谢收起

黄彬彬Margaret

入心理学专业坑第七年了

2 人赞同了该回答

如何理解 95% 置信区间？

接下页：不让人怀疑H0的正确性，从而做出拒绝H0的判断。

发布于 2015-11-17

赞同 22 条评论

分享

收藏感谢

南京老吴Ligeia

统计学本科

1 人赞同了该回答

我们从定义上来看什么叫confidence interval, estimate ±critical value * standard deviation (standard error)

我们先看estimate, 统计上最基本的定义是说，因为各种各样的原因，我们没有办法来确定population true mean，比如说我想研究全世界所有人的血压情况，每一秒都有人出生，每一秒也都有人死亡，我们不能采集到所有人。而且我也没有办法同时影分身去所有国家采集数据。那么我们就想到了一个办法，通过抽样调查的方法，得到一个具有代表性的样本，我们通过研究这个样本，得到一些结论，然后用于估计整个population的情况。那么我们在这个样本里算出来的平均血压就是我们的estimate, 我们用这个所谓的平均血压来估计我们的population的平均血压（true mean）

critical value, 以Z举例，在计算的时候，我们在表里面可以找95%对应的Z。Z是干嘛的呢，在normal distribution 上，我们有一个著名的定律是说，68%, 95%, 99.7%, 什么意思呢？在mean ±一个standard deviation的距离内，我们可以默认这个normal distribution包含了68%的数据，mean ± 2个standard deviation的距离内，我们的normal distribution 包含了95%的数据，mean ± 3个standard deviation的距离内，我们的normal distribution 包含了99.7%的数据。这是什么意思呢？可以理解成，在Z等于1.96的时候，我们可以说，我们的Z是包含了95%的数据，或者说，包含了我们所有采集到的血压值的95%的数据量。

剩下就是standard deviation / standard error了，他们的区别就在于，在整个population里面，我们得到的叫standard deviation, 在sample中，哪怕再具有代表性的样本，也不可能百分百的包含我们所有的population的情况，都会存在或多或少的bias，所以我们就说这个是standard error。那么在这个情况在，我们的standard error描绘的就是我们的数据的波动情况。

现在我们结合起来看，所谓的confidence interval说白了，就是我有95%的自信可以说，全世界人的血压的值，介于（a, b）之间，也就是说，如果你手上有population true mean的情况（假设你有），你的这个true mean有95%的概率会落在我的这个interval 里面（100次中平均下来有95次）。

换一个角度来理解，什么叫100%的confidence interval？也就是负无穷到正无穷，用人话说就是，我有100%的把握，全世界人的血压值介于负无穷到正无穷之间，google的股票的价格我也有100%的把握会介于负无穷和正无穷之间。但是95%的话，我们就可以得到，在不说废话（100% confidence interval就是废话）的情况下，我们对于一个特定的问题的估计的值（比如说血压情况，平均寿命等等）

发布于 2017-12-14

赞同 11 条评论

分享

收藏感谢收起如何理解 95% 置信区间？

知乎用户

1 人赞同了该回答

如何理解 95% 置信区间？

有问题欢迎大家指正

编辑于 2017-10-21

赞同 12 条评论

分享

收藏感谢收起

争做元气少女╮(╯▽╰)╭

1 人赞同了该回答

书上解释：

Correct interpretation:

We are XX% confident that the population parameter is between...

Incorrect language might try to describe the confidence interval as capturing the population

parameter with a certain probability. This is a common error: while it might be useful to

think of it as a probability, the confidence level only quantifies how plausible it is that the

parameter is in the interval.

Another important consideration of confidence intervals is that they only try to capture the population parameter. A confidence interval says nothing about the confidence

of capturing individual observations, a proportion of the observations, or about capturing

point estimates. Confidence intervals only attempt to capture population parameters[1].

拙劣地翻译一下o(╯□╰)o：

正确的解释：

我们**%（95%）确信总体参数在***与***之间

而错误的解释试图将置信区间描述为以某种概率捕获总体参数。这个常见的错误在于：尽管将置信水平视为一个概率非常有用，但置信水平仅仅量化了总体参数落入置信区间的可信度。

另一个有关置信区间的重要概念是，置信区间仅用于描述总体参数。与单个观测的捕获、多个观测的比例及点估计的捕获均无关。置信区间仅用于描述总体参数的捕获。

个人理解：

从定义上看，置信区间是指重复多次采样（比如重复100次采样，每次1000个样本）。为这100次采样构造100个置信区间，那么其中有95个置信区间会包含真实的总体参数（如总体均值）。

注意，总体参数是一个不知道的常数，置信度95%描述的是置信区间包含该总体均值的可信度。

[1]：OpenIntro Statistics, 3rd edition(a free online introductory statistics textbook co-authored by Dr. Cetinkaya-Rundel)

发布于 2017-09-12

赞同 11 条评论

分享

收藏感谢收起

是否具有独立思考能力，决定了一个人是否具有独立人格。

1 人赞同了该回答

概率是一个随机的范畴，仅发生在构造“某一个”置信区间之前。你可以认为“接下来将要”构造出来的那个置信区间有95%的概率包含真值。但是你一旦构造出来了，这个概率事件已经结束了，要么发生了95%的那部分，要么发生了5%的那部分，你不能在这个时候说我构造出来的这个置信区间95%的概率包含了真值。
就好比刮刮卡，一个箱子里有100张刮刮卡，有95张是“谢谢惠顾”，有5张是“中奖”，你只能说你有5%的概率抽到一张“中奖”的刮刮卡，但一旦你已经抽出了一张刮刮卡，这个概率事件已经结束了，你要么抽到了，要么没抽到，你不能拿着你抽出的那张刮刮卡说：“这张刮刮卡有5%的概率中奖。”
对于n%置信区间只能表达你构造100个n%置信区间，那么有n个置信区间包含了真值。
因为置信区间构造的时候用样本标准误代替了总体标准差，而不同的样本有不同的标准误，所以就会有产生同样的构造方法得到不同的置信区间。
这是经典频率学派和贝叶斯学派对于置信区间的不用解释。但事实上频率学派解释置信区间时用的就是Confidence Interval，贝叶斯用的是Credible Interval

编辑于 2018-04-07

赞同 15 条评论

分享

收藏感谢

1 人赞同了该回答

好吧，我只能说打一开始我就不明白大家是怎么知道样本差是正态分布。因为钻牛角尖始终被卡在最基本的第一个条件上，所以从规定某某是正态分布的第一步开始，之后的所有分析我都从来没有听懂过，全靠套用公式答题。我就是传说中可以通过考试，但从来没搞清楚过到底自己在干什么的统计小白。。。

发布于 2016-11-10

赞同 12 条评论

分享

收藏感谢

暗中观察者

我全都要!

1 人赞同了该回答

心理学专业路过，表示在心理学当中会用到心理统计学，而0.95置信水平就是说某个事件经过套公式检验以后一旦我的数据落在了正态分布或别的什么分布的以期望值为中点的一个区间里面那我就有95％的把握说它是对的

编辑于 2016-10-29

赞同 12 条评论

分享

收藏感谢

天有天的晴朗

应数专业，金融民工

1 人赞同了该回答

谢

邀
个人感觉题主可能是想要一个相对通俗好理解的回答，于是就不用专业的术语来回答这个问题了。
通俗的描述95置信区间，就是说当一个事件A发生时，我有95%的把握认为B是正确的。
举个例子的话，街上有100家店做烤肉，有95家是韩式烤肉店。那我吃到烤肉就觉得是韩式烤肉在95%置信区间内是正确的。

发布于 2016-09-11

赞同 1添加评论

分享

收藏感谢

1 人赞同了该回答

橙卡几率百分之一一包卡包五张平均20包里出一包所以开出橙卡基本是不可能这应该有具体的体感

发布于 2016-07-06

赞同 11 条评论

分享

收藏感谢

1 人赞同了该回答

感谢大家细致解答，很有收获，抖个机灵，分享一图，也许各位大神有天还能用上，哈哈。

如何理解 95% 置信区间？

发布于 2016-03-19

赞同 1添加评论

分享

收藏感谢如何理解 95% 置信区间？

知乎用户

1 人赞同了该回答

95％置信区间是和假设检验水平alpha＝0.05对应的。
以两样本t检验为例，一方面可以计算t值、P值，另一方面可以计算组间均数差值x1bar-x2bar的95％置信区间。当P大于0.05时95％置信区间包含0点，意味着组间差异不存在；当P小于0.05时95%置信区间不通过0点，意味着组间差异存在。
（手机码字，说得不是很严谨，见谅）

发布于 2016-03-04

赞同 11 条评论

分享

收藏感谢

泛若不系之舟

1 人赞同了该回答

举个栗子
套圈游戏，圈就是“置信区间”，而小玩具是“真值”。显然，圈越大，我们套中玩具的概率越大。而所谓95%，就是我闭着眼睛扔圈，有95%的概率套中玩具。
正文结束。ps，如果要100%套中玩具呢？圈必须无限大，所以1的置信区间为【负无穷，正无穷】

编辑于 2016-01-26

赞同 1添加评论

分享

收藏感谢

关注数据与创新、正义及效能（专栏：一图一书）

1 人赞同了该回答

把问题分解为：问题1“何为置信区间”；问题2“为何采用95%”。

针对前者，置信区间讲的是样本“区间估计”与“总体参数”、动静两方间的关系，理解的关键在于：

动方：某次实验的“区间估计”可大可小，你选定的“区间估计”——它是以某个较大的概率（如95%）包含了总体参数，出错为小概率事件（如5%）；
静方：但这并不代表以静制动的“总体参数”以95%的概率存在于“区间估计”，它只有2种可能，要么存在（100%概率），要么不存在（0%概率）。

2. 针对后者，这起于费雪Fisher，源于经验值，实务中可根据样本量、分析场景修改。

详细可以去看弗里德曼等合著的《统计学》，深入但浅出。

编辑于 2016-01-23

赞同 1添加评论

分享

收藏感谢

宏观经济，经济增长，羽毛球

1 人赞同了该回答

要估计量的真实值是不动并且看不到的，通过随机抽样我们可得到一组样本，对样本回归后就可以得到该估计量的一个估计值，从而也能够确定与这组样本相对应的估计值的置信区间。95%置信区间并不是指真实值落在该组样本得到的置信区间内的概率为95%。因为样本一旦确定下来，其置信区间也就固定下来，同时真实值也是不动的：对于一个固定的区间和一个固定的值，真实值要么落在该置信区间内（概率为100%），要么在置信区间外（概率为0）。此外，真实值是看不到的，所以你根本不知道真实值是否落在该置信区间内。其他答案中有人提到：“该置信区间刚好包含着真实值的概率为95%”，这种说法个人认为是不对的，因为前面已经提过，要么包含，要么不包含真实值。
但是可以从另一个角度理解，假设我们再重新进行许多次随机抽样（n次），得到n组样本，每组样本可确定一个置信区间，从而有n个置信区间。95%置信区间可以理解为：在这n个置信区间中，有大概95%的置信区间刚好包含着真实值。

编辑于 2016-01-10

赞同 1添加评论

分享

收藏感谢

不可食用的小动物

一个玩鸭子的丧志少女

3 人赞同了该回答

我的统计学挂了…所以说风笑天的那本《社会研究方法》我看了两遍…

一遍是在考试前

一遍是在补考前

至于95%的置信区间，学渣只想说“为什么1+1=2 ？”

认真你就输了，上帝知道答案。

如何理解 95% 置信区间？

编辑于 2016-08-15

赞同 3添加评论

分享

收藏感谢

数学历史 ai 物理都爱

1 人赞同了该回答

https://www.youtube.com/watch?v=uuNkp10T3_k 这个视频讲的很清楚

发布于 2017-05-26

赞同 1添加评论

分享

收藏感谢

R语言

关于这个问题研究了一下午。

首先要知道t分布和标准正态分布。

如何理解 95% 置信区间？

如何理解 95% 置信区间？

如何理解 95% 置信区间？

因此，得出结论，试验数据不超过100的不应该用1.96，而是查t表df=n-1。

发布于 2018-04-13

赞同添加评论

分享

收藏感谢收起

FX

可以关注下日本质量管理的6西格玛(输入法找不到)，已经过几十年的验证造就了日本产品的质量神话

发布于 2018-02-05

赞同添加评论

分享

收藏感谢

混迹市井，心中有剑，偶尔脱离低级趣味的粗人

1、对于参数估计有点估计与区间估计；
2、点估计过于绝对化，不准确；区间估计是给总体参数一个置信区间，总体参数落在在这个区间内可能性为95%。
3、找本统计书认真看看吧，例子，分类很多。

发布于 2014-11-06

赞同添加评论

分享

收藏感谢

华中科技大学研究生计算机系统结构研究分布式存储和处理

对于均匀分布和正态分布，可以理解为面积达到总体面积95%的那段区间

发布于 2014-11-01

赞同添加评论

分享

收藏感谢

统计分析爱好者

某区间包含预测真实值的概率是95%

发布于 2014-11-01

赞同添加评论

分享

收藏感谢

系统与信息工程

如何理解 95% 置信区间？

重要的话再重复一遍，随机变量是置信区间，而不是未知参数theta。所以直接解释不是theta落在区间的概率，而且一个随机区间包含theta的概率是95%。也就是当我们观察很多很多随机区间的时候，他们中间有95%是包含theta的。

发布于 2018-01-07

赞同添加评论

分享

收藏感谢收起

最近统计学刚学到这个，老师说回答的时候一定要注意表达。95%置信区间是，我有百分之95的信心，这个真实值会在这个区间里面。所以，它可能在，可能不在，只是我大部分自信觉得它在。

发布于 2017-12-17

赞同添加评论

分享

收藏感谢

会跳舞的金融民工

应用统计硕士

置信区间要么包含真值要么不包含真值。当你多次进行置信区间估计。那么你就可以求得一个这么多次中包含真值的概率。95%就是保证100次里面有95次包含真值

发布于 2017-12-12

赞同添加评论

分享

收藏感谢如何理解 95% 置信区间？

知乎用户

自己读一下wiki百科就知道了，Confidence interval

最高票答案

几乎完全翻译了这个词条的部分内容，大家理解一下就可以了。

我认为他的答案是最贴切，最有深度的。

编辑于 2017-06-01

赞同2 条评论

分享

收藏感谢

统计学

如何理解 95% 置信区间？

上图：
用SPSS 生成了 100个样本量为50 的样本，抽样总体为 µ=500的正态总体。
95%的置信区间就是说，用抽出的这100个样本来计算出的100个置信区间有95个是包含500的。（当然这个是在大样本的情况下才精确成立的）
你看上图的X28, i.e. 第28个样本就调皮地不包含500，这就是那5%的小概率事件了。

编辑于 2017-01-02

赞同4 条评论

分享

收藏感谢

手推挖掘机

不断尝试新语言，重复妄图掌握新乐器和绘图工具中

就是某种可能的结果正确的可能性

发布于 2016-11-18

赞同添加评论

分享

收藏感谢如何理解 95% 置信区间？

知乎用户

就是有95%的可能性在这个区间里，还有5%的可能性是随机导致的，比如说10次投硬币都是正面，结果期望算成了1，但是这种可能性是千分之一，所以期望小于1的置信度是99.9%

编辑于 2016-10-16

赞同添加评论

分享

收藏感谢

Talk is cheap (ง •̀_•́)ง

比如你测体重测了100次，每次都有点随机因素的误差，你根据这100个数据，求个平均数和方差，再查个t表要用到个常数，就能用公式能求出confidence interval ，一般默认都是95%的，那么你就有95%的把握说，体重的真值就在这个范围里。

发布于 2016-08-14

赞同添加评论

分享

收藏感谢

心理学上说当一个事出现的概率小于二十分之一，人们才把那个事定义为小概率事件，就是5％，所以置信区间是95％

发布于 2016-08-01

赞同添加评论

分享

收藏感谢

数据开发,数据挖掘工程师

不变的是我们要估计的参数,变化的是根据样本计算出来的参数的估计值,因为每次抽样得到的样本的值都是不同的,所以既然变的是估计值,那么置信区间所表示的概率肯定会落在这个估计值上的.

发布于 2016-07-01

赞同添加评论

分享

收藏感谢

包子铺/会计博士在读/ 潜水

一个没怎么正经学过统计，但却又要使用这些概念的人来说，比如我，置信区间是一个常见却又令人困惑的概念。统计学是很多专业的必修课，也是现代科学研究的必须工具。但是不当使用P值或者CI也是现在不少领域的通病。

American Statistical Association (ASA) 在 "The ASA's statement on p-values: context, process, and purpose." 一文开头讲的一段对话一样，寻找显著好像和科研划上了等号。

Q: Why do so many colleges and grad schools teach p = .05?
A: Because that's still what the scientific community and journal editors use.

Q: Why do so many people still use p = 0.05?
A: Because that's what they were taught in college or grad school.

李大猫的答案中指出的常见错误，或者是暧昧的解释。甚至也会出现在大学的网站上。尽管下面的这段话暗示了CI是随机变量，但是后面的解释还是给人一种95%概率的感觉，即使这里使用的是confidence这个词。很多时候，尤其不是统计或者数学这样科班出身的同学，比如我，对这样的解释，很容易产生误解。

Confidence Intervals and p-Values

We also noted that the point estimate is the most likely value, based on the observed data, and the 95% confidence interval quantifies the random error associated with our estimate, and it can also be interpreted as the range within which the true value is likely to lie with 95% confidence. This means that values outside the 95% confidence interval are unlikely to be the true value.

下面这段就相对明确了。频率学派认为总体参数是一个常数，是确定的，所以对于这个参数，只有是不是（概率不是0就是1），没有所谓的有概率是多少或者在某个范围之内。

Understanding Hypothesis Tests: Confidence Intervals and Confidence Levels

The confidence level represents the theoretical ability of the analysis to produce accurate intervals if you are able to assess many intervalsand you know the value of the population parameter. For a specific confidence interval from one study, the interval either contains the population value or it does not—there’s no room for probabilities other than 0 or 1. And you can't choose between these two possibilities because you don’t know the value of the population parameter.

"The parameter is an unknown constant and no probability statement concerning its value may be made."
—Jerzy Neyman, original developer of confidence intervals.

相比CI，更多时候我们会参考一个和它相关的概念P值。通过P值，比如p=0.05，我们来检验估计是否在0.05水平上显著。p = 0.05 对应着 95%的CI。

You can use either P values or confidence intervals to determine whether your results are statistically significant. If a hypothesis test produces both, these results will agree.

然而需要注意的是，P值本身只能说明现有数据和一个统计模型有多么不相符，它并不能说明原假设成立，或者说备择假设为真的概率。较小P值也不能单独成为得出结论或者作出决定的依据。如果对某个变量的度量足够准确或者样本特别大，一样会带来显著，即便这个显著的factor背后几乎不能对最终的outcome产生有效的影响。就好比吃了樱桃核从而导致消化道中形成氰化物这个效应在统计上是显著的，但是实际上并没有什么用。

具体的原则还是请看下文，合理使用P值，不要把研究变成找显著。

The ASA's statement on p-values: context, process, and purpose

Wasserstein, Ronald L., and Nicole A. Lazar. "The ASA's statement on p-values: context, process, and purpose." The American Statistician just-accepted (2016): 00-00.

发布于 2016-06-02

赞同添加评论

分享

收藏感谢收起如何理解 95% 置信区间？

匿名用户

套用某本计量上看到的话

"假设做100次实验，有95次结果会落在这个范围内"…

当然只是个通俗易懂的说法…请别深究类似"抛两次硬币，一定一正一反"这类的…

发布于 2016-04-21

赞同添加评论

分享

收藏感谢如何理解 95% 置信区间？

知乎用户

95%你做了正确的决定。因为犯错的可能性比99%更高，所以95%可以有更苛刻的条件。(当然还是会发生1类和2类的错误)

编辑于 2016-02-19

赞同添加评论

分享

收藏感谢

又是统计学！好吧，统计学压根就没深入学习过。

发布于 2016-02-04

赞同添加评论

分享

收藏感谢

摄影爱好者，数据挖掘工程师

置信区间就是包含所要估计的真值的概率。

发布于 2016-01-26

赞同添加评论

分享

收藏感谢

sometimes ever,sometimes never

k=2

发布于 2016-01-26

赞同添加评论

分享

收藏感谢

一般而言，目标参数未知，但我们假设它固定不变。

基于已知的数据（样本），我们可以利用某种算法构建一个区间。一个样本对应一个区间的值。

数据的产生包含随机因素。在一万个平行时空，有一万个不同的样本，也就有一万个不同的区间值（即使它们都由同一种算法生成）。如果其中九千五百个区间值包含目标参数的值，我们就说：这种算法产生的区间是95%置信区间。

以上是frequentist的看法。

发布于 2016-01-23

赞同1 条评论

分享

收藏感谢如何理解 95% 置信区间？

匿名用户

这是区间估计中的一个概念。

这个概念的来源是：我们要用样本估计总体，用样本均值估计总体均值。因为很多时候我们是统计不了总体的，所以我们抽样，然后用样本来估计总体。

那么我们来抽样。

假设：样本均值是x，一个样本均值是估计不了总体均值的，那么，我们想办法构建一个区间[x-a,x+a]来估计总体均值，使得，总体均值Y有95%的可能在这个区间里面，我们称这个区间是95%置信区间。就是总体均值Y有95%的可能在这个区间里面。通俗点说就是：在不知道你平均每天睡多少个小时的情况下，我通过一些办法得知，你有95%的可能平均每天睡7-8个小时，7-8个小时有95%的准性，7-8个小时这个区间就称作95%置信区间。95%置信区间就是有95%的可能性总体均值落在构建的那个区间里面。

置于怎么构建这个区间，为什么是95%，这个都是有统计证明的。它还就是有这个么区间，使总体均值有95%的可能落在这个区间里面。

发布于 2016-01-06

赞同4 条评论

分享

收藏感谢

撕逼校尉草阿瞒

原假设分布的95%置信区间即在假设检验中确保一次检验中否定原假设时发生第一类错误，即否定正确原假设的概率在5%或以下。
若一次检验中检验值落入95%的置信区间，则说明否定正确原假设的概率大于5%，因此无法否定原假设。若一次检验中检验值没有落入95%的置信区间，则说明否定正确原假设的概率小于5%，那我们可以否定原假设。

发布于 2015-12-23

赞同添加评论

分享

收藏感谢

总体参数落入到这个区间的可能性为95%

发布于 2015-11-21

赞同添加评论

分享

收藏感谢如何理解 95% 置信区间？

知乎用户

for why 95 percent, due to wide applicability of normal distribution, two standard deviations interval, see this https://en.wikipedia.org/wiki/68%E2%80%9395%E2%80%9399.7_rule

编辑于 2015-11-07

赞同添加评论

分享

收藏感谢如何理解 95% 置信区间？

匿名用户

想从误差分析的角度说一说。
对一个样本(常量)，以某一方法，进行多次测量，得到一组测量值，建立一个置信区间。
有的说置信区间包含真值的概率(如何理解大家已经讲得很清楚了)是95%。这里用真值是不太准确的。
测量方法必然伴随误差，偶然误差可以由无穷次实验取均值消除，系统误差不是进行多次实验就可以消除的。
个人觉得合适的说法是：置信区间包含该样本无数次测量值的平均值(亦即:真值+方法的系统误差)概率为95%，而不是真值，不是下一个测量值，不是下一组(有限个)测量值的平均值，也不是同一水平的下一个样本。
另外注意区分一组样本，和一个样本的一组测量值。
确实感觉目前接触的分析化学类教材误差分析讲的很乱，从来没看明白过。
至于p为什么一般是95%，不清楚，也见过取90%，99%的。感觉是一个直观的描述，仅给出f,p,s, 如何理解 95% 置信区间？等，不够形象，也不方便对比。

发布于 2015-11-07

赞同添加评论

分享

收藏感谢

Ph.D in Civil Engineering

A 95% confidence interval [a,b] means: (let's assume the true value p)

There is a probability of 95% that this estimate, a<p<b, will 100% succeed.

There is a probability of 5% that this estimate, a<p<b, will 100% fail.

It does not mean the probability that p will locate within [a,b] is 95%. Recall that for example, the CLT tells us not the population distribution, but the distribution of "sample mean". It's an indication of the success of parameter estimation by many sampling groups.

发布于 2018-06-06

赞同添加评论

分享

收藏感谢

初级码农

《女士品茶》中文版134页：

“内曼认为，我们应该站在过程的角度看待置信区间，而不是盯着单独的结论。长期来看，对于总是计算95%置信区间的统计学家来说，在100次判断中，参数真值有95次落在置信区间内。请注意，在内曼看来，这个置信区间相关的概率并不是判断结论正确与否的概率。它与当前估计的“准确性”没有任何关系。”

内曼是假设检验理论的创始人之一。

发布于 2018-05-14

赞同添加评论

分享

收藏感谢

这个区间，以0.95的概率包含真实值。就这样一句话。

发布于 2016-07-15

赞同添加评论

分享

收藏感谢如何理解 95% 置信区间？

匿名用户

要理解置信区间就要理解中心极限定理。中心极限定理讲样本均值的抽样分布（sampling distribution of sample means)符合正态分布。这个分布的特点在于由无数个样本均值组成，而所有的样本均值的均值就是总体均值。

正态分布有一个规律叫68-95-99规律。在标准正态分布的正负1.96之间的曲线下的面积是曲线下总面积的95%。这里要明白正态分布曲线下的面积等同于发生的概率，因为总面积是1。

总体均值是我们做抽样调查最关心的。既然知道样本均值的抽样分布是正态分布就知道总体均值在正负1.96之间的概率是95%。但是抽样分布不都是标准正态分布，可以通过标准分转换一下。那么样本均值(x bar)加或减1.96倍标准误(standard error)之间得到总体均值的概率就是95%。

形象一些说类似于面对一个目标不断用套环去套。每一个套环就是抽样得到的一个样本均值。如果你需要套中目标的概率是95%，你需要做的套环有多大？

发布于 2016-06-17

赞同添加评论

分享

收藏感谢

………

你的概率论老师会给你很完美的解答

发布于 2016-06-02

赞同添加评论

分享

收藏感谢

题主应该知道假设检验吧，在假设检验中有一个概念叫做显著性水平，就是我们常说的&水平，这个希腊字母手机打不出来，相信题主懂得，我姑且用&来代替吧！&水平是一个很小的值，它被用于检测小概率样本。最常使用的&水平是5%和1%还有0.1%这个就很严格了。例如&=0.05将最不可能出现的5%的样本平均数（极端的值）与最有可能的95%样本的平均数（*的值）分开。如下图所示：

如何理解 95% 置信区间？

这样题主应该更容易理解了吧！

编辑于 2015-12-16

赞同添加评论

分享

收藏感谢如何理解 95% 置信区间？

匿名用户

就是你随便抓一次数据，落在这个区间里面的概率95%。落在外面的是5%。

发布于 2016-07-17

赞同添加评论

分享

收藏感谢

minimalism

5 人赞同了该回答

举个例子
你们班一共102个人现在要投票选出一个班长候选人有你和另外一个同学B 你们两个人不参加投票

你是个学神琴棋书画样样精通德智体美全面发展广受同学的喜爱
另一个同学B是个学渣混混上课不听讲专门欺负同学广受同学们的讨厌

但是现在B有5个好哥们他们选B的可能性比选你的可能性大的多

你们班投了N次票每次都有一两个人变动投票给你或者给B 但是总的看来总是有95个人投票给你

所以你当上班长的概率是(100-5)% = 95%
换句话说 “你当上班长” 这个事件概率为100%的可能性有95% 这95%就是置信区间

理想分布是这样的：

如何理解 95% 置信区间？

编辑于 2015-06-26

赞同 54 条评论

分享

收藏感谢收起

Boom啥咔啦咔

Public health

1 人赞同了该回答

为神马大家都要说的那么深奥呢？
ex：
在全校做一次抽样调查欲求大一女生身高的平均值，根据样本算出来统计量是165.0cm，区间估计结果是164.1-165.9。那么，这个区间包含了真实平均身高的可能性是95%。所以你做一百次调查算出来一百个置信区间，有95个区间包含总体真实值，剩下5个值是由于抽样造成的误差。