某医疗机构为了了解呼吸道疾病与吸烟是否有关,进行了一次抽样调查,共调查了515个成年人,其中吸烟者220人,不吸烟者295人,调查结果是:吸烟的220人中37人患病,183人不患病;不吸烟的295人中21人患病,274人不患病。根据这些数据能否断定:患肺癌与吸烟有关吗?患病不患病总计吸烟37183220不吸烟21274295总计58457515为了研究这个问题,我们将上述问题用下表表示:列2×2联表在不吸烟者中患病的比重是在吸烟者中患病的比重是7.12%16.82%上述结论能什么吸烟与患病有关吗?能有多大把握认为吸烟与患病有关呢?患病不患病总计吸烟aba+b不吸烟cdc+d总计a+cb+da+b+c+d列出2×2列联表假设H0:吸烟和患病之间没有关系即H0:P(AB)=P(A)P(B)其中A为某人吸烟,B为某人患病设n=a+b+c+则P(A)nbaP(B)nca故P(AB)ncanba吸烟且患病人数ncanbanABPn)(吸烟但未患病人数ndbnbanBAPn)(不吸烟但患病人数ncandcnBAPn)(不吸烟且未患病人数ndbndcnBAPn)(怎样描述实际观测值与估计值的差异呢?统计学中采用ncanbanncanbana22)(ndbnbanndbnbanb2)(ncandcnncandcnc2)(ndbndcnndbndcnd2)())()()(()(22dcbadbcabcadn化简得2(2观测值预期值)用卡方统计量:预期值来刻画实际观测值与估计值的差异.即独立性检验第一步:H0:吸烟和患病之间没有关系通过数据和图表分析,得到结论是:吸烟与患病有关结论的可靠程度如何?患病不患病总计吸烟aba+b不吸烟cdc+d总计a+cb+da+b+c+d第二步:列出2×2列联表用χ2统计量研究这类问题的方法步骤第三步:引入一个随机变量:卡方统计量第四步:查对临界值表,作出判断。dcban其中22nadbcabcdacbdP(≥x0)0.500.400.250.150.100.050.0250.0100.0050.001x00.4550.7081.3232.0722.7063.8415.0246.6357.87910.828P(χ≥x0)0.500.400.250.150.100.050.0250.0100.0050.001x00.4550.7081.3232.0722.7063.8415.0246.6357.87910.828828.102635.62706.22706.220.1%把握认为A与B无关1%把握认为A与B无关99.9%把握认为A与B有关99%把握认为A与B有关90%把握认为A与B有关10%把握认为A与B无关没有充分的依据显示A与B有关,但也不能显示A与B无关例如独立性检验通过公式计算患病不患病总计吸烟4920992148不吸烟42777...