1. 关注常识网首页
  2. 科普知识

样本容量怎么求公式(以付费阅读为例,如何通过样本量来提升测试效率)

样本容量公式:n=p*(1-p)/[E^2/Z^2+p*(1-p)/N],样本容量是指一个样本中所包含的单位数,一般用n表示,它是抽样推断中非常重要的概念。样本...

样本容量公式:n=p*(1-p)/[E^2/Z^2+p*(1-p)/N],样本容量是指一个样本中所包含的单位数,一般用n...更多样本容量怎么求公式的这个问题,以及大家所关心的以付费阅读为例,如何通过样本量来提升测试效率的内容,欢迎大家继续分享关注常识网。

样本容量怎么求公式

样本容量公式:n=p*(1-p)/[E^2/Z^2+p*(1-p)/N],样本容量是指一个样本中所包含的单位数,一般用n表示,它是抽样推断中非常重要的概念。样本容量的大小与推断估计的准确性有着直接的联系,即在总体既定的情况下,样本容量越大其统计估计量的代表性误差就越小,反之,样本容量越小其估计误差也就越大。合理确定样本容量的意义:1、样本容量过大,会增加调查工作量,造成人力、物力、财力、时间的浪费;2、样本容量过小,则样本对总体缺乏足够的代表性,从而难以保证推算结果的精确度和可靠性;3、样本容量确定的科学合理,一方面,可以在既定的调查费用下,使抽样误差尽可能小,以保证推算的精确度和可靠性;另一方面,可以在既定的精确度和可靠性下,使调查费用尽可能少,保证抽样推断的最大效果。样本容量与哪些因素有关1、样本容量与:研究对象的变化程度、所要求或误差的大小(即精确要求)、要求推断的置信程度等因素有关系。样本容量是指一个样本中所包含的单位数,一般用n表示,它是抽样推断中非常重要的概念。2、抽样推断(SampleInference)是在抽样调查的基础上,利用样本的实际资料计算样本指标,并据以推算总体相应数量特征的一种统计分析方法。统计分析的主要任务,就是要反映现象总体的数量特征。但在实际工作中,不可能、也没有必要每次都对总体的所有单位进行全面调查。样本容量带单位吗1、样本容量不带单位。样本容量是指一个样本中所包含的单位数,一般用n表示,它是抽样推断中非常重要的概念。样本容量的大小与推断估计的准确性有着直接的联系,即在总体既定的情况下,样本容量越大其统计估计量的代表性误差就越小,反之,样本容量越小其估计误差也就越大。2、样本(specimen)是观测或调查的一部分个体,总体是研究对象的全部。总体中抽取的所要考查的元素总称,样本中个体的多少叫样本容量。一般的,样本的内容是带着单位的,例如:调查某中学300名中学生的视力情况中,样本是300名中学生的视力情况,而样本容量则为300。

样本容量怎么求公式拓展阅读

样本容量怎么求公式(以付费阅读为例,如何通过样本量来提升测试效率)

以付费阅读为例,如何通过样本量来提升测试效率

编辑导语:AB测试若运用得当,则可以对产品优化、企业决策等多个情景有所帮助。本篇文章里,作者就以费阅读为研究对象,具体探讨如何提高测试效率的问题。感兴趣的话就一起来看一下吧。

样本容量怎么求公式(以付费阅读为例,如何通过样本量来提升测试效率)

前半章是案例,想看干货的可直接转到后半章。

如今ABtest已被广泛应用,是否经常遇到测试成本高、观察周期长、结果不清晰的问题?

本文将通过探究测试需要的样本量来达到提升测试效率的目的。

一、思路

1)定性分析:确定样本量和变量的关系。

2)定量分析:已知总体比例,计算抽样样本容量。

二、背景

以付费阅读行业测试书籍为例,计算已知总体比例的抽样样本容量。

三、案例

1. 数据获得

付费阅读行业经常会根据书籍推广测试的后续回收增幅来对书籍质量进行评估,以确定书籍是否有推广价值。现需要对某测试书籍后续回收做有效判断,观察周期为5天。

样本容量怎么求公式(以付费阅读为例,如何通过样本量来提升测试效率)

现已有书籍平均回收经验:

  • 累计1天ROI=20%时,对应累计5天ROI=40%
  • 累计1天ROI=22%时,对应累计5天ROI=42%
  • 累计1天ROI=24%时,对应累计5天ROI=44%

2. 数据分析

1)问题

对于以上表格中的数据如何评价?

在探索出样本量的规律之前,我是这么做的:

样本容量怎么求公式(以付费阅读为例,如何通过样本量来提升测试效率)

初步结论:4/1、4/3、4/5后续达标;4/2、4/4后续不达标。

这就很难仅通过5天数据对这本书进行评价了。

这时我们注意到4/1、4/2的新增uv非常少,而涨幅的偏差却很大,那么是否因为样本量的原因干扰了我们的判断呢?

答案是:是的,样本量会影响后续回收涨幅。

如果样本量影响对书籍质量的评估,那么究竟需要多少样本量才能达到理想的反馈结果呢?

2)结果

本案例中,应排除4/1、4/2、4/4三天再做评价。

4/3、4/5的测试结果为正向,因此认为这本书可以用于推广。

根据4/3、4/5的第5天增长情况对4/6进行预估,4/6预计累计5天ROI=39%,结果仍为正向。

3)分析过程(正文+干货)

定性分析:分解指标,找出变量中受样本量影响的因素,以及该因素与变量的关系。

本案例中:

  • 累计ROI=累计充值金额/新增当日消耗;
  • 累计充值金额=∑第i天充值金额=∑第i天充值uv*第i天充值ARPPU;*ARPPU是对消费能力的反应,本案例中直接与用户阅读速度成正比,近似恒定;
  • 第i天充值uv=新增uv*第i天留存比例;*对于付费小说,免费用户在付费章节几乎全部流失,因此近似认为5天后留存下来的用户都是付费用户。

得到:累计充值金额=新增uv*∑第i天留存比例*第i天充值ARPPU。

问题简化为:为保证新增用户5天后有效留存,需要多少新增uv(又回到了熟悉的留存问题上了)。

现已知第5天平均留存比例为8%。

定量分析:大样本条件下,已知总体比例π,求置信度(1-α)下的样本容量n】

计算公式

本案例中:

  • 给定95%的置信度下z=1.96
  • π=8%(在总体比例未知的条件下可取π=0.5)
  • E取0.2π=1.6%(E为给定的置信水平下使用者可以接受的允许误差,由实际业务成本和接受程度决定)
  • n=1.96*1.96*8%*92%÷1.6%÷1.6%≈1100

计算置信区间:

计算公式

在本案例中,1.96*sqr(8%*92%÷1100)≈1.6%,置信区间为 (6.4%,9.6%)。

四、结论

众所周知,样本量越大、测试周期越长,成本就会越高。如何降低成本是数据分析师应做的,也是文章里想要表达的。

在本案例中,至少需要新增uv=1100。

因此认为4/1、4/2、4/4为无效测试,再结合实际业务对4/5进行取舍,本案例中认为4/5是有效测试。

最后很重要!

互联网很容易获取到大样本,但样本里掺杂的因素很多,在做测试和计算样本量的时候,一定需要先做定性分析!

本文由@树无

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人,并不代表关注常识网立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容(包括不限于图片和视频等),请邮件至379184938@qq.com 举报,一经查实,本站将立刻删除。

联系我们

在线咨询:点击这里给我发消息

微信号:CHWK6868

工作日:9:30-18:30,节假日休息