跳到主要内容
跳到主要内容

varSamp

varSamp

计算数据集的样本方差。

语法

varSamp(x)

别名:VAR_SAMP

参数

返回值

  • 返回输入数据集 x 的样本方差。Float64

实现细节

varSamp 函数使用以下公式计算样本方差:

(xmean(x))2(n1)\sum\frac{(x - \text{mean}(x))^2}{(n - 1)}

其中:

  • x 为数据集中的每个数据点。
  • mean(x) 为数据集的算术平均值。
  • n 为数据集中的数据点数量。

该函数假定输入数据集是从更大总体中抽取的样本。如果需要计算整个总体的方差(即拥有完整数据集时),应使用 varPop

示例

查询:

DROP TABLE IF EXISTS test_data;
CREATE TABLE test_data
(
    x Float64
)
ENGINE = Memory;

INSERT INTO test_data VALUES (10.5), (12.3), (9.8), (11.2), (10.7);

SELECT round(varSamp(x),3) AS var_samp FROM test_data;

结果:

┌─var_samp─┐
│    0.865 │
└──────────┘