HOME/📦 INBOX/

【🔎 SQL】要約統計量

Article Outline
TOC
Collection Outline

|| 要約統計量

要約統計量とは、標本の分布の特徴を代表的に表す統計学上の値であり、統計量の一種。 記述統計量、基本統計量、代表値ともいう。 正規分布の場合は、平均と、分散または標準偏差で分布を記述できる。 正規分布からのずれを知るためには、尖度や歪度などの高次モーメントから求められる統計量を用いる。

要約統計量- wikipedia

|| SQL で書いてみる

n mean std min 25% median 75% max
select
    count(passenger_count) as n,
    avg(passenger_count) as mean,
    stddev(passenger_count) as std,
    min(passenger_count) as min,
    (select q from(select percentile_cont(passenger_count, 0.25) over() as q from `prj.ds.sample_tb`) group by q) as first_quartile,
    (select q from(select percentile_cont(passenger_count, 0.5) over() as q from `prj.ds.sample_tb`) group by q) as median,
    (select q from(select percentile_cont(passenger_count, 0.75) over() as q from `prj.ds.sample_tb`) group by q) as thrd_quartile,
    max(passenger_count) as max
from `prj.ds.sample_tb`
where passenger_count is not null
;