CEのためのちょっと役立つ疫学:四分位範囲

四分位範囲(IQR)は、サンプルを順番に並べたときの25%、50%、75%に位置するデータを
それぞれQ1、Q2、Q3としてデータの分布、ばらつきを表します。

[読み方、その他の表現]
Q1:25パーセンタイル、p25
Q2:50パーセンタイル、p50、中央値
Q3:75パーセンタイル、p75

IQR:Q3-Q1、interquartile range
どの程度、データに幅があるのかを示す

データの幅を見るときに、最大値から最小値を引くことで範囲を計算することもありますが、
正規分布でない場合、外れ値(極端に大きい値、小さい値)に引っ張られてしまうので、データに偏りが出てしまいます。
その為、IQRを用いることで外れ値を除いた形でデータを示すことができます。

上記の場合、年齢を中央値(Median)とIQRで示しています。
2625例のデータ全体の中央値(Q2)は56歳、Q1とQ3はそれぞれ40歳と71歳となります。
(※今回の例では()の中をIQRではなく、Q1とQ3で示しています。)

四分位範囲でデータの分布を示すことで、
(正規分布に従うか否かに関わらず)ただ平均や差を計算するよりも多くの情報を示すことができます。

Follow me!

投稿者プロフィール

Yoshinori ARIYASU , MPH
臨床工学技士、公衆衛生学修士。
趣味はマラソン。“Stata”“Access”“QGIS”を勉強中。
CE×疫学(epdemiology)をテーマに情報を発信していきたいと思います。お気軽にお問い合わせください!

OneCE セミナー情報

OneCE Vol.21 チームビルディングと医療安全 Webセミナー
         
皆様のご参加を心よりお待ちしております。