連続データの記述統計量を計算しよう(その3)

Last-modified: 2008-06-15 (日) 20:48:57

MEANSプロシジャが計算する記述統計量を、SASデータセットとして保存して
おきたいこともあるでしょう。
これにより、別の計算で利用することが可能となります。

具体的には、OUTPUTステートメントを利用しましょう。

proc means data=sashelp.prdsale n nmiss min mean max;
  class country;
  var actual;
  output out=out1; /*OUTPUTステートメント。データセットWORK.out1に出力*/
run;

proc print data=out1;
run;

/*
                OBS    COUNTRY               _TYPE_    _FREQ_    _STAT_                    ACTUAL

                  1                             0       1440      N                      1,440.00
                  2                             0       1440      MIN                        3.00
                  3                             0       1440      MAX                    1,000.00
                  4                             0       1440      MEAN                     507.18
                  5                             0       1440      STD                      287.03
                  6    カナダ                   1        480      N                        480.00
                  7    カナダ                   1        480      MIN                        3.00
                  8    カナダ                   1        480      MAX                    1,000.00
                  9    カナダ                   1        480      MEAN                     514.56
                 10    カナダ                   1        480      STD                      289.34
                 11    ドイツ                   1        480      N                        480.00
                 12    ドイツ                   1        480      MIN                        3.00
                 13    ドイツ                   1        480      MAX                    1,000.00
                 14    ドイツ                   1        480      MEAN                     512.50
                 15    ドイツ                   1        480      STD                      288.21
                 16    米国                     1        480      N                        480.00
                 17    米国                     1        480      MIN                        4.00
                 18    米国                     1        480      MAX                      984.00
                 19    米国                     1        480      MEAN                     494.48
                 20    米国                     1        480      STD                      283.68
*/

デフォルトでは、非欠損値のオブザベーション数(N)、最小値(MIN)、最大値(MAX)、平均(MEAN)、
及び標準偏差(STD)が計算されてデータセットに保存されます。
また、_FREQ_という変数にはオブザベーション数が格納されます。
なお、CLASSステートメントやBYステートメントを使用すると、グループごとに統計量が計算されます。
但し、CLASSステートメントでは全オブザベーションに対する結果もデフォルトでは出力されます。