26.4 Correlation and Regression Analysis

Last-modified: 2025-03-08 (土) 14:38:16

26.4 相関と回帰分析

: c = cov (x)
: c = cov (x, y)
: c = cov (…, opt)
: c = cov (…, nanflag)
共分散行列を計算します。

2 つの変数ベクトルAと B間の共分散は次のように計算されます。

cov (a,b) = 1/(N-1) * SUM_i (a(i) - mean (a)) * (b(i) - mean (b))

ここで、Nはベクトルaとbの長さです。

1 つの引数で呼び出された場合は、 を計算します。 xがベクトルの場合、これはxのスカラー分散です。xが行列の場合、xの各行は観測値として扱われ、各列は変数として扱われ、 の ( i , j ) 番目 のエントリは xのi番目と j番目の列間の共分散です。 xの次元が nxm の場合、出力 c はamxm の正方共分散行列になります。 cov (x, x)cov (x)

2 つの引数で呼び出された場合は、 2 つのランダム変数xとy間の共分散を計算します。 xと y は要素数が同じである必要があり、 として計算された共分散を持つベクトルとして扱われます 。出力は 2 x 2 の共分散行列になります。 cov (x, y)cov (x(:), y(:))

オプション引数optは、使用する正規化の種類を決定します。有効な値は次のとおりです。

0 [デフォルト]:
N-1で正規化します。これにより、共分散の最も偏りのない推定値が得られます。

1:
Nで正規化します。これにより、平均の周りの 2 番目のモーメントが得られます。N = 1 の場合、 opt は1 に設定されます。

オプション引数nanflag は引数リストの最後に記述する必要があり、NaN 値が によってどのように処理されるかを制御しますcov。有効な値は次の 3 つです。

includenan [デフォルト]:
xとyに NaN 値を残します。出力は、算術演算で NaN 値を処理する通常の規則に従います。

省略:
NaN 値を含む行は、共分散を計算する前にxとy の両方から削除されます 。 1 つの変数に NaN があると、その行はxとy の両方から削除されます。

部分行:
NaN 値を含む行は、 i番目とj番目の共分散計算 ごとにxとy の両方から独立して無視されます。これにより、共分散行列の各要素を計算するために使用される観測値の数 Nが異なる場合があります。

互換性に関する注意: の以前のバージョンでは、cov行 xとy を多変量ランダム変数として扱っていました。このバージョンでは、xとy を形状に関係なく 2 つの単変量分布として扱い 、2x2 出力行列を生成することで、 MATLABとの完全な互換性を維持しようとしています。 のこの新しいバージョンを実行する場合、Octave の以前の定義に依存するコードを変更する必要があります 。 の以前の動作は、 NaN パッケージの関数を として使用することで実現できます。 covcovmcovm (x, y, "D")

参照: corr。

: r = corr (x)
: r = corr (x, y)
相関係数の行列を計算します。

xとyの各行が観測値で、各列が変数である場合、 の ( i , j ) 番目の エントリ は、 xのi番目の変数とyのj番目の変数間の相関関係です 。 xとyの行数 (観測値) は同じである必要があります。 corr (x, y)

corr (x,y) = cov (x,y) / (std (x) * std (y))

1 つの引数で呼び出された場合は、xの列間の相関を計算します。 corr (x, x)

参照: cov。

: r = corrcoef (x)
: r = corrcoef (x, y)
: r = corrcoef (…, param, value, …)
: [r, p] = corrcoef (…)
: [r, p, lci, hci] = corrcoef (…)
相関係数の行列を計算します。

xは、各列に変数が含まれ、各行に観測値が入る配列です。

2 番目の入力y ( xと同じサイズ) が与えられた場合は、 xとyの間の相関係数を計算します。

param、value は、計算を変更するオプションのパラメータと値のペアです。有効なオプションは次のとおりです。

"alpha"
信頼区間lci およびhciの境界に使用される信頼レベル。デフォルトは 0.05、つまり 95% 信頼区間です。

"rows"
NaN 値の処理を決定します。許容値は"all"、、 "complete"およびです"pairwise"。デフォルトはです"all"。を使用すると"complete"、NaN 値のない行のみが考慮されます。を使用すると"pairwise"、変数の各ペアに対して NaN のない行が選択されます。

出力rは、各変数のペアに対するピアソンの積率相関係数の行列です。

出力pは、相関係数がゼロであるという帰無仮説をテストするペアワイズ p 値の行列です。

出力lciとhci は、それぞれ各相関係数の 95% 信頼区間の下限と上限を含む行列です。

参照: corr、cov、std。

: rho = spearman (x)
: rho = spearman (x, y)
スピアマンの順位相関係数 rho を計算します。

2 つのデータ ベクトルxとyの場合、スピアマンの ローはxとy の順位の相関係数です。

xとy が独立した分布から抽出される 場合、 rho の 平均と分散はゼロになります 1 / (N - 1)。ここで、N はxベクトルとyベクトルの長さであり、漸近的に正規分布します。

spearman (x)は と同等です 。 spearman (x, x)

参照: ranks、kendall。

: tau = kendall (x)
: tau = kendall (x, y)
Kendall の tauを計算します。

共通の長さNの2つのデータベクトルx、yについて、ケンドールの タウはxとy のすべてのランク差の符号の相関です 。つまり、xとy の両方が異なるエントリを持つ場合、

         1
tau = -------   SUM sign (q(i) - q(j)) * sign (r(i) - r(j))
      N (N-1)   i,j

ここで、 q (i) とr (i) はそれぞれxとyの順位です。

xとy が独立した分布から抽出される 場合、ケンドールのタウは 平均 0 および分散 で漸近的に正規分布になります (2 * (2N+5)) / (9 * N * (N-1))。

kendall (x)は kendall (x, x)と同等です。

参照: 階級、槍兵。