ブラウザの JavaScript がオフ（ブロックまたは許可しない）に設定されているため、このページは正常に機能しません。

| トップ画像　

[ ホーム ] [ 新規 | 編集 | 添付 ] [ 一覧 | 最終更新 | 差分 | バックアップ ] [ 凍結 | 複製 | 名前変更 ] [ ヘルプ ]

[ ホーム ] [ | 最終更新 ]

Top > ソートが恐ろしく遅い

ソートが恐ろしく遅い

Last-modified: 2009-05-08 (金) 16:32:10

大き目のデータセットをソートする場合，ソート処理にかかる時間や，必要なリソース（メモリ，ハードディスク）が結構かかることがあります．
本当にそれだけかかってしまうべきものもありますが，いくつかの対処方法をメモしておきます．

tagsortオプションを使ってみる．
```
proc sort data=bigdata tagsort;
  by key1 key2;
run;
```
変数の多いデータは，キー以外のデータも読みこむため，時間とリソースがとられます．
tagsortオプションを指定すると，先にキー変数だけ読み込み，キーをソートしてから，再度元データのキー以外のデータを読んで，ソート済みデータセットを作ります．２度読みしますが，キー以外の項目が多いデータでは，かえって速く，リソース不足によるエラーも発生しにくくなります．

アサインするソート用メモリサイズ(sortsize)を大きくする．（デフォルト値でなく，明示する）
```
proc sort data=bigdata sortsize=800M;by key1;run;
```
800Mは，800MBのことで，800000Kまたは800000000とも書けます．sortsizeのデフォルト値は，次で調べられます．
```
proc options option=sortsize;run;
=> SORTSIZE=67108864  ソートのサイズパラメータを指定します
```

コンプレスされたデータ
大きいファイルでないつもりが，コンプレスされているために気がつかず，実は結構大きいデータだったということもあります．実際に中身が詰まっているなら仕方ありませんが，非常に大きい変数長をもった変数でも．ほとんどが使われていないなら，変数を再定義して，長さを必要な分だけに短くしましょう．
圧縮率の高いデータセットは，無駄な領域が多い可能性があり，ソート時の効率に大きく影響します．

MenuBar

SASとは

SAS Institute Inc.の歴史

SASの入手方法

初めての操作説明

SAS言語概要?

DATAステップとPROCステップ

データセット

ライブラリ

自主学習プログラム

実行サンプル

ツール

SAS関連ニュース（仮題）

リファレンス?

Base SAS DATAステップ

BaseSASプロシジャ

Base SASマクロ

SAS/STATプロシジャ

その他の分析系プロダクト

テーマ別?

データ処理

アウトプットデリバリシステム(ODS)

数理計算

記述統計

推測統計

エラー回避

データマイニング

クロスリファレンス逆引き

SASを扱った書籍

できないか・も・ね?

議論

分析関連リンク

wikiwikiの使い方

メンバー紹介（自己紹介）

お問合せ

最新の10件

2024-02-04

SandBox

2022-09-14

2022-02-14

人気100

2021-08-04

SAS日付関連の関数

2019-04-26

TABULATE入門2/95

2019-04-24

TABULATE入門2/94

2019-04-23

TABULATE入門2/93

2019-04-21

〔人気/今日人気〕〔最新〕

T.?　Y.?
NOW.?　TOTAL.?
今日 ?
昨日 ?
合計 ?
このページを見てる人 ? 人
更新ページ一覧(long)

SAS® is trademark of SAS Inc.
All other trademarks, company names, products names and logos mentioned are the property of their respective owners.