Comparison of File Orgnization - Database Management Systems

Database Management Systems の 8章。
Heap Files, Clustered Files, Heap Files with Unclustered Hash Index などのデータ格納形式に関して

  • scan
  • search=
  • searh range
  • delete
  • insert

などのコスト概算。

例えば Heap files with Unclustered Tree Index だと search= のコストは
D\log_F{0.15B}+C\log_2{6.7R}+D
だよとか。

  • B: データ格納に必要なページ数
  • D: Read/write にかかる平均時間
  • F: Fan out
  • C: Data Process にかかる時間
  • R: データにおける、データ数/ページ
  • 1エントリに対する Index のサイズはデータの 1/10
  • index の各ページはおおよそ平均して 67 % ほどの使用率


D\log_F{0.15B} は Tree Index の leaf にたどり着くために必要な readのコスト* パス数。
C\log_2{6.7R} は見つかったページの中で該当データを binary search するコスト。