データ構造	サイズ	$\mathit{SA}[i]$ の計算
接尾辞配列（非圧縮）	$n \lg n$ bits	$O(1)$ 時間
圧縮接尾辞配列	$O(n \lg \sigma)$ bits	$O(\lg^\varepsilon n)$ 時間

$i$	$\mathit{SA}[i]$	$T[\mathit{SA}[i]..n + 1]$	$\mathit{SA}[i] + 1$	$\mathit{\Psi}[i]$
$0$	$7$	$	$1$	$4$
$1$	$6$	a$	$7$	$0$
$2$	$4$	ana$	$5$	$5$
$3$	$2$	anana$	$3$	$6$
$4$	$1$	banana$	$2$	$3$
$5$	$5$	na$	$6$	$1$
$6$	$3$	nana$	$4$	$2$

$j$	$\mathit{SA}^{-1}[j]$
$1$	$4$
$2$	$3$
$3$	$6$
$4$	$2$
$5$	$5$
$6$	$1$
$7$	$0$

2025/05/09 簡潔データ構造ゼミ

関数 Ψ の性質 (3/5)

関数 $\mathit{\Psi}$ は補題 7.2 の性質を満たす．

$0 \le i < j \le n$ に対し， $T[\mathit{SA}[i]] = T[\mathit{SA}[j]]$ ならば $\mathit{\Psi}[i] < \mathit{\Psi}[j]$ ．

定義より $\mathit{\Psi}[i] = \mathit{SA}^{-1}[\mathit{SA}[i] + 1], \mathit{\Psi}[j] = \mathit{SA}^{-1}[\mathit{SA}[j] + 1]$ である．つまり， $\mathit{\Psi}[i]$ と $\mathit{\Psi}[j]$ の大小関係は接尾辞 $T[\mathit{SA}[i] + 1..n + 1]$ と $T[\mathit{SA}[i] + 1..n + 1]$ の辞書順で定義される．
今， $T[\mathit{SA}[i]] = T[\mathit{SA}[j]]$ であるため，接尾辞 $T[\mathit{SA}[i] + 1..n + 1]$ と $T[\mathit{SA}[j] + 1..n + 1]$ の大小関係は $T[\mathit{SA}[i]..n + 1]$ と $T[\mathit{SA}[j]..n + 1]$ の大小関係と等しい． $i < j$ であり，接尾辞配列の定義から $T[\mathit{SA}[i]..n + 1] < T[\mathit{SA}[j]..n + 1]$ であるため， $\mathit{\Psi}[i] < \mathit{\Psi}[j]$ となる．

気持ち
文字列 $S,T$ について， $S < T$ かつ $S[1] = T[1]$ であるとき， $S[2..] < T[2..]$ である．

	接尾辞配列	圧縮接尾辞配列
配列のサイズ	$n\lg n$ ビット	$O(n\lg\sigma)$ ビット
$\mathit{SA}[i]$ を求める	$O(1)$ 時間	$O(\lg^\varepsilon n)$ 時間
パタン $P$ の出現頻度クエリ	$O(\|P\|\lg n)$ 時間	$O((\|P\| + \lg^\varepsilon n)\lg n)$ 時間

7.4 圧縮接尾辞配列

目次

圧縮接尾辞配列の概要 (1/2)

接尾辞配列との比較

計算時間について

圧縮接尾辞配列の概要 (2/2)

関数 Ψ の性質 (1/5)

気持ち

関数 Ψ の性質 (2/5)

関数 Ψ の性質 (3/5)

関数 Ψ の性質 (4/5)

関数 Ψ の性質 (5/5)

圧縮接尾辞配列上で SA[i]を求める (1/2)

圧縮接尾辞配列上で SA[i]を求める (2/2)

圧縮接尾辞配列の計算量

圧縮接尾辞配列上で SA[i]を求める（疑似コード）

CSA のさらなる省スペース化 / 高速化

CSA の実用上の実装 (1/2)

CSA の実用上の実装 (2/2)

自己索引化 (1/4)

自己索引とは

自己索引化 (2/4)

復習: SA でのパタン $P$ の検索

CSA からの部分文字列の復元

自己索引化 (3/4)

自己索引化 (4/4)

$T$ の部分文字列 $T[s..t]$ の復元

自己索引化のまとめ

7.4 圧縮接尾辞配列

目次

圧縮接尾辞配列の概要 (1/2)

接尾辞配列との比較

計算時間について

圧縮接尾辞配列の概要 (2/2)

関数 Ψ の性質 (1/5)

気持ち

関数 Ψ の性質 (2/5)

関数 Ψ の性質 (3/5)

関数 Ψ の性質 (4/5)

関数 Ψ の性質 (5/5)

圧縮接尾辞配列上で SA[i]を求める (1/2)

圧縮接尾辞配列上で SA[i]を求める (2/2)

圧縮接尾辞配列の計算量

圧縮接尾辞配列上で SA[i]を求める（疑似コード）

CSA のさらなる省スペース化 / 高速化

CSA の実用上の実装 (1/2)

CSA の実用上の実装 (2/2)

自己索引化 (1/4)

自己索引とは

自己索引化 (2/4)

復習: SA でのパタン PPP の検索

CSA からの部分文字列の復元

自己索引化 (3/4)

自己索引化 (4/4)

TTT の部分文字列 T[s..t]T[s..t]T[s..t] の復元

自己索引化のまとめ

復習: SA でのパタン $P$ の検索

$T$ の部分文字列 $T[s..t]$ の復元