Unicode ギリシア語の final sigma 問題

Unicode の SpecialCasing.txt に「Special case for final form of sigma」という項目があり、データの定義がある。
これの意味が分からなかったので調べる。うまい検索ワードが思いつかないせいか、日本語でよい解説は見つからない。

英語版のWikipedia で解決。

Sigma (upper case Σ, lower case σ; Greek Σιγμα, lower case in word-final position ς) is the eighteenth letter of the Greek alphabet, and carries the /s/ sound. In the system of Greek numerals it has a value of 200. When used at the end of a word, and the word is not all upper case, the final form (ς) is used.


シグマには大文字(Σ:U+03A3)・小文字(σ:U+03C3) 以外に、(ς:U+03C2) という表現がある。単語の一番最後にシグマが来たときは (ς) を使うということらしい。
ただし (ς) を使うのは単語に小文字含まれているときのみ。つまり全部大文字のときは (Σ) を使う。

string-upcase, string-downcase で考慮すべきこと

string-upcase では全て大文字化するのだから
sigma かどうかは気にしなくて良い。
string-downcase では全て小文字化するので、単語の末尾にある(Σ)は、(ς)に変更する必要がある。