2011-06-18 文字列の内部エンコーディングが UTF32で困る場面 自然言語処理で英文コーパスを大量に読み込むときとか。UTF8 と比べて 4 倍のメモリを食う。これは痛い。(実際に Mosh でこれに出くわした) でも例えば Web でありがちなテンプレートくらいの大きさなら全く問題ない。