Entries from 2011-06-18 to 1 day

文字列の内部エンコーディングが UTF32で困る場面

自然言語処理で英文コーパスを大量に読み込むときとか。UTF8 と比べて 4 倍のメモリを食う。これは痛い。(実際に Mosh でこれに出くわした) でも例えば Web でありがちなテンプレートくらいの大きさなら全く問題ない。

AFN 2010 - 87

110 / 121 = 0.90。女優ファラ・フォーセットの最期。 会話文で冠詞の "a" を「えい」と発音するのがやっと聞き取れるようになった。しかし一方で It was awful の It was が一切聞こえないのだが。 AFNニュースフラッシュ 2010度版