分散FSについての疑問をぶつけてみた
某所で質問してきました。Yさん丁寧に答えてくれてありがとうございました。
1.分散FSの難しいところはどこか?
複数ノードで同一のデータに対して排他処理/データ一貫性を持たせるのが難しい。
ノードがオフライン時など。
2.独自の分散FSを開発すると他者に対して優位性を保てるのか?(みんな同じような性能になるのでは?)
ネットワーク構成の方法やデータの冗長性の持たせ方で速度や検索性が変わると思います
FSとして持たせる以上、ノードが保持しているデータ一覧を「誰が(スーパサーバ?各ノード?)」「どのように(ファイル毎?キーワード毎?ノードリスト毎?)」ということをはっきりさせる必要があると思います
検索のヒット数や検索方法自体に影響するかと思います
ファイル名で探せるのか、キーワードで探せるのか、任意のタグで探せるのか
3.DBと何が違うの?
DBとFSは本質的には同じです
一般にDBはACIDであることが多く、検索の軸が複数ある。ということくらいかと
FSの検索軸は名前くらい
4.実装する難しさはどれくらい?
Winnyが分散FSの一種なのである種、基準となる。