分散FSについての疑問をぶつけてみた

某所で質問してきました。Yさん丁寧に答えてくれてありがとうございました。

1.分散FSの難しいところはどこか?


複数ノードで同一のデータに対して排他処理/データ一貫性を持たせるのが難しい。
ノードがオフライン時など。

2.独自の分散FSを開発すると他者に対して優位性を保てるのか?(みんな同じような性能になるのでは?)


ネットワーク構成の方法やデータの冗長性の持たせ方で速度や検索性が変わると思います
FSとして持たせる以上、ノードが保持しているデータ一覧を「誰が(スーパサーバ?各ノード?)」「どのように(ファイル毎?キーワード毎?ノードリスト毎?)」ということをはっきりさせる必要があると思います
検索のヒット数や検索方法自体に影響するかと思います
ファイル名で探せるのか、キーワードで探せるのか、任意のタグで探せるのか

3.DBと何が違うの?


DBとFSは本質的には同じです
一般にDBはACIDであることが多く、検索の軸が複数ある。ということくらいかと
FSの検索軸は名前くらい

4.実装する難しさはどれくらい?

Winnyが分散FSの一種なのである種、基準となる。