The Google File System
Patterns
- 檔案都很大,以GB為單位 (現在說不定更大)
- 檔案的修改,大部分是
appending
,少部分是overwriting
- 寫完以後通常就是
read only
,而且通常是sequential
的讀
Design Assumptions
- 用
commodity
的機器相連,所以hardware failure是家常便飯 - 大部分是
large streaming reads
和少數的random read
- 比起latency,throughput更重要
Architecture
Single Master
為了簡潔,是 single master