Cassandraで多量のデータを扱う場合の注意点

このページではcassandraで大きなデータ集合を扱う場合に考慮すべき事項について幾つかの助言を述べます。 ここでは相互に関連する話題を一箇所にまとめることを目的としており、独自の手法について解説する意図はありません。 この話題について理解を深めるには他のWikiページを参照することを強くお勧めします。

このページは依然として作業中の状態です。もし情報的に古い内容を見つけたら、あなた自身で更新するか、cassandra-userメーリングリストに投稿してください。

ここで触れる話題はCassandra特有のものばかりではありません。例えば、どんなストレージシステムにおいてもアクティブなデータセットの大きさに対するキャッシュのサイズとIOPSの間にはトレードオフの関係があります。なぜなら、IOPSはキャッシュミスの比率に強く影響されるからです。

特に触れない限り、ここではCassandra 0.7以降を前提とします。

stats

LargeDataSetConsiderations_JP (last edited 2013-11-14 21:54:41 by GehrigKunz)