本文将为大家简单介绍考虑如何有效的对数据进行分级存储的相关内容,以下是文章的详细内容,有兴趣的读者不妨看看此篇文章,希望能为各位读者带来些许的收获。
考虑如何有效的对数据进行分级存储
为什么有时候采用数据分级存储策略能够提高比较好的效果,而有时候效果又不明显呢?笔者认为,这其中有一个很重要的原因是数据分级策略的指标不合适。
也就是说,将什么鱼放养在哪个鱼塘中,是由存储系统根据一定规则来决定的。如果这个规则设置不当,如只根据鱼的大小来决定,那么同一个鱼塘中就可能会有各种各样的鱼。此时就不利于数据的查询与管理。可见,这个分级存储的规则相当的关键。
笔者建议,在使用数据分级存储产品的时候,最好能够选择那些基于多指标的数据分级策略。也就是说,根据基于数据的生命周期、上次访问的时间、大小、访问频率等等多个参数对数据的价值进行分级。具体的来说,在数据分级时需要考虑到如下内容。
一是最好在数据创建的时候就能够确定数据的级别。因为如果数据一创建就能够预测其访问特性而进行适当的分级,就能够减少不必要的数据转移而带来的麻烦。
这也就是说,在日常管理中我们可以对于一些数据进行手工的分级,而不需要让系统来进行分级。如根据以前的经验,可以预测用户对于近1个月的邮件数据需要经常访问。
那么就可以指定,对于最近一个月的数据指定为级别高的数据。而其他时间的邮件数据则根据一定的规则让系统自动进行判断。手工指定与系统自动判断结合,往往可以起到不错的效果。
二是根据数据的静态特征和动态特征来进行分级存储也能够起到不错的效果。如可以通过以下方式来判断文件是静态的还是动态的。
一是根据文件系统的静态特征(如文件大小的分布),二是根据文件系统的宏观访问规律(如大小文件的访问次数分布),三是根据根据文件之间的访问关联特征(如同一作业中的一个文件被访问,则可能会带动其他文件也被访问),四是文件个性的访问模式(如是否具有访问的局限性)。
在实际工作中,可以根据这些特征对文件进行手工的归类。也可以在选购的时候,判断系统中是否有对应的分级策略。