| 
								
									| 
											
                        					 
												
													
													    |  |  
													    | 摘要 分布式文件系统(HDFS)存取大文件有很好的性能,但存取海量小文件时效率很差。鉴于此,提出一种小文件存取优化策略。存储小文件时,客户端将它们按类型和访问权限分类合并成MapFile,合并后的大文件交给HDFS处理。读取小文件时,引入由Nexist文件缓冲区域、一级缓存和二级缓存组成的缓存模块。实验表明,该策略能有效降低存取海量小文件时主节点中内存的消耗,同时减少了小文件的存取时间,极大提高存取的性能。 |  |  
															| 关键词 :
																																																																分布式文件系统, 
																																																																	海量小文件, 
																																																																	MapFile, 
																																																																	缓存, 
																																																																	存取优化 |  
															|  |  
															| 基金资助:国家自然科学基金资助项目(61070139,81460769); 江西省教育厅科学计划资助项目(GJJ14134,GJJ14143); 广东省科技计划资助项目(2013B010406008); |  
											 
											 |  |