当前位置: 首页>后端>正文

Java平台的海量小文件分布式文件系统BRFS-全套源码+文档

BRFS简介

BRFS(Bonree Distributed FileSystem)是一个主要针对海量(10亿个文件以上)小文件(快照、图片、语音等,普遍大小在1KB-50KB)存储而设计的高可用、高性能、易扩展的分布式文件系统。BRFS对存储的文件格式没有限制和要求,任何格式的文件都会以byte字节流的方式进行存储。

此系统功能不仅包含了现有其他开源产品具备的权限控制、数据增删读、多副本备份、数据检验等基础功能,同时博睿宏远还设计了独特且高效的副本自动迁移和平衡策略、多应用数据隔离且独立配置,系统资源管理插件、集群状态可视化监控与报警等功能。

BRFS的价值

从事后到事前,变被动运维为主动运维,消除运维盲点,帮助运维成为新业务部门,持续为业务提供服务支撑。

文件存储采用写时合并机制,帮助客户解决环境IO瓶颈的问题;

文件副本自动平衡恢复,帮助客户解决数据的安全性的问题;

硬件资源负载管理,帮助客户解决集群资源使用热点的问题;

引入应用分区的概念,帮助客户解决不同业务数据个性化处理的问题;

集群横向扩容,帮助客户解决集群扩容不方便的问题。

Bonree BRFS与阿里FastDFS压测对比

在处理海量5KB大小的文件并发写入和读取时,BRFS的性能表现均优于FastDFS,尤其在写入性能方面,要明显优于FastDFS,性能超出约2-3倍。

Java平台的海量小文件分布式文件系统BRFS-全套源码+文档,第1张

BRFS系统包含如下三个部分:

FS_Server.jar

在集群每个节点上运行的核心服务模块。在模块运行时会启动若干ReginNode(管理节点)和DataNode(数据节点)进程来提供服务。其中ReginNode进程主要职责是管理存储域元信息、管理数据节点、把用户数据分配到不同的数据节点上进行处理;DataNode进程主要职责是用户数据文件的写入和读取、副本自动平衡恢复、执行定时任务(副本数校验、CRC校验、数据删除、数据归并)执行等。

FS_ResouceManager.jar

系统资源管理模块,用于实时收集和监控集群各节点资源负载情况,以支持系统可根据节点负载情况分配资源,解决各节点资源利用和负载不均衡问题。BRFS系统内部默认提供了一组资源管理的策略,主要包含CPU、内存、I/O、磁盘容量等负载指标。目前此模块采用可热插拔的设计方式,但如果用户有特殊需求,可自定义此插件,自行实现集群资源的分配和管理。

server.properties.example

用于后台服务运行时所有的关键控制参数的默认值配置,如果想变更参数值,可以复制一个名为server.properties的文件,并把需要修改的属性和值添加到此文件中即可,程序运行时server.properties文件中的配置的参数值会覆盖server.properties.example文件中参数的默认值。

同时,用户如需调用BRFS服务,则需要在工程中引入FS_Client.jar,并在代码中调用相关的接口对BRFS系统进行操作;BRFS分布式文件系统接收的数据形式可以是快照、图片或者任何以byte数组方式进行存储的数据文件。

BRFS整体系统架构

Java平台的海量小文件分布式文件系统BRFS-全套源码+文档,第2张

此系统主要由Zookeeper、Client、Server以及可视化监控UI等四部分模块组成。

BRFS使用Zookeeper来管理集群服务,同步节点状态,确保服务高可用。Zookeeper上保存具体信息包括:机器节点信息、Storage信息、SID信息、任务信息、副本信息、lock锁信息、用户信息、临时信息等元数据信息。

Client即用户客户端,它是以Jar的形式被用户在用户工程代码中引用,并通过调用其相应的接口对BRFS进行数据添加、修改、读取等操作。

Server即后台集群服务,包括RegionNode和DataNode两组进程。主要功能包含了安全认证、副本管理、磁盘管理、任务(副本数校验、crc校验、删除、归并等)管理、节点资源管理和副本自动平衡与恢复、可视化监控与报警等功能模块。后台服务运行的相关进程是通过zookeeper进行管理的。

可视化监控与报警,它是把集群节点上存储的文件情况、后台任务执行情况、资源负载情况、服务运行状态等都通过可视化监控直观的观察到,当某些状态达到阀值后可以自动触发报警。

BRFS核心运行机制

Java平台的海量小文件分布式文件系统BRFS-全套源码+文档,第3张

使用BRFS只需简单四步

BRFS系统除依赖JDK等基础组件外,其他组件只依赖Zookeeper服务进行集群状态同步,且核心服务只有两个Jar文件,因此安装部署极为简单,部署安装只需简单四步:

安装基础组件,主要包括Zookeeper、JDK等;

根据业务需要配置server.properties文件;

启动各节点FS_Server.jar服务;

通过测试客户端,测试读写功能是否正常。

源代码与文档

Java平台的海量小文件分布式文件系统BRFS-全套源码+文档,第4张

需要的小伙伴查看主页即可


https://www.xamrdz.com/backend/3rc1920701.html

相关文章: