0%

HBase 自动大合并脚本

HBase 自动大合并脚本


前言

HBASE 有默认的 major compaction 机制。

一般情况下,Major Compaction 时间会持续比较长,整个过程会消耗大量系统资源,对上层业务有比较大的影响。

因此线上业务都会将关闭自动触发 Major Compaction 功能,改为手动在业务低峰期触发。可以使用 major_compact 命令手动合并

如果 HBase 中的表很多的时候,用脚本定时在凌晨时分触发。

脚本

备注: 只使用了 major_compact 这个合并命令

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
#!/bin/bash
time_start=`date "+%Y-%m-%d %H:%M:%S"`
echo "开始进行HBase的大合并.时间:${time_start}"

str=`echo list | hbase shell | sed -n '$p'`

str=${str//,/ }
arr=($str)
length=${#arr[@]}
current=1

echo "HBase中总共有${length}张表需要合并."
echo "balance_switch false" | hbase shell | > /dev/null
echo "HBase的负载均衡已经关闭"

for each in ${arr[*]}
do
table=`echo $each | sed 's/]//g' | sed 's/\[//g'`
echo "开始合并第${current}/${length}张表,表的名称为:${table}"
echo "major_compact ${table}" | hbase shell | > /dev/null
let current=current+1
done

echo "balance_switch true" | hbase shell | > /dev/null
echo "HBase的负载均衡已经打开."

time_end=`date "+%Y-%m-%d %H:%M:%S"`
echo "HBase的大合并完成.时间:${time_end}"
duration=$($(date +%s -d "$finish_time")-$(date +%s -d "$start_time"))
echo "耗时:${duration}s"

Linux 定时

使用 crontab 来业务低峰期启动。

每天凌晨3点30分执行 majorCompact.sh 脚本

1
30 3 * * * /bin/bash /root/bigdata/majorCompact.sh >>  /root/bigdata/majorCompact.log