集群前两天在正常运行情况下突然出现BE大规模宕机的情况,开始认为一个查询导致的,停掉这个查询接口以后,发现还是出现,通过be.out日志发现如下异常信息:

When loading json data like `[]` (an empty array). BE will crash with stack:

```
*** Aborted at 1612273824 (unix time) try "date -d @1612273824" if you are using GNU date ***
PC: @           0xe0cce7 rapidjson::GenericValue<>::Accept<>()
*** SIGSEGV (@0xe) received by PID 36798 (TID 0x7f7812114700) from PID 14; stack trace: ***
    @     0x7f791b74b470 (unknown)
    @           0xe0cce7 rapidjson::GenericValue<>::Accept<>()
    @          0x169ff79 _ZN5doris10JsonReader17_print_json_valueB5cxx11ERKN9rapidjson12GenericValueINS1_4UTF8IcEENS1_19MemoryPoolAllocatorINS1_12CrtAllocatorEEEEE
    @          0x16a0689 doris::JsonReader::_write_values_by_jsonpath()
    @          0x16a2cb4 doris::JsonReader::_handle_flat_array_complex_json()
    @          0x16a3761 doris::JsonScanner::get_next()
    @          0x1659bd4 doris::BrokerScanNode::scanner_scan()
    @          0x165a671 doris::BrokerScanNode::scanner_worker()
    @          0x281f67f execute_native_thread_routine
    @     0x7f791b5001c3 start_thread
    @     0x7f791b7fd12d __clone

最后排查发现Stream Load JSON数据字符串为空的情况,如果是通过FE是不会引起这个问题,但是直接通过BE,执行Stream Load操作就会引发上面的异常,导致be宕机

最后在社区陈明雨大神的指导下,社区已经有人提交了这个Patch,打上这个补丁以后,问题解决

Fix bug that BE core will loading empty json array

因为目前这个Patch还没有在发行版中,为了方便大家使用,我编译了一个版本放在了百度网盘,大家可以根据自己需要下载

链接:https://pan.baidu.com/s/1fSFNsepAGwWbswEZwe3EBw 
提取码:eyn1 
这个里面的包是打了下面这个补丁的,编译好的包
大家使用Stream load 导入数据(直接和BE通讯),如果出现空json字符串会导致BE down的情况,大家尽快打上这个补丁

06-13 02:52