1.前言

最近有个在学校读书的迷弟问我:大德德, 有没有这么一款软件, 能够批量读取多个抓包文件,并把我想要的数据呈现出来, 比如:源IP、目的IP、源mac地址、目的mac地址等等。我说:“这样的软件你要认真找真能找出不少开源软件, 但毕竟没有你自己的灵魂在里面,要不咱自己用Go实现一个吧”, OK , Let's go。

2.摘要

能够实现网络协议解析和分析的工具有很多,最有名使用最多的是基于图形化界面的Wireshark, 除了能够实现网络实时抓包,还能够离线分析Pcap包文件, 虽然它通常用于手动分析网络数据包, 但也支持自动化脚本和插件来提取元数据。而Wireshark还有一个基于命令行版本的Tshark, 可以用于自动化任务, 可以批量处理Pcap文件, 提取所需数据并导出到文件中。

本次用Go语言实现的网络协议解析功能是基于Google公司开发一个开源库:gopacket, 该库帮我们完成了网络协议的一些底层封装, 它允许我们能够捕获、解析和处理网络数据包, 与Wireshark一样,也支持对离线抓包文件的分析。gopacket库提供了一系列功能,包括:数据包捕获、解析和构建, 以及对多种协议的支持,如:Ethernet、IP、TCP、UDP、HTTP等。它还提供了方便的API, 以帮助开发者操作和分析网络数据包。

3.实现原理

谷歌公司开发的gopacket提供了5个子包接口供使用者调用,其中Layers子包负责协议解析;pcap子包实际是libpcap的包装,主要用于数据包格式解析;pfring子包和afpacket用于快速数据库包抓取;tcpassembly用于TCP流重组。 在本篇文章中,主要利用gopacket提供的Layers和pcap接口实现上层业务逻辑。在流量解析引擎中,调用pcap接口对离线pcap抓包文件进行数据包解析,并配合Layers接口实现协议解析,目前根据业务种类,实现的协议解析包括:HTTP协议、TCP/UDP协议、ICMP协议和802.11协议。流量解析引擎的整体架构如下:

用Go实现网络流量解析和行为检测引擎-LMLPHP

我们实现的流量解析引擎主要针对离线pcap包文件, 支持的协议类型包括:HTTP协议、TCP/UDP协议、ICMP协议、802.11(无线协议)

,通过对各类协议的解析,可以实现一些高级功能,例如: 特征库匹配、漏洞扫描检测、一些网络攻击检测等等。

通过对gopacket开源包的研究,整理出其使用方法如下:

  • 利用pcap子包的OpenOffline方法加载离线数据包文件,加载成功返回离线数据包文件句柄。

  • 离线包文件句柄通过SetBPFFilter方法过滤数据类型,调用LinkType()方法获取链路类型。

  • 将第2步中的文件句柄和LinkType作为参数调用方法NewPacketSource。

  • NewPacketSource调用Packet()方法获取离线包文件中所有的数据包,通过遍历每个数据包进行下一步操作。

  • 每个数据包对象通过调用Layer()方法获取数据对象层,参数为数据对象的种类,种类有很多种,根据不同的协议类型进行区分。

  • 获取的数据层级操作对象是数据包解析基础方法需要达到的目的,即将解析的具体数据将在数据层级中进行不同方法的筛选。

大致的调用关系整理如下图:

用Go实现网络流量解析和行为检测引擎-LMLPHP

4.功能代码实现

在我们的工程项目中,首先要引入三个包,它们是:

import(
	"github.com/google/gopacket"
	"github.com/google/gopacket/layers"
	"github.com/google/gopacket/pcap"
)

因为我们操作的对象主要是针对离线pcap包, 因此首先要加载离线包文件,代码如下:

handle, err = pcap.OpenOffline(pcapFilePath)
if err != nil {
		log.Panic(err)
}

handle是加载离线包文件后返回的文件句柄,类型为:*pcap.Handle,接下来我们要设置一下过滤,只针对tcp连接的包,所以通过上面的文件句柄调用过滤函数:

err = handle.SetBPFFilter("tcp")
	if err != nil {
		log.Panic(err)
}

根据上面的调用关系图,我们需要调用NewPacketSource方法,代码如下:

packetSource := gopacket.NewPacketSource(handle, handle.LinkType())
packets := packetSource.Packets()

packetSource.Packets()方法返回的是一个通道, 用来接收gopacket解析出来的每一个数据包,

因此这里需要做循环接收,并在循环内容解析ethernet层, 解析大致过程如下:

用Go实现网络流量解析和行为检测引擎-LMLPHP

下面我们根据上面的流程图解析LayerTypeEthernet, 代码如下:

for packet := range packetSource.Packets() {
		ethernetLayer := packet.Layer(layers.LayerTypeEthernet)
		if ethernetLayer == nil {
			  continue
		}
    ethernetPacket, _ := ethernetLayer.(*layers.Ethernet)
}

下面涉及到协议的层级,我们对照Wireshark的包对比看一下,如图:

用Go实现网络流量解析和行为检测引擎-LMLPHP


从上图的协议结构中我们可以看到,源IP地址和目的IP地址是在IPv4层上, 源端口和目的端口是在TCP层上, 而mac地址是在Ethernet层上, 因此要想获取这6个元数据,我们至少要解析三层协议, 添加以下代码:

for packet := range packetSource.Packets() {
		ethernetLayer := packet.Layer(layers.LayerTypeEthernet)
		if ethernetLayer == nil {
			  continue
		}
    ethernetPacket, _ := ethernetLayer.(*layers.Ethernet)
    if ethernetPacket.EthernetType.String() == "IPv4" {
    		ipLayer := packet.Layer(layers.LayerTypeIPv4)
    		if ipLayer == nil { continue }
    		
    		// 这里从IPv4协议层取源IP和目的IP数据
    		ipInfo, _ := ipLayer.(*layers.IPv4)
    		
    		
    		tcpLayer := packet.Layer(layers.LayerTypeTCP)
			  if tcpLayer == nil { continue }
			  
			  // 这里从TCP协议层取TCP数据,获取源端口和目的端口数据
			  tcpInfo, _ := tcpLayer.(*layers.TCP)
			  
			  //下面的代码取具体的Payload
			  applicationLayer := packet.ApplicationLayer()
			  if applicationLayer == nil { continue }
			  payload := string(applicationLayer.Payload())
			  
			  // 从GET或POST请求中取出元数据
			  if strings.HasPrefix(payload, "GET") || strings.HasPrefix(payload, "POST") {
			  	  fmt.Println("源mac地址:", ethernetPacket.SrcMAC.String())
					  fmt.Println("目的Mac地址:", ethernetPacket.DstMAC.String())
					  fmt.Println("源IP地址:", ipInfo.SrcIP.String())
					  fmt.Println("目的IP地址:", ipInfo.DstIP.String())
            fmt.Println("源端口:", int(tcpInfo.SrcPort))
					  fmt.Println("目的端口:", int(tcpInfo.DstPort))
			  }
    }
}

5.行为检测实现

这里我们以检测数据库的匿名登录行为为例子, 首先在kali系统上对目标数据库尝试匿名登录,如图:

用Go实现网络流量解析和行为检测引擎-LMLPHP

在登录过程中,使用Wireshark进行网络抓包,如图:

用Go实现网络流量解析和行为检测引擎-LMLPHP

从上面的抓包文件中,我们可以根据Payload偏移提取一些行为特征,例如:

用Go实现网络流量解析和行为检测引擎-LMLPHP

将特征检测的逻辑加入到代码中:

for packet := range packetSource.Packets() {
		ethernetLayer := packet.Layer(layers.LayerTypeEthernet)
		if ethernetLayer == nil {
			  continue
		}
    ethernetPacket, _ := ethernetLayer.(*layers.Ethernet)
    if ethernetPacket.EthernetType.String() == "IPv4" {
    		ipLayer := packet.Layer(layers.LayerTypeIPv4)
    		if ipLayer == nil { continue }
    		
    		// 这里从IPv4协议层取源IP和目的IP数据
    		ipInfo, _ := ipLayer.(*layers.IPv4)
    		
    		if ipInfo.Protocol.String() == "TCP" {
					tcpLayer := packet.Layer(layers.LayerTypeTCP)
					tcp, _ := tcpLayer.(*layers.TCP)
					if (len(tcp.Payload) > 36 && bytes.Equal(tcp.Payload[13:37], []byte{0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0})) || (len(tcp.Payload) > 39 && bytes.Equal(tcp.Payload[13:40], []byte{0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 114, 111, 111, 116})) {
						fmt.Println("发现数据库匿名登录行为!")
					}
				}
    }
}

将上面的代码编译后加载离线pcap包跑一下,可以看到已经匹配到行为特征,如图:

用Go实现网络流量解析和行为检测引擎-LMLPHP

可以看到,已经成功命中行为特征。

11-14 00:53