本文介绍了在 lxml 中解析 XML 时如何不加载注释的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!

问题描述

我尝试像这样使用 lxml 在 Python 中解析 XML 文件:

I try to parse XML file in Python using lxml like this:

objectify.parse(xmlPath, parserWithSchema)

但 XML 文件可能在奇怪的地方包含注释:

but XML file may contains comments in strange places:

<root>
    <text>Sam<!--comment-->ple text</text>
    <!--comment-->
    <float>1.2<!--comment-->3456</float>
</root>

是一种在解析前不加载或删除评论的方法吗?

It is a way to not load or delete comments before parsing?

推荐答案

在解析器上设置 remove_comments=True (文档):

Set remove_comments=True on the parser (documentation):

from lxml import etree, objectify

parser = etree.XMLParser(remove_comments=True)
tree = objectify.parse(xmlPath, parser=parser)

或者,使用 makeparser() 方法:

parser = objectify.makeparser(remove_comments=True)
tree = objectify.parse(xmlPath, parser=parser)

希望对您有所帮助.

这篇关于在 lxml 中解析 XML 时如何不加载注释的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持!

05-20 19:48