Python如何解析带有注释的XML并保留注释

#技术教程发布时间： 2026-01-14

lxml是Python中保留XML注释的首选库，需安装后通过XMLParser设置remove_comments=False，并用isinstance(node, etree._Comment)识别注释节点，tostring默认保留注释且支持indent美化输出。

Python标准库中的xml.etree.ElementTree默认会忽略XML注释，无法保留。若需解析并保留注释，必须使用支持注释的解析器——lxml是目前最稳定、易用且广泛支持注释的第三方库。

安装并启用lxml解析器

lxml不是Python内置模块，需先安装：

pip install lxml

然后在解析时显式指定parser参数，并启用注释支持：

立即学习“Python免费学习笔记（深入）”；

```python
from lxml import etree

# 创建支持注释的解析器
parser = etree.XMLParser(strip_cdata=False, remove_comments=False)
tree = etree.parse("example.xml", parser)
root = tree.getroot()
```

识别和提取注释节点

在lxml中，注释是独立的节点类型（etree.Comment），与元素节点并列。遍历子节点时需单独判断：

用isinstance(node, etree._Comment)判断是否为注释节点
注释内容通过node.text获取（不含）
注释节点可出现在任意层级：根元素前后、元素之间、甚至同级元素中间

示例遍历：

```python
for node in root.iter():
if isinstance(node, etree._Comment):
print(f"注释: {node.text.strip()}")
elif node.tag is not None: # 排除空白文本节点
print(f"元素: {node.tag}")
```

在修改后重新序列化并保留注释

直接调用etree.tostring()默认会保留注释，但要注意：

避免使用method="html"（会丢弃注释）；应使用method="xml"（默认值）
若需美化输出（缩进），用etree.indent(tree)（lxml 4.5+），它对注释节点友好
写入文件时建议指定encoding和xml_declaration=True保证格式规范

```python
etree.indent(tree)
xml_bytes = etree.tostring(tree, encoding="utf-8", xml_declaration=True)
with open("output.xml", "wb") as f:
f.write(xml_bytes)
```

替代方案说明（不推荐用于注释保留）

xml.etree.ElementTree本身不支持注释保留，即使配合iterparse也无法捕获注释事件；minidom虽能读取注释（Node.COMMENT_NODE），但API笨重、内存占用高、不推荐新项目使用；lxml在性能、功能和易用性上全面胜出，是实际工程中的首选。

技术教程SEO

上一篇 : PPT幻灯片里的SmartArt如何分步出现_在动画设置里选按级别

下一篇 : 屏幕亮度无法调节_电脑屏幕亮度无法调节怎么办【修复】

首页

关于我们

SEO服务

品牌推广

优化学院

联系我们

Python如何解析带有注释的XML并保留注释

安装并启用lxml解析器

识别和提取注释节点

在修改后重新序列化并保留注释

替代方案说明（不推荐用于注释保留）

SEO公司

SEO套餐

SEO教程

SEO资源

SEO建站

推荐阅读

iphone怎么设置专注模式 iphon

综合素质评价模板哪里下载学生个人填写W

如何基于首次下划线分割 Pandas 列

《皇牌空战7 未知空域》全球累计销量已达

Excel交互式图表怎样用滚动条调区间_

Go反射如何判断零值_Go反射零值检测方

Win11小组件怎么彻底删除_禁用Win

魂斗罗30条命秘籍怎么调经典关卡开启新

AMD Radeon 2025 vs.

如何从WSDL文件生成客户端代码 wsi

PPT如何快速抠除图片背景 PPT自带删

苹果手机怎么设置动态壁纸_iPhone灵

苹果手机怎么测心率_苹果手机使用健康Ap

1KB、1MB、1GB、1TB换算 1G

css 多个按钮间距不均怎么办_marg

小米手机查询生产日期方法_小米序列号查生

如何修复Windows“无法加载用户配置

苹果电脑怎么安装Windows系统 Ma

如何在 TreeView 收起时隐藏加载

苹果真假查询序列号官网入口_苹果产品序列

首页

关于我们

SEO服务

品牌推广

优化学院

联系我们

Python如何解析带有注释的XML并保留注释

安装并启用lxml解析器

识别和提取注释节点

在修改后重新序列化并保留注释

替代方案说明（不推荐用于注释保留）

SEO公司

SEO套餐

SEO教程

SEO资源

SEO建站

推荐阅读

iphone怎么设置专注模式 iphon

综合素质评价模板哪里下载 学生个人填写W

如何基于首次下划线分割 Pandas 列

《皇牌空战7 未知空域》全球累计销量已达

Excel交互式图表怎样用滚动条调区间_

Go反射如何判断零值_Go反射零值检测方

Win11小组件怎么彻底删除_禁用Win

魂斗罗30条命秘籍怎么调 经典关卡开启新

AMD Radeon 2025 vs.

如何从WSDL文件生成客户端代码 wsi

PPT如何快速抠除图片背景 PPT自带删

苹果手机怎么设置动态壁纸_iPhone灵

苹果手机怎么测心率_苹果手机使用健康Ap

1KB、1MB、1GB、1TB换算 1G

css 多个按钮间距不均怎么办_marg

小米手机查询生产日期方法_小米序列号查生

如何修复Windows“无法加载用户配置

苹果电脑怎么安装Windows系统 Ma

如何在 TreeView 收起时隐藏加载

苹果真假查询序列号官网入口_苹果产品序列

综合素质评价模板哪里下载学生个人填写W

魂斗罗30条命秘籍怎么调经典关卡开启新