Python-xml

可以用xml库,也可以用lxml。如果数据比较大,或者有转义字符,不能直接用。

lxml的迭代解析在解析超大数据集的时候有用,在https://www.ibm.com/developerworks/cn/xml/x-hiperfparse/里面有说明。

(Python迭代器用next函数获取后面的数值)

总之还是bs4好用,文档见https://beautifulsoup.readthedocs.io/zh_CN/v4.4.0/#id14

python里面xml可以参考https://blog.csdn.net/t_zht/article/details/83375834