
Python XML verarbeiten
Juni 29, 2008Python kennt verschiedene Module zum verarbeiten von XML Dokumenten:
-sax
-xml.dom.minidom
-Beautifulsoup
Sax ist sehr komplex und ebenso kompliziert, Beautifulsoup ist vor allem um normale HTML Dateien zu verarbeiten, besonders für APIs dagegen ist xml.dom.minidom geeignet, da es sich durch seine Einfachheit auszeichnet.
import urllib2
import xml.dom.minidom
# Lade eine Seite als XML Objekt
def getXml(url):
url = url.replace(‘ ‘,’%20′)
return xml.dom.minidom.parseString(urllib2.urlopen(url).read())
# Lade Seite
doc = getXml(‘http://example.com/test.xml’)
titles = doc.getElementsByTagName(‘title’)
# Auf Inhalt eines bestimmten Elements zugreifen
myContent = doc.getElementById(‘content’).childNodes[0].data
#Auf alle Inhalte einer Liste von Tags zugreifen
divs = doc.getElementsByTagName(‘div’)
divContents = [div.childNode[0].data for div in divs]
