h1

Python XML verarbeiten

Juni 29, 2008

Python kennt verschiedene Module zum verarbeiten von XML Dokumenten:

-sax

-xml.dom.minidom

-Beautifulsoup

Sax ist sehr komplex und ebenso kompliziert, Beautifulsoup ist vor allem um normale HTML Dateien zu verarbeiten, besonders für APIs dagegen ist xml.dom.minidom geeignet, da es sich durch seine Einfachheit auszeichnet.

import urllib2
import xml.dom.minidom

#  Lade eine Seite als XML Objekt

def getXml(url):
url = url.replace(‚ ‚,’%20‘)
return xml.dom.minidom.parseString(urllib2.urlopen(url).read())

# Lade Seite

doc = getXml(‚http://example.com/test.xml‘)

titles = doc.getElementsByTagName(‚title‘)

# Auf Inhalt eines bestimmten Elements zugreifen

myContent = doc.getElementById(‚content‘).childNodes[0].data

#Auf alle Inhalte einer Liste von Tags zugreifen

divs = doc.getElementsByTagName(‚div‘)

divContents = [div.childNode[0].data for div in divs]

Schreibe einen Kommentar

Trage deine Daten unten ein oder klicke ein Icon um dich einzuloggen:

WordPress.com-Logo

Du kommentierst mit Deinem WordPress.com-Konto. Abmelden / Ändern )

Twitter-Bild

Du kommentierst mit Deinem Twitter-Konto. Abmelden / Ändern )

Facebook-Foto

Du kommentierst mit Deinem Facebook-Konto. Abmelden / Ändern )

Google+ Foto

Du kommentierst mit Deinem Google+-Konto. Abmelden / Ändern )

Verbinde mit %s

%d Bloggern gefällt das: