Ich möchte gerne von Wikipedia den Text extrahieren und verarbeiten. Dieser sieht dann so aus...
{{wiktionary|Harry}}
'''Harry''' may refer to:
==In given names==
\*[[Harry (name)]], a given name in its own right
\*[[Henry (given name)]], of which Harry is the Middle English version
\*[[Harold]], of which Harry is a diminutive version
==In other fields==
\*[[Harry (derogatory term)]], a derogatory term used in Norway
\* Harry, an effects compositing system/non-linear editor from [[Quantel]]
==In fiction==
\*[[Harry Potter (character)]], the protagonist of [[J.K. Rowling]]'s ''[[Harry Potter]]'' series.
\*[[Dirty Harry]] Harry Claghans nickname in the [[Dirty Harry (film series)]]
==View as well==
\*[[Harriet]], a woman's name
{{disambig}}
[[fr:Harry]]
[[no:Harry (andre betydninger)]]
[[pt:Harry]]
[[zh:È)]]
Das ist noch ein einfaches Beispiel. Aber gibt es Möglichkeiten diesen Text einfach in eine XML-Struktur zu bekommen?
Ja, das hier portieren: Wikipedia offline reader
Musst das halt parsen. Evtl. kannst du dir weitere inspiration von einem BBCode-Parser etc.. holen.
Zum Thema BBCode-Parser: http://www.codeplex.com/codeparsernet
Wissensvermittler und Technologieberater
für .NET, Codequalität und agile Methoden