Neulich im TechNet-Forum wollte jemand wissen, wie man Text aus HTML extrahiert.
Ich musste das vor Kurzem auch für ein Projekt umsetzen, wobei es nicht darauf ankam, den tatsächlich sichtbaren Text in der tatsächlich angezeigten Reihenfolge darzustellen. Und das geht so:
Wenn die Seite von einem Webserver geladen wird,
Wenn die Seite aus einer HTML-Datei geladen wird,
Danach ist die Vorgehensweise identisch:
Antworten