Hallo allesamt!
Falls jemand wie ich gerne Connectoren baut um Daten von irgendwelchen Webseiten aus dem HTML Code abzugreifen, dann ist der- oder diejenige wahrscheinlich öfter schon auf das Problem gestossen, dass im HTML Code bestimmte, auf der Webseite dargestellte Zeichen, nur durch einen Code dargestellt sind, zum Beispiel ein € Zeichen wird dann mit dem Code "€
" (ohne "") dargestellt.
Da ich Schwierigkeiten hatte, eine herunterladbare Liste an Zeichen und Codes zu finden, habe ich jetzt selbst mal eine erstellt, welche die gängigsten Zeichen enthält. Das angehängte Excel File beinhaltet insgesamt 7 verschiedene Tabellenblätter inklusive dem Zeichen und den dazugehörigen HTML Code, aufgeteilt nach Themen wie "Currency", "Letters" oder zum Beispiel "Punctuation".
Viel Spass damit und happy scraping!