Jump to content

Java HttpURLConnection ontvangt niet de goede charset


Recommended Posts

Geplaatst: (bewerkt)

Beste GTAForum'ers,

Ik heb een Java applicatie gemaakt die éérst informatie moet ophalen van een website, en hier vervolgens regex methodes op uitvoert. Dit werkt nu allemaal naar behoren, maar ik heb nog één laatste probleem. Alle tekens zoals ’ op de pagina worden omgezet naar ’. Nu heeft dit waarschijnlijk met de Charset te maken, maar als de request header naar ISO-8859-1 zet, maakt dit geen verschil uit. UTF-8 geeft voor mij vrij rare resultaten terug. Zelf ben ik niet erg bekend in de charsets, en ik snap ook eigenlijk niet waarom dit gebeurt in Java.

Weet iemand dus hoe ik kan zorgen dat een ’ een ’ blijft, en dus niet een ’ wordt? Ik kan hier moeilijk een regex patroon op uitvoeren, aangezien er meerdere tekens zijn die zo vervormd worden :(

Bewerkt: door Maikle
Geplaatst:

Opgelost! Ik heb UTF-16 gebruikt, en deze schijnt dus wel deze tekens te ondersteunen, en de charset die Java standaard gebruikt niet.

:slotje:

Een reactie plaatsen

Je kan nu een reactie plaatsen en pas achteraf registreren. Als je al lid bent, log eerst in om met je eigen account een reactie te plaatsen.

Gast
Op dit onderwerp reageren...

×   Je hebt text geplaatst met opmaak.   Opmaak verwijderen

  Only 75 emoji are allowed.

×   Je link is automatisch ingevoegd.   In plaats daarvan weergeven als link

×   Je vorige bewerkingen zijn hersteld.   Alles verwijderen

×   You cannot paste images directly. Upload or insert images from URL.

  • Recent actief   0 leden

    • Er zijn hier geen geregistreerde gebruikers aanwezig.
×
×
  • Create New...