Erkennen des Character encodings durch HTML-Form – MAGIC-Field

Geschrieben von Benjamin Carl am Montag, den 22. März 2010

Bei meinen Zeichensatz-Spielereien in der letzten Zeit bin ich auf eine interessante Möglichkeit gestoßen, den Zeichensatz den der Browser für das Senden von Formulardaten verwendet zu erkennen. Es gibt, ähnlich den Magic-Methoden bei PHP, die Möglichkeit ein speziell benanntes Formularfeld zu erstellen, in das der Browser bei Submit automatisch den verwendeten Zeichensatz einfügt.

Als ich das gelesen hatte, konnte ich mir dies nur schwer vorstellen, zumal ich ja nicht erst seit gestern Formulare für das Netz erstelle. Doch es funktioniert tatsächlich. Allerdings konnte ich dies nur mit Firefox in Version 3.5 und dem Internet Explorer in Version 7 testen (Wenn jemand dies auch mit anderen Browser schon getestet hat, möge er oder sie das Ergebnis docheinfach per Kommentar mit uns teilen).

Einfach folgendes Feld in das Formular einbinden:

1
<input name="_charset_" type="hidden" />

Und schon sollte man das Ergebnis im entgegennehmenden Skript sehen können (Achtung! Der Internet Explorer gibt den Zeichensatz lowercase und der Firefox uppercase an).

Euer
Benjamin Carl

Einen Kommentar schreiben

Kategorie: HTML + CSS, HowTo's, Tipps + Tricks

Die wichtigsten Informationen für UTF-8 mit PHP

Geschrieben von Benjamin Carl am Mittwoch, den 17. März 2010

Immer mal wieder stolpert man über das Thema: “UTF-8 mit PHP” – und es ist wirklich alles andere als angenehm. Die Unterstüztung für Multibyte-Zeichensätze in PHP ist ziemlich dürftig und da bis zum erscheinen von PHP 6 und der anschließenden Migrationsphase auch noch einige Tage vergehen werden, kommt man momentan noch nicht drum herum an vielen Stellen selbst aktiv zu werden und zu validieren, konvertieren usw…

Auf der Suche nach passenden Informationen wird es ja teilweise fast schon kriminell – Was man auf den Ergebnisseiten so lesen kann und wie die Informationen, wohl durch Unwissenheit bzw. “Dem gefährlichen Halbwissen” geschuldet, wild durcheinander gewürfelt werden – oh je!

Ich habe die besten  und aufschlußreichsten drei Ergebnisse ermittelt und möchte diese nun mit euch teilen:

  1. Character Sets / Character Encoding Issues at phpwact.org
  2. Handling UTF-8 with PHP at phpwact.org
  3. UTF-8: The Secret of Character Encoding

Viel Spaß! Und Kommentare sind immer willkommen!

Euer
Benjamin Carl

Einen Kommentar schreiben

Kategorie: Allgemein, HowTo's, PHP5, Tipps + Tricks

benjamin carl

Software-Architekt mit Fokus auf          liest gerade


  • prof.Softwareentwicklung mit PHP
  • test-driven development (TDD)
  • Qualitätssicherung
  • Automatisierung + Standardisierung
    von Entwicklungsprozessen
Get Adobe Flash playerPlugin by wpburn.com wordpress themes