Gefällt dir dieser Artikel?

PHP, MySQL und der Ärger mit UTF-8

erschienen in der Kategorie Webdesign, am 28.03.2012
Schnatterente
Immer wieder liest man im Netz von Problemen mit PHP, MySQL und UTF-8. Der Webserver soll Daten aus der MySQL Datenbank lesen und auf der, in UTF-8 codierten, Webseite darstellen. Trotz der Tatsache, dass die Daten auch in der Datenbank im UTF-8 Format gespeichert sind, werden die Umlaute falsch dargestellt.

Das Fragezeichen des Grauens
Tückisch an diesem Problem ist vor allem auch die Tatsache, dass der Fehler auf dem eigenen Rechner (Lokalhost) oft gar nicht auftritt. So kann es vorkommen, dass man in aller Seelenruhe, auf dem lokal gehosteten Webserver, eine Homepage baut, dann irgendwann glaubt fertig zu sein, und die Seite voller Vorfreude auf den Webspace hochlädt. Dachte man bis eben noch endlich fertig zu sein, wird man nun eines Besseren belehrt und mit bösartigen Fragezeichen, statt Umlauten, beworfen.

Des Fehlers Ursprung begründet sich in der Tatsache, dass die meisten deutschen Provider davon ausgehen, dass ihre ebenfalls deutschen Kunden Webseiten bauen, die mit der ISO-8859-1 Codierung arbeiten. Daher haben sie ihre Web- und Datenbankserver so konfiguriert, dass sie mit dieser Codierung optimal klarkommen.

Zur Fehlerbehebung und vor allem zur Fehlervermeidung (für jene, die nicht auf diese Webseite gestoßen sind, weil sie gerade mit dem beschriebenen Problem kämpfen), sei Folgendes empfohlen: Vor dem ersten Zugriff (Query) auf die Datenbank sollte folgende Codezeile ausgeführt werden:
mysqli_query($dbcon, "SET NAMES 'utf8'");

Dies sorgt dafür, dass der Datenbankserver weiß, dass er sowohl bei Datenbankabfragen als auch bei Inserts oder Updates mit UTF-8-codierten Daten arbeiten soll. Der Befehl muss nicht vor jeder Query ausgeführt werden, es reicht, wenn man ihn vor der Ersten ausführt oder am besten direkt, nachdem man die Datenbankverbindung aufgebaut hat.
$dbcon = mysqli_connect($dbhost,$dbuser,$dbpass);
mysqli_select_db($dbcon, $dbname);
mysqli_query($dbcon, "SET NAMES 'utf8'");
...
mysqli_query(...);
...
mysqli_close($dbcon);

In vielen Foren wird, statt dieser Lösung, empfohlen mit den PHP-Funktionen utf8_encode und utf8_decode zu arbeiten, dies halte ich aber für einen ziemlich (wartungs-) aufwendigen Workaround, der das Problem auch nicht wirklich bei der Wurzel packt.

Hier noch ein paar allgemeine Tipps für eine saubere UTF-8 Webseiten-Umsetzung
  • im HTML Head Bereich angeben, dass die Seite UTF-8 kodiert ist:
    <meta http-equiv="Content-Type" content="text/html; charset=utf-8" />
  • im PHP Header ebenfalls:
    header("Content-Type: text/html; charset=utf-8");
  • alle PHP Dateien UTF-8 kodiert abspeichern

Tschüssikowski, Fragezeichen des Grauens!

UTF-8 Server-Einstellungen

Update 05.02.2014: Weil diesbezüglich gerade eine Frage per Mail rein kam, hier noch ein paar Infos zur Linux-Server-Konfiguration:

Wer seinen eigenen Webserver betreibt, kann sich die oben genannten Punkte (abgesehen vom HTML-Meta-Tag) sparen, indem er die entsprechenden Einstellungen als Standard festlegt.

Apache-Einstellungen: In der Konfigurationsdatei (in der Regel /etc/apache2/http.conf oder /etc/apache2/apache2.conf) des Apache-Webservers fügt man die folgende Zeile hinzu (oder ändert die Codierung, falls die Zeile schon vorhanden ist):
AddDefaultCharset UTF-8


PHP-Einstellungen: In der Datei php.ini (unter /etc/php5/apache2/ zu finden) ändert man die folgenden Parameter, bzw. fügt sie hinzu, falls noch nicht vorhanden:
default_charset = "UTF-8"
[iconv]
iconv.input_encoding = UTF-8
iconv.internal_encoding = UTF-8
iconv.output_encoding = UTF-8

[exif]
exif.encode_unicode = UTF-8

[mssql]
mssql.charset = "UTF-8"

Falls vor einem Eintrag noch ein Semikolon steht, muss dieses entfernt werden (sonst ist er auskommentiert).

MySQL-Konfiguration: In der der Datei /etc/mysql/my.cnf fügt man folgende Einstellungen ein:
[client]
default-character-set=utf8

[mysql]
default-character-set=utf8

[mysqld]
collation-server = utf8_general_ci
init-connect='SET NAMES utf8'
character-set-server = utf8

Das nimmt einem auch das Ausführen der oben gezeigten Query ab. Somit muss man sich bei der Implementierung keine Gedanken mehr um die Codierung machen.

Nachdem die Änderungen vorgenommen wurden, müssen die betreffenden Server neu gestartet werden (# /etc/init.d/apache2 restart, # /etc/init.d/mysql restart).

Geschnatter

49 Kommentare, selbst mitschnattern << < Seite 7/7 > >>
Oliver, am 05.05.2016 um 15:36 Uhr
Danke! Funktioniert super, genau das habe ich gesucht!
Albrecht, am 11.05.2016 um 20:38 Uhr
Endlich eine kurze und vollständige Anleitung! Danke.
Dagmar, am 30.06.2016 um 12:01 Uhr
Vielen Dank. Hat mir sehr geholfen.
gert, am 06.08.2016 um 08:33 Uhr
Hallo, ich habe das mit mysqli_query($db, "SET NAMES 'utf8'");
Ausprobiert und das geht nicht so.

Wenn ich worte mit Umlauten übergebe werden diese dort abgeschnitten.

Beispiel Zürich ohne die Funktion ist der Eintrag in der DB Zürich
Mit dieser Funktion nur Z

Das betrifft alle Felder der DB.
Nachdem wir Deutsch, Französische und spanische Zeichesätze lesen müssen kommt man um utf8_encode_deep nicht herum.
Antwort: Hallo Gert,
dann muss der Fehler bei dir noch wo anders sein. Ich arbeite seit Jahren mit dieser Lösung und habe damit nie Probleme oder irgendwelche Seiteneffekte gehabt. Wichtig ist nur, dass du alles auf UTF-8 konfiguriert hast (wie oben beschrieben) und dass natürlich auch die Datenbanktabellen auf die UTF-8-Kodierung eingestellt sind.

Prüfe am besten auch, ob UTF-8 in den Webserver-Konfigurationen überall als Standardkodierung eingestellt ist, das erspart viel Ärger, wenn man es als Entwickler doch mal an einer Stelle vergisst händisch umzusetzen.
Georg, am 15.10.2016 um 19:12 Uhr
Super! Danke!
Robert, am 19.10.2016 um 10:46 Uhr
Hat super funktioniert!

Besten Dank! :)
Gustav Sommer, am 20.11.2016 um 17:50 Uhr
Danke, habe lange erfolglos gesucht bis ich Deinen Tipp gefunden habe:
Mit HTML-Header:
meta http-equiv="Content-Type" content="text/html; charset=utf-8"
und PHP-Header:
header("Content-Type: text/html; charset=utf-8");
und NATÜRLICH:
mysqli_query($db_link, "SET NAMES'utf8'");
habe ich die Sache im Griff.
D A N K E !