Innan HTML5 introduceras, ställer du in teckenkodningen på ett dokument med ett element som du behöver för att skriva den något ordnade linjen som ses nedan. Detta är Meta Charset-elementen om du använde HTML4 på din webbsida:
Vad som är viktigt att märka i detta kodar de citattecken du ser runt innehåll attribut: innehåll = ' text / html; charset = iso-8859-1 ' . Liksom alla HTML-attribut definierar dessa citattecken värdet på attributet, vilket indikerar att hela strängen text / html; charset = iso-8959-1 är innehåll av detta element.Detta är korrekt HTML och det är hur den här strängen var avsedd att skrivas. Det är också obehagligt långt och fult! Det är inte något du skulle troligen komma ihåg från toppen av ditt huvud! I de flesta fall måste webbutvecklare kopiera och klistra in den här koden från en webbplats till någon ny som de utvecklade, eftersom det var en stor fråga att skriva detta från början.
HTML5 skär ut extra "stuff"
HTML5 lagt inte bara ett antal nya element till språket, men också kraftigt förenklat muchof syntaxen för HTML, inklusive Meta Charset element.With HTML5, kan du lägga din teckenkodning med mycket lättare att komma ihåg syntaxfor denMETA element som du ser nedan:
Jämför den förenklade syntaxen till vad vi skrev i början av den här artikeln, den gamla syntaxen som används för HTML4, och du kommer att se hur mycket enklare att skriva och komma ihåg HTML5-versionen verkligen. Istället för att du behöver kopiera och klistra in det här från en befintlig webbplats till någon ny du arbetade på, så är det absolut något som du som en främst webbutvecklare skulle kunna komma ihåg. Det här besparandet av tid många inte är mycket, men när du överväger de andra syntaxområdena som HTML5 förenklat, lägger besparingarna till!
Inkluder alltid karaktärskodningen
Du bör alltid inkludera teckenkodning för dina webbsidor, även om du aldrig någonsin tänkt använda några specialtecken. Om du inte inkluderar en teckenkodning blir din webbplats sårbar för en skriptattack på flera platser med hjälp av UTF-7.
I detta scenario ser anattacker att din webbplats inte har någon teckenkodning definierad, så det trickar webbläsaren i att tro att teckenkodningen för sidan är faktiskt UTF-7. Därefter injicerar angriparen UTF-7-kodade skript på webbsidan och din webbplats är hackad. Detta är uppenbarligen problematiskt för alla inblandade, från ditt företag till dina besökare. Den goda nyheten är att det är ett enkelt problem att undvika - bara var noga med att lägga till teckenkodning på alla dina webbsidor.
Var ska man lägga till karaktärskodning
Teckenkodningen för en webbsida ska vara den första raden i din HTML-kod
element.Detta säkerställer att webbläsaren vet vad teckenkodningen är innan den gör någonting annat på sidan än att bestämma doktypen och identifiera att det är en HTML-sida. Din HTML ska läsa:…
Använda HTTP-huvuden för extra säkerhet
Du kan också ange teckenkodningen i HTTP-rubrikerna. Detta är ännu säkrare än att lägga till HTML-sidan, men du wouldneed att ha tillgång till serverkonfigurationer eller .htaccess filer, vilket innebär att du kan behöva för att arbeta med din webbplats webbhotellet för att få denna typ av tillgång eller låta göra ändringarna för dig Åtkomst är verkligen utmaningen här. Själva förändringen är enkel, så någon värdleverantör borde kunna göra denna förändring för din med relativ lättnad.
Om du använderApache kan du ställa in standardteckenuppsättningen för hela din webbplats genom att lägga till: AddDefaultCharset UTF-8 till din rot .htaccess fil. Apache standard teckenuppsättning är ISO-8859-1.




