Oracle
 sql >> Database >  >> RDS >> Oracle

Qualcosa di sbagliato nell'usare Windows-1252 invece di UTF-8

Windows 1252 è uno dei tanti set di caratteri a dimensione fissa. Il Mac ha il suo set. ci sono alcuni ISO per varie parti dell'Europa e per alcune altre parti del mondo. La maggior parte presenta lievi variazioni.

Il punto positivo è che hai un carattere di dimensione fissa, il che significa 1 carattere =1 byte qualunque cosa accada.

I punti negativi sono:

  • Alcune persone potrebbero non aver installato la tua codifica
  • Alcune persone potrebbero utilizzare una codifica leggermente diversa, causando pochissimi problemi, non ovvi da vedere, ma molto brutti a lungo termine
  • Puoi supportare solo poche lingue

Ciò include qualsiasi citazione che vorresti fare. In Windows-1252 non puoi visualizzare russo, greco, polacco...

UTF-8 è la codifica standard per la rappresentazione Unicode su 1+ byte. Può rappresentare la maggior parte dei caratteri che potresti incontrare, sebbene sia progettato per le lingue di origine latina, poiché altre lingue occupano più spazio di archiviazione.

Viene utilizzato in XML, JSON e nella maggior parte dei tipi di servizi Web che potresti trovare. È una buona impostazione predefinita quando non sai quale codifica usare. Consente di limitare il numero di problemi di codifica, come "Pensavo fossi in Latin-1 / No, stavo usando latin-9, ma poi questo tizio su mac usava Roman". Se hai più di 1 persona che lavora sul contenuto del sito web, potrebbero avere codifiche diverse sulla loro plateforme e quindi il tuo contenuto potrebbe essere incasinato a un certo punto.

UTF-8 è, per quanto ne so, l'unico modo per standardizzare facilmente la codifica utilizzata tra le persone senza discussioni.

Un tipico esempio è che se il tuo sito web è codificato in Windows1252 e il nuovo sviluppatore ha un Mac, probabilmente avrai dei problemi.