La collazione è l'ultima delle tue preoccupazioni, quello a cui devi pensare è il set di caratteri per la colonna/tabella/database. Le regole di confronto (regole che regolano la modalità di confronto dei dati). e ordinati ) ne è solo un corollario.
MySQL supporta diversi set di caratteri Unicode, utf8
e utf8mb4
essendo il più interessante. utf8
supporta i caratteri Unicode nel BMP
, ovvero un sottoinsieme di tutto Unicode. utf8mb4
, disponibile da MySQL 5.5.3, supporta tutti di Unicode.
La collazione da utilizzare con una qualsiasi delle codifiche Unicode è molto probabilmente xxx_general_ci
o xxx_unicode_ci
. Il primo è un algoritmo di ordinamento e confronto generale indipendente dalla lingua, il secondo è un più completo algoritmo indipendente dalla lingua che supporta più funzionalità Unicode (ad es. trattando "ß" e "ss" come equivalenti), ma è quindi anche più lento.
Vedi https://dev.mysql.com/ doc/refman/5.5/en/charset-unicode-sets.html .