utf8_turkish_ci
e utf8_romanian_ci
-- come mostrato in http://mysql.rjweb.org/utf8_collations.html
(Più, ovviamente, utf8_bin
.)
Per la tua domanda aggiuntiva:stai cercando un "set di caratteri" (non un "collation") che possa rappresentare Emoji e altri caratteri non latini -- UTF-8
è quello da usare. In MySQL è utf8mb4
. Le "confrontazioni" associate sono denominate utf8mb4_...
. Le regole di confronto controllano l'ordine e l'uguaglianza, come indicato nella prima parte della tua domanda sui s
e ş
.
CHARACTER SET utf8
di MySQL è un sottoinsieme di utf8mb4
. Entrambi possono gestire tutte le "lettere" del mondo. Ma solo utf8mb4 può gestire Emoji e alcuni caratteri cinesi.