PostgreSQL
 sql >> Database >  >> RDS >> PostgreSQL

Regex Postgresql in modo che corrisponda a lettere maiuscole, compatibile con Unicode

Il motore regexp di PG 9.1 e versioni precedenti non classifica correttamente i caratteri il cui punto di codice non si adatta a un byte. Il punto di codice di 'Ó' essendo 211 funziona bene, ma il codepoint di 'Ą' è 260, oltre 255.

PG 9.2 è migliore in questo, anche se non è ancora adatto al 100% per tutti gli alfabeti. Vedi questo commit nel codice sorgente di PostgreSQL, e in particolare in queste parti del commento:

e

Sfortunatamente questo non è stato riportato alla versione 9.1