Mysql
 sql >> Database >  >> RDS >> Mysql

Testo in lingua bengalese non visualizzato nel file CSV Unicode

Secondo le risposte alla domanda Excel in CSV con codifica UTF8 , Google Docs dovrebbe salvare CSV correttamente, contrariamente a Excel, che distrugge tutti i caratteri che non sono rappresentabili nella codifica "ANSI" utilizzata. Ma forse hanno cambiato questo, o qualcosa di sbagliato, o l'analisi della situazione non è corretta.

Per i caratteri Bangla (bengalesi) correttamente codificati elaborati nei programmi MS Office, non dovrebbero essere necessari "caratteri Bangla", poiché il carattere Arial Unicode MS (fornito con Office) contiene i caratteri Bangla. Quindi i dati sono effettivamente in una codifica non standard che si basa su un carattere appositamente codificato? In tal caso, dovrebbe prima essere convertito in Unicode, anche se forse può essere gestito in qualche modo utilizzando programmi che utilizzano costantemente quel carattere specifico.

In Excel, quando si utilizza Salva con nome, è possibile selezionare "Testo Unicode (*.txt)". Salva i dati come TSV (valori separati da tabulazioni) nella codifica UTF-16. Potrebbe quindi essere necessario convertirlo per utilizzare la virgola come separatore anziché tab e/o da UTF-16 a UTF-8. Ma questo funziona solo se i dati originali sono codificati correttamente.