Database
 sql >> Database >  >> RDS >> Database

Utilizzo di dati JDBC non ASCII in Talend

Durante il test di Talend con Easysoft JDBC-ODBC Bridge, abbiamo riscontrato il danneggiamento del testo durante la scrittura di dati non ASCII da un database SQL Server in un file in formato CSV.

La soluzione consisteva nel modificare il tipo di dati per la colonna del problema nello schema Talend da una String a un byte[] . Per fare questo, noi:

  1. Accesso alle proprietà del componente tJDBCInput.
  2. Scegli il pulsante Modifica schema.
  3. Cambiata la definizione del tipo di dati per la colonna pertinente.

La codifica dei caratteri predefinita di Talend è UTF-8. Finché i dati restituiti da un driver JDBC sono ASCII, i dati codificati con una codifica dei caratteri diversa non costituiscono un problema:i dati UTF-8 che contengono solo caratteri ASCII sono identici ai dati.