PostgreSQL
 sql >> Database >  >> RDS >> PostgreSQL

Parametro chunksize ottimale in pandas.DataFrame.to_sql

Nel mio caso, sono state inserite 3 milioni di righe con 5 colonne in 8 minuti quando ho usato i panda to_sql parametri della funzione come chunksize=5000 e method='multi'. Questo è stato un enorme miglioramento poiché l'inserimento di 3 milioni di righe utilizzando Python nel database stava diventando molto difficile per me.