Mysql
 sql >> Database >  >> RDS >> Mysql

Come inserire i dati di un file CSV in MYSQL usando Python in modo efficiente?

Ci sono molti modi per ottimizzare questo inserto. Ecco alcune idee:

  1. Hai un ciclo for sull'intero set di dati. Puoi fare un commit() ogni 100 circa
  2. Puoi inserire molte righe in un inserto
  3. puoi combinare i due e creare un inserto multiriga ogni 100 righe sul tuo CSV
  4. Se python non è un requisito, puoi farlo direttamente usando MySQL come spiegato qui . (Se devi farlo usando python, puoi comunque preparare quell'istruzione in python ed evitare di scorrere il file manualmente).

Esempi:

per il numero 2 della lista, il codice avrà la seguente struttura:

def csv_to_DB(xing_csv_input, db_opts):
    print("Inserting csv file {} to database {}".format(xing_csv_input, db_opts['host']))
    conn = pymysql.connect(**db_opts)
    cur = conn.cursor()
    try:
        with open(xing_csv_input, newline='') as csvfile:
            csv_data = csv.reader(csvfile, delimiter=',', quotechar='"')
            to_insert = []
            insert_str = "INSERT INTO table_x (ID, desc, desc_version, val, class) VALUES "
            template = '(%s, %s, %s, %s, %s)'
            count = 0
            for row in csv_data:
                count += 1
                to_insert.append(tuple(row))
                if count % 100 == 0:
                    query = insert_str + '\n'.join([template % r for r in to_insert])
                    cur.execute(query)
                    to_insert = []
                    conn.commit()
            query = insert_str + '\n'.join(template % to_insert)
            cur.execute(query)
            conn.commit()
    finally:
        conn.close()