Mysql
 sql >> Database >  >> RDS >> Mysql

Recupero di dati da MySQL in batch tramite Python

Primo punto:un python db-api.cursor è un iteratore, quindi a meno che tu non ne abbia veramente necessità per caricare un intero batch in memoria in una volta, puoi semplicemente iniziare usando questa funzione, cioè invece di:

cursor.execute("SELECT * FROM mytable")
rows = cursor.fetchall()
for row in rows:
   do_something_with(row)

potresti semplicemente:

cursor.execute("SELECT * FROM mytable")
for row in cursor:
   do_something_with(row)

Quindi, se l'implementazione del tuo connettore db continua a non fare un uso corretto di questa funzionalità, sarà il momento di aggiungere LIMIT e OFFSET al mix:

# py2 / py3 compat
try:
    # xrange is defined in py2 only
    xrange
except NameError:
    # py3 range is actually p2 xrange
    xrange = range

cursor.execute("SELECT count(*) FROM mytable")
count = cursor.fetchone()[0]
batch_size = 42 # whatever

for offset in xrange(0, count, batch_size):
    cursor.execute(
        "SELECT * FROM mytable LIMIT %s OFFSET %s", 
        (batch_size, offset))
   for row in cursor:
       do_something_with(row)