Senza vedere un piccolo frammento di problema dell'iolog stesso, non posso dire perché il replay va sempre il più veloce possibile. Tieni presente che le attese sono in milli i secondi e le successive attese nell'iolog DEVONO aumentare se le successive devono avere effetto (in quanto sono relative all'inizio del lavoro stesso e non tra loro o I/O precedenti). Vedere la sezione "Trace file format v2" dell'HOWTO per maggiori dettagli. Questo problema sembra una buona domanda per la mailing list di fio (ma poiché è una domanda per favore non inserirla nel bug tracker).
numjobs è documentato solo come creazione di cloni nell'HOWTO quindi la tua esperienza corrisponde al comportamento documentato.
Purtroppo fio replay attualmente (fine 2016) non funziona in modo tale che un singolo file di replay possa essere diviso arbitrariamente tra più lavori e sono necessari più lavori per far sì che fio utilizzi più thread/processi. Se non ti dispiace il fatto che perderai l'ordine di I/O tra i lavori, puoi dividere l'iolog in 4 parti e creare un lavoro che utilizzi ciascuno dei nuovi file iolog.