In Linux potresti usare iconv
comando come suggerito in: Come rimuovere i caratteri non UTF-8 dal file di testo
iconv -f utf8 -t utf8 -c file.txt
Non ho familiarità con MongoDB, quindi non ho informazioni su come preservare i caratteri non validi durante l'importazione.