Ho lavorato molto su questo tipo di analisi. Poiché ci sono errori, non otterrai una precisione del 100%, ma ci sono alcune cose che puoi fare per ottenere la maggior parte del percorso e quindi eseguire un test BS visivo. Ecco il modo generale di procedere. Non è codice, perché è piuttosto accademico scriverlo, non ci sono stranezze, solo molta gestione delle stringhe.
(Ora che hai pubblicato alcuni dati di esempio, ho apportato alcune modifiche minori)
- Lavora all'indietro. Inizia dal codice postale, che sarà vicino alla fine, e in uno dei due formati noti:XXXXX o XXXXX-XXXX. Se questo non viene visualizzato, puoi presumere di trovarti nella città, parte dello stato, di seguito.
- La prossima cosa, prima dello zip, sarà lo stato, e sarà in un formato di due lettere o come parole. Sai cosa saranno anche questi:ce ne sono solo 50. Inoltre, potresti suonare le parole per compensare gli errori di ortografia.
- prima c'è la città, ed è probabilmente sulla stessa linea dello Stato. Potresti usare un database di codici postali per controllare la città e lo stato in base allo zip, o almeno utilizzarlo come rilevatore BS.
- L'indirizzo stradale sarà generalmente di una o due righe. La seconda riga sarà generalmente il numero della suite, se presente, ma potrebbe anche essere una casella postale.
- Sarà quasi impossibile rilevare un nome sulla prima o sulla seconda riga, anche se se non è preceduto da un numero (o se è preceduto da un "attn:" o "attenzione a:" potrebbe darti un suggerimento se si tratta di un nome o di una riga di indirizzo.
Spero che questo aiuti in qualche modo.