Sqlserver
 sql >> Database >  >> RDS >> Sqlserver

Come ottenere le coordinate di delimitazione per un codice postale statunitense?

Un'elaborazione del mio commento, che i codici postali non sono poligoni....

Spesso pensiamo ai codici postali come aree (poligoni) perché diciamo:"Oh, io vivo in questo codice postale..." che dà l'impressione di una regione di contenimento e forse il fatto che ZIP sta per "Zona Improvement Plan" aiuta la falsa associazione con i poligoni.

In realtà, i codici postali sono linee che rappresentano, in un certo senso, le rotte del corriere. Geometricamente, le linee non hanno area. Così come le linee sono stringhe di punti lungo un piano di coordinate, le linee del CAP sono stringhe di punti di consegna nello spazio astratto degli indirizzi designati dall'USPS.

Lo sono non correlata alle coordinate geografiche. Quello che scoprirai, però, è che appaiono essere orientati geograficamente perché sarebbe inefficiente per i vettori avere una rotta completamente irrilevante per distanza e posizione.

Cos'è questo "spazio astratto di indirizzi designati dall'USPS"? È così che sto descrivendo l'ampio e misterioso database di posizioni consegnabili gestito dal servizio postale degli Stati Uniti. Gli indirizzi non vengono assegnati in base alla geografia, ma alle rotte percorse dai vettori, che di solito si riferiscono alle strade e alla percorribilità.

Alcuni codici postali a 5 cifre sono solo un singolo edificio, o un complesso di edifici, o anche un singolo piano di un edificio (sì, più codici postali possono trovarsi su un'unica coordinata perché i loro punti di consegna sono stratificati verticalmente). Alcuni di questi, tra gli altri, sono ZIP "unici". Le aziende e le università ottengono spesso i propri codici postali per scopi di marketing o organizzativi. Ad esempio, il codice postale "12345" appartiene a General Electric a Schenectady, New York. (Modifica:in una versione precedente di Google Maps, quando segui quel link, noterai che l'indicatore di posizionamento era sospeso, perché punta a un codice postale, che non è una coordinata. Mentre la maggior parte dei codici postali statunitensi veniva visualizzata una regione su Google Maps, questi tipi non possono perché l'USPS non li "possiede", per così dire, e non hanno area.)

Solo per divertimento, proviamo a verificare un indirizzo in un codice postale univoco. Vai su SmartyStreets e inserisci un indirizzo falso in 12345, come:

Via: 999 Sdf sdf

CAP: 12345

Quando provi a verificarlo, nota che... è VALIDO! Come mai? L'USPS consegnerà un pezzo al ricettacolo per quel codice postale univoco, ma a quel punto spetta a GE distribuirlo. Praticamente qualsiasi cosa interna al codice postale è irrilevante per l'USPS, incluso l'indirizzo stradale (tecnicamente "linea di consegna 1"). Molte università funzionano in modo simile. Ecco maggiori informazioni al riguardo.

Ora, prova lo stesso indirizzo falso, ma senza un codice postale, e invece fai la città/stato:

Via: 999 Sdf sdf

Città: Schenectadia

Stato: New York

Non convalida. Questo perché anche se Schenectady contiene 12345, dove l'indirizzo è "valido", si interseca geometricamente con i codici postali "reali" di Schenectady.

Prendi un altro esempio:militare. Alcune navi militari hanno i propri codici postali. Gli indirizzi militari sono una classe di indirizzi completamente diversa che utilizza lo stesso spazio dei nomi . Le navi si muovono. Le coordinate geografiche no.

La precisione ZIP è un altro divertente. I codici postali a 5 cifre sono i meno "precisi" (sebbene il termine "specifico" potrebbe essere più significativo qui, poiché i codici postali non indicano nulla). I codici postali a 7 e 9 cifre sono i più specifici, spesso a livello di blocco o di quartiere nelle aree urbane. Ma poiché ogni codice postale ha una dimensione diversa, è davvero difficile per dire quali distanze effettive stai parlando.

Un codice postale di 9 cifre potrebbe essere suddiviso in porzioni su un piano di un edificio, quindi hai codici postali sovrapposti per potenzialmente centinaia di indirizzi.

Riga in basso:i codici postali, contrariamente alla credenza popolare, non forniscono dati geografici o di confine. Variano ampiamente e in realtà sono piuttosto inutili a meno che tu non stia consegnando posta o pacchi... ma il compito dell'USPS era quello di progettare percorsi di corriere efficienti, non suddividere così tanto la popolazione in regioni coordinate.

Questo è più il lavoro dell'ufficio del censimento. Hanno compilato un elenco di confini cartografici poiché i codici postali sono "comodo" con cui lavorare. Per fare ciò, hanno sezionato gruppi di indirizzi in blocchi di censimento. Quindi, hanno aggregato i dati del codice postale USPS per trovare la relazione tra i loro blocchi di censimento (che ha alcuni dati di coordinate approssimativi) e i codici postali. Pertanto, abbiamo approssimazioni di come sarebbe tracciare una linea come un poligono. (Apparentemente, hanno convertito una linea 1D in un poligono 2D trasformando un poligono 2D in base al suo contenuto per adattarlo a dati lineari, per ogni codice postale regolare non univoco.)

Dal loro sito web (link sopra):

Un'area di tabulazione del codice postale (ZCTA) è un'entità geografica statistica che approssima l'area di consegna per un codice postale a cinque o tre cifre del servizio postale degli Stati Uniti. Gli ZCTA sono aggregazioni di blocchi di censimento che hanno lo stesso CAP predominante associato agli indirizzi nel Master Address File (MAF) dell'US Census Bureau. I codici ZCTA a tre cifre vengono applicati a grandi aree contigue per le quali l'US Census Bureau non ha un CAP a cinque cifre Informazioni sul codice nella sua MAF. Gli ZCTA non rappresentano esattamente le aree di consegna dei codici postali e non includono tutti i codici postali utilizzati per la consegna della posta. L'US CensusBureau ha istituito ZCTA come una nuova entità geografica simile, ma sostitutiva, alle tabulazioni dei dati per i codici postali intraprese in congiunzione con i censimenti del 1990 e precedenti.

Il set di dati dell'USCB è incompleto ea volte impreciso. Anche Google ha ancora dei buchi nei suoi dati (il 12345 è un buon esempio), ma alla fine Google lo correggerà esaminando manualmente ogni indirizzo e codice postale. Lo fanno già, ma non hanno ancora reso tutti i dati della mappa perfetti. Naturalmente, l'accesso a questi dati è limitato ai termini dell'API ed è molto costoso raccoglierli.

Uff. Sono esausto. Spero che questo aiuti a chiarire le cose. Disclaimer:ero uno sviluppatore presso SmartyStreets. Maggiori informazioni sulla geocodifica con i dati dell'indirizzo.

Ancora più informazioni sui codici postali.