Non puoi farlo facilmente in MySQL .
Il problema è che la relazione "è simile a" come la definisci non è transitiva. Nel tuo esempio, Smith Inc è simile a John Smith (per SSN ) e John Smith è simile a Jane Smith (per nome), ma Smith Inc non è simile a Jane Smith . Quindi non esiste un unico valore con cui confrontare tutti i record e GROUP BY non aiuterà qui.
In altri sistemi che supportano la ricorsione potresti costruire una chiusura transitiva di questa relazione che consentirebbe il raggruppamento, ma questo non è un compito facile in MySQL .