Non vedo problemi con la tua idea. Fallo. Giusto per sottolineare che il tuo metodo è rilevante solo se vuoi sovrascrivere il comportamento integrato che è molto simile a LD.
Ad esempio, con sphinx 1.10-beta, puoi specificare min_infix_len ed expand_keywords e utilizzare i metodi di ponderazione incorporati di sphinx (BM25 e alcuni codici proprietari) per ottenere buoni risultati. http://sphinxsearch.com/blog/ 17/08/2010/come-la-classifica-di-rilevanza-della-sfinge/
Non dimenticare di memorizzare queste query e creare uno script di riscaldamento.