Mysql
 sql >> Database >  >> RDS >> Mysql

Indice di parole PHP, prestazioni e risultati ragionevoli

Prendi un elenco di parole chiave (non parole chiave) da qui, il ragazzo le ha persino formattate in php per te.http://armandbrahaj.blog.al/2009/04/14/list-of-english-stop-words/

Quindi esegui semplicemente un preg_replace sulla stringa che stai indicizzando.

Quello che ho fatto in passato è rimuovere i suffissi come 's', 'ed' ecc. con regex e utilizzare la stessa regex sulla stringa di ricerca. Non è l'ideale però. Questo era per un sito web di base con solo 200 pagine.

Se sei preoccupato per le prestazioni, potresti prendere in considerazione l'utilizzo di un motore di ricerca come Lucine (solr) invece di un database. Ciò renderà l'indicizzazione molto più semplice. Non vuoi reinventare la ruota qui.