Dovrebbe essere possibile utilizzare una libreria come Language Detection per Java e collegalo con il tuo PL/SQL.
Probabilmente sarà più efficiente usare SQL per fare bayesiano ingenuo filtraggio e utilizzare profili linguistici derivati, ad es. da Wikipedia (sono ben confezionati qui ).
Questi sono solo suggerimenti, non una soluzione completa come richiesto per la taglia, ma dovrebbero aiutare i cercatori di taglie.