Mysql
 sql >> Database >  >> RDS >> Mysql

Collegamento di MySQL ad Apache nutch

Ottieni la fonte da http://mirror.nyi.net /apache//nutch/apache-nutch-1.2-src.zip

Apri org.apache.nutch.crawl.Crawl classe nel tuo editor.

Ricerca variabile Path crawlDb = new Path(dir + "/crawldb");

La variabile darà un suggerimento su dove sostituire il codice per ottenere il tuo CustomMySQLCrawl classe.

La persistenza si verifica durante questa chiamata:crawlDbTool.update(crawlDb, segs, true, true); // update crawldb Quindi c'è dove dovresti salvarlo nel database. Potresti prendere in considerazione l'integrazione dell'ibernazione a questo punto.