Mysql
 sql >> Database >  >> RDS >> Mysql

Salva l'URL dell'immagine dalla ricerca di Google su MySQL

Suggerirei di utilizzare la Libreria DOM di PHP . È molto potente e consente di analizzare qualsiasi struttura DOM. Fai riferimento ad alcuni dei suoi esempi e potresti implementarlo facilmente.

L'idea è di studiare la struttura HTML della pagina restituita da Google e di conseguenza utilizzare la libreria DOM per analizzare tag specifici. Da quello che vedo, le immagini sono organizzate come <ul> e <li> tag, come:

<ul class="rg_ul" data-pg="1" data-cnt="6">
    <li class="rg_li" data-row="1" style="width:216px;height:162px"></li>
    <li class="rg_li" style="width:231px;height:162px"></li>
    <li class="rg_li" style="width:218px;height:162px"></li>
    <li class="rg_li" style="width:216px;height:162px"></li>
    <li class="rg_li" style="width:216px;height:162px"></li>
    <li class="rg_li" style="width:217px;height:162px"></li>
</ul>

All'interno di ogni <li> tag ci sono tag aggiuntivi, uno dei quali è <a> . Questo tag sembra avere 2 attributi - "imgrefurl" e "imgurl" - che potrebbero darti l'immagine di cui hai bisogno. Quale di questi 2 attributi ti serve è da esplorare.

In alternativa, c'è un <img> tag all'interno di <li> che ha un attributo "src" contenente l'effettivo binario dell'immagine. Quindi puoi anche analizzarlo. Tieni presente che il file binario è per l'immagine che vedi nella pagina di ricerca e non per l'immagine reale.

Per alcuni suggerimenti a DOM, questo metodo potrebbe essere utile - http://www.php.net/manual/en/domelement.getelementsbytagname.php">http://www.php.net/manual/en/domelement.getelementsbytagname.php .php.net/manual/en/domelement.getelementsbynometag.php e http://www.php.net/manual/en/domelement. hasattribute.php - per leggere tutto <li> tag e quindi analizza quelli che utilizzano la classe "rg_li".

Spero che quanto sopra abbia senso