Saltar al contenido

Scrapear urls de un site, y controlar por fecha la dirección pasada

publicado

Buenas tardes,

Espero no repetirme, antes de nada he buscado, pero me he podido saltar algo. El caso, esque intento scrapear una web llamada racingpost.com, y no consigo encontrar la forma de obtener las urls de los enlaces. Os paso el código por si alguien sabe la fórmula.

Por otro lado, la url lleva un control de fechas, se puede automatizar?

++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++

++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++

Sub Racing()

With ActiveSheet.QueryTables.Add(Connection:= _

"URL;http://www.racingpost.com/horses2/cards/home.sd?r_date=2015-02-12&group_by=by_time", Destination:=Range("A8"))

.Name = "hello"

.FieldNames = True

.RowNumbers = False

.FillAdjacentFormulas = False

.U = True

.PreserveFormatting = True

.RefreshOnFileOpen = False

.BackgroundQuery = True

.RefreshStyle = xlInsertDeleteCells

.SavePassword = False

.SaveData = True

.AdjustColumnWidth = True

.RefreshPeriod = 0

.WebSelectionType = xlEntirePage

.WebFormatting = xlWebFormattingNone

.WebPreFormattedTextToColumns = True

.WebConsecutiveDelimitersAsOne = True

.WebSingleBlockTextImport = False

.WebDisableDateRecognition = False

.WebDisableRedirections = False

.Refresh BackgroundQuery:=False

End With

End Sub

++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++

++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++

Con una orientación me conformo, asi aprendo de una vez.

Un Cordial Saludo.

Featured Replies

No hay posts para mostrar

Archivado

Este tema está ahora archivado y está cerrado a más respuestas.