Saltar al contenido

Web Scraping Campo Dinamico


Recommended Posts

publicado

Saludos amigos, anteriormente yo he realizado Web Scraping obteniendo valores de tablas y esas cosas, hoy estoy intentando con esta simple página

http://preev.com/

que me muestra el valor del BTC, y pues no logro obtener ese valor, si alguien puede echar una mano

gracias

publicado

Hola

Hay cuatro elementos/objetos ¿de cuál quieres obtener el valor? Supongo que de las listas no ¿entonces? Y sobre todo ¿cuál es el dilema?  Por lo menos a primera vista no lo termino de entender ¿supuestamente cambian los nombres de esos elementos/objetos?

Abraham Valencia

publicado
Hace 2 horas, avalencia dijo:

Hola

Hay cuatro elementos/objetos ¿de cuál quieres obtener el valor? Supongo que de las listas no ¿entonces? Y sobre todo ¿cuál es el dilema?  Por lo menos a primera vista no lo termino de entender ¿supuestamente cambian los nombres de esos elementos/objetos?

Abraham Valencia

Gracias por el Interes, el valor que deseo obtener es el que muestra en segundo cuadro de texto, que es el valor del BTC

publicado
Hace 2 horas, José_Santos dijo:

Hola,

En principio el cambio para el Bitcoin / USD lo puedes conseguir accediendo al fichero JSON que encuentras en esta URL: http://preev.com/pulse/units:btc+usd/sources:bitstamp+kraken

La información que extraes del JSON es la que puedes ver en la imagen que he adjuntado.

Parece que devuelve el cambio de dos proveedores de precios.

Saludos.

14.png

Gracias, vere si logro hacer algo usando la URL que indicas, pense inicialmente que seria el valor promedio de ambos valores, pero NO da el mismo valor que muestra la página, seguire indagando a ver si lo logro.

por lo general, la forma que lo hacia yo era obteniendo el campo por su ID o por el classname y luego simplemente leo su contenido, pero con este campo no me funciona,

 

publicado

Comenta cuál es el método que intentas y que dices no funciona, quizá viéndolo sea más fácil darte una salida sobre ese mismo.

Lo otro es que adaptes y/o generes código para seguir la forma en que José sugiere.

Comentas.

Abraham Valencia

publicado

La cotización de la Web no es la real, como ves está redondeado. Seguramente tomen cualquiera de los dos precios y lo redondeen o quizás hagan algún calculo con las dos cotizaciones y el resultado lo redondeen también. Igual si miras el código HTML de la web veas que calculo exacto hacen.

A veces, en Web Scraping, el ID o className no vale, a mucha información accedes a través de XML o JSON, como en este caso.

Para extraer los precios que aparecen en esa URL solo tienes que tratar los datos con la función split como si fuera texto, o si alguien tiene un método para leer JSON con VBA, mejor.

publicado
En 3/8/2019 at 14:43 , bigpetroman dijo:

Saludos amigos, anteriormente yo he realizado Web Scraping obteniendo valores de tablas y esas cosas, hoy estoy intentando con esta simple página

http://preev.com/

que me muestra el valor del BTC, y pues no logro obtener ese valor, si alguien puede echar una mano

gracias

Hola @bigpetroman

Ya probaste con lo siguiente:

Option Explicit

Sub test()
Dim IE As Object
Set IE = CreateObject("InternetExplorer.Application")
With IE
  .Visible = True
  .navigate "http://preev.com/btc/usd"
  Application.Wait Now + TimeValue("00:00:02")
  Debug.Print Split(.document.Title, " ")(0)
  .Quit
End With
End Sub

Saludos!

publicado
En 3/8/2019 at 17:30 , bigpetroman dijo:

por lo general, la forma que lo hacia yo era obteniendo el campo por su ID o por el classname y luego simplemente leo su contenido, pero con este campo no me funciona,

 

Ese mismo valor esta en el titulo de la pagina. A mi se me hizo mas fácil mejor tomarlo de ahí. Cada ciertos segundos se va actualizando.

publicado
Hace 11 horas, digitalboy dijo:

Hola @bigpetroman

Ya probaste con lo siguiente:


Option Explicit

Sub test()
Dim IE As Object
Set IE = CreateObject("InternetExplorer.Application")
With IE
  .Visible = True
  .navigate "http://preev.com/btc/usd"
  Application.Wait Now + TimeValue("00:00:02")
  Debug.Print Split(.document.Title, " ")(0)
  .Quit
End With
End Sub

Saludos!

Muchas gracias @digitalboy, efectivamente si trae el valor, yo intente algo parecido con el objeto "MSXML2.XMLHTTP", pero no me funciono, la propiedad .title siempre está vacia

 

Sub Valor_preev_new()
    Dim sResponse As String
    Dim HTML As New HTMLDocument
    
    
    With CreateObject("MSXML2.XMLHTTP")
        .Open "GET", "http://preev.com/btc/usd", False
        .send
        sResponse = .responseText
    End With
    With HTML
        .body.innerHTML = sResponse
        Debug.Print .Title 'SIEMPRE ESTA VACIO
    End With
        
End Sub

Al final lo realice de dos maneras, una como dice el amigo @José_Santos. usando la  URL: http://preev.com/pulse/units:btc+usd/sources:bitstamp+kraken  tomo 10 los valores seguidos en intervalos de 2 segundos y saco el promedio (los valores rara vez son iguales al mostrado en la página)

 

y la otra forma, que sí da el valor practicamente igual al de la página preev.com fue tomando los valores de bitstamp y kraken de  otra página (por ejemplo "https://es.investing.com/crypto/bitcoin/btc-usd") y hacer el promedio, al final es la forma que se está usando.

la del amigo @digitalboy es una buena opción, lo que no me gusta es la carga de IE, pero bueno

 

Gracias a todos

 

 

 

publicado
Hace 25 minutos , bigpetroman dijo:

Muchas gracias @digitalboy, efectivamente si trae el valor, yo intente algo parecido con el objeto "MSXML2.XMLHTTP", pero no me funciono, la propiedad .title siempre está vacia

 


Sub Valor_preev_new()
    Dim sResponse As String
    Dim HTML As New HTMLDocument
    
    
    With CreateObject("MSXML2.XMLHTTP")
        .Open "GET", "http://preev.com/btc/usd", False
        .send
        sResponse = .responseText
    End With
    With HTML
        .body.innerHTML = sResponse
        Debug.Print .Title 'SIEMPRE ESTA VACIO
    End With
        
End Sub

Al final lo realice de dos maneras, una como dice el amigo @José_Santos. usando la  URL: http://preev.com/pulse/units:btc+usd/sources:bitstamp+kraken  tomo 10 los valores seguidos en intervalos de 2 segundos y saco el promedio (los valores rara vez son iguales al mostrado en la página)

 

y la otra forma, que sí da el valor practicamente igual al de la página preev.com fue tomando los valores de bitstamp y kraken de  otra página (por ejemplo "https://es.investing.com/crypto/bitcoin/btc-usd") y hacer el promedio, al final es la forma que se está usando.

la del amigo @digitalboy es una buena opción, lo que no me gusta es la carga de IE, pero bueno

 

Gracias a todos

 

 

 

@bigpetroman

No hay color entre hacerlo con MSXML2.XMLHTTP a hacerlo con IE, el segundo método es muy lento en el caso de que en el proceso se quieran extraer varias URL´s, aunque, para este caso en particular es idóneo.

El valor del Bitcoin de esta Web no es real ya que está redondeado... te aconsejo lo extraigas de otras maneras alternativas como has comentado.

Saludos.

 

Archivado

Este tema está ahora archivado y está cerrado a más respuestas.

  • 109 ¿Te parecen útiles los tips de las funciones? (ver tema completo)

    1. 1. ¿Te parecen útiles los tips de las funciones?


      • No
      • Ni me he fijado en ellos

  • Ayúdanos a mejorar la comunidad

    • Donaciones recibidas este mes: 0.00 EUR
      Objetivo: 130.00 EUR
  • Archivos

  • Estadísticas de descargas

    • Archivos
      187
    • Comentarios
      97
    • Revisiones
      28

    Más información sobre "Un juego del Rabino en Excel"
    Última descarga
    Por pegones1

    1    1

  • Crear macros Excel

  • Mensajes

    • Hola nuevamente. Por eso la importancia de lo que mencionas tú como "ruta relativa". Tal cual comentas, y aún sin llegar a algunos detalles importantes para ayudarte, en realidad tal cual te comenté le día miércoles, pues sí podías hacer como comentabas, era cosa de obtener los Id de Windows (como tú los llamas) y la ruta de OneDrive en casa usuario y eso sí se puede obtener con VBA y luego pasarlo a PQ, pero medio que te cerraste en que "PQ no puede trabajar con rutas relativas", cosa cierta pero siempre hay formas. Si SAP puede o no guardar en OneDrive o SharePoint, pues si está mapeado en la PC ¡claro que se puede! Pero bueno, creo que si te es útil tu propia propuesta ¡avanza con eso!
    • Perdona @Abraham Valencia pero he estado liado estos días. En realidad todo el problema se reduce a estos dos problemas: Problema 1: El script que "fabrica" SAP y que luego "pego" en la macro, no es capaz de  guardar archivos en SharePoint. He estado buscando, y en realidad muchas personas tienen ese problema (no poder guardar un Excel en SAP a través de VBA). Eso muy probablemente sean problemas de permisos, que no puedo cambiar (no soy administrador de nada). Como no puedo solucionarlo así, paso al plan B, que es guardar en Excel que me genera SAP en el ordenador de cada usuario que ejecute la plantilla (y que sí está guardada en SharePoint), para después con PowerQuery llamar a ese Excel (el export). Para ello, pretendo guardar el export, en la ruta relativa "C:\..\..\..\OneDrive - NombreEmpresa\Documentos\SAP\SAP GUI" donde los \..\..\..\ saltan las rutas personales de cada usuario (tipo C:\users\IDusuario\). Eso lo hace bien, y el archivo se guarda en la ruta de cada usuario que lo usa, pero surge el problema 2 Problema 2: PowerQuery no trabaja con rutas relativas del tipo  "C:\..\..\..\OneDrive - NombreEmpresa\Documentos\SAP\SAP GUI" necesita que sea del tipo fija "C:\users\IDusuario\OneDrive - NombreEmpresa\Documentos\SAP\SAP GUI" pero claro, IDusuario es diferente para cada usuario.   Pero escribiendo todo esto, creo que he dado con una posible solución, no grabar el export en una ruta de usuario, sino en una en la raiz de C:, que siempre será igual para todos los usuarios, del tipo C:\Sap\export.xlsx que seria igual en todos los ordenadores. Asi sí podría decirle a PowerQuery que vaya siempre a la ruta C:\Sap\ que existirá en todos los ordenadores. Mañana intentaré hacer pruebas, aunque mi solución ideal seria que se pudiera guardar en el SharePoint. Saludos.
    • Hola La opción brindada por @torquemada es correcta, funciona, pero hay algunos inconvenientes que (desde mi punto de vista) no la convierten en mi primera elección. Los inconvenientes son: Tendrías que ir columna por columna haciendo los reemplazos, claro que no se harían a mano sino que utilizarías la opción reemplazar o la opción texto en columnas, aun asi demorará un poquito y será trabajoso. Cada vez que descargues otro listado, tendrás que volver a realizar los reemplazos. Me parece una mejor propuesta lo siguiente: Descarga los movimientos a un archivo de Excel Desde tu control de pagos (otro archivo) cargas los movimientos del archivo descargado mediante Power Query Power Query hará los reemplazos y reconocerá todo correctamente (sin que tengas que hacer nada especial) Cuando descargues los movimientos un día posterior, solamente tendrás que hacer clic en "Actualizar" y todo funcionará en automático
    • Hola a todos, Efectivamente, me temo que tal como trabajan las funciones =HOY() y/o =AHORA() (volátiles), sólo con macros puedes obtener soluciones. Un recurso pedestre podría ser, cada vez que quieras que se fije un dato, te sitúes en esa celda y pulses F2, F9 e INTRO.  Pero claro, puede ser un inconveniente si hay que hacerlo repetitivamente en muchas ocasiones,.............. en fin, lo comento sólo como posibilidad. Saludos,
    • Hola nuevamente, mi duda sigue siendo la ruta, o rutas, finales que quedan, esas que llamas "relativas"; igual por si acaso pon 3 o 4 de esas, tal cual son y/o se ven en el explorador de cada PC y, de ser posible, en cualquier otro "lado" en que las veas.
  • Visualizado recientemente

    • No hay usuarios registrado para ver esta página.
×
×
  • Crear nuevo...

Información importante

Echa un vistazo a nuestra política de cookies para ayudarte a tener una mejor experiencia de navegación. Puedes ajustar aquí la configuración. Pulsa el botón Aceptar, si estás de acuerdo.