Comments (2)
Quizas sea más fácil intentar obtener la marca a partir del codigo upc (las primeras cifras corresponden a la marca)
from preciosa.
El commit d02979c agrega el scrapping de categorias de walmart.
El sitio de walmart utiliza el framework spry que compone las paginas mediante llamadas ajax
por ejemplo, una pagina para una categoria de nivel 3 es por ejemplo Bebidas sin alcohol > Gaseosas > Tónica
En la carga de la página hace una llamada via ajax (via el framework spry) a
"https://www.walmartonline.com.ar/WebControls/hlSearchResults.ashx?busqueda=&departamento=D_bebidas%20sin%20alcohol&familia=&linea=l_TONICA&orderby=undefined&orderbyid=undefined&range=undefined&sid=0.2594193538885615"
que a su vez, invoca a otras sendas url que devuelven Productos, subcategorias, etc. Por ejemplo
https://www.walmartonline.com.ar/WebControls/hlSearchProducts.ashx
el parametro sid
es aleatorio.
Los problema que tengo son
-
del árbol de categorias sólo guardé los nombres y no los parámetros asociados que conforma la url (departamento, familia, linea respectivamente para cada nivel de categoria). Por lo tanto no hay una forma unívoca de construir la url
-
No logro hacer el request GET a la direccion que devuelve el listado de items
In [15]: requests.get('https://www.walmartonline.com.ar/WebControls/hlSearchProducts.ashx?busqueda=undefined&departamento=D_almacen&familia=undefined&linea=undefined&orderby=undefined&orderbyid=undefined&range=undefined&sid=0.90923454555', headers={'HTTP_X_REQUESTED_WITH': 'XMLHttpRequest'}).content
Out[15]: ''
from preciosa.
Related Issues (20)
- Actualizar dependencias a nuevas versiones HOT 1
- Función "lista de compras" HOT 1
- Funcion "Compra actual"
- Funcion "historial de compras"
- TemplateSyntaxError Invalid filter: 'thumbnail_url' HOT 1
- No funciona el autocompleter del buscador HOT 1
- No se puede correr tests
- Categorías de Empresas HOT 1
- Función: Suscribirse a Categoría o Producto o Usuario HOT 1
- importar datasets de super onlines disponibles en scrapinghub
- utilizar trigram de Django 1.10 para recuperar similaridad HOT 1
- Función: Registrar tipo de unidad de producto y calcular precio por unidad base
- Función: Registrar origen del producto o fabricante HOT 3
- autocompletado del buscador se ve feo
- Matching de sucursales de Precios Claros a las de Preciosa
- Importador PreciosClaros desde scrapinghub
- Spider via scrapy para alacena
- Scraper (o contacto) para TiendaConsol
- Soportar productos sin Código de Barras
- Soportar codigosr de barra internos de los super
Recommend Projects
-
React
A declarative, efficient, and flexible JavaScript library for building user interfaces.
-
Vue.js
🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.
-
Typescript
TypeScript is a superset of JavaScript that compiles to clean JavaScript output.
-
TensorFlow
An Open Source Machine Learning Framework for Everyone
-
Django
The Web framework for perfectionists with deadlines.
-
Laravel
A PHP framework for web artisans
-
D3
Bring data to life with SVG, Canvas and HTML. 📊📈🎉
-
Recommend Topics
-
javascript
JavaScript (JS) is a lightweight interpreted programming language with first-class functions.
-
web
Some thing interesting about web. New door for the world.
-
server
A server is a program made to process requests and deliver data to clients.
-
Machine learning
Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.
-
Visualization
Some thing interesting about visualization, use data art
-
Game
Some thing interesting about game, make everyone happy.
Recommend Org
-
Facebook
We are working to build community through open source technology. NB: members must have two-factor auth.
-
Microsoft
Open source projects and samples from Microsoft.
-
Google
Google ❤️ Open Source for everyone.
-
Alibaba
Alibaba Open Source for everyone
-
D3
Data-Driven Documents codes.
-
Tencent
China tencent open source team.
from preciosa.