View Code? Open in Web Editor
NEW
This project forked from jumper2014/beikespider
贝壳网房价爬虫,基于Scrapy, 采集北京上海广州深圳等21个**主要城市的房价数据(小区,二手房),稳定可靠快速!支持csv存储,注释丰富,链家网爬虫见我另一个项目
License: Apache License 2.0
beikespider's Introduction
- cd BeikeSpider/beikespider
- scrapy crawl xiaoqu --nolog # 爬取小区数据
- scrapy crawl ershoufang --nolog # 爬取二手房数据
- 小区:171秒抓取18623条小区数据,平均每秒100条
- Python 3.6
- scrapy
- requests
- beautifulsoup4
- 2018/09/15, 爬取二手房数据
- 2018/09/09, 多线程获取城市版块信息,提升爬取速度
- 2018/09/08, 能够按城市和日期存放csv文件
- 2018/09/02, 能够存入csv, 计时,指定城市爬取
- 2018/08/19, 项目创建
- 能够统计价格信息
- 能够爬取租房数据
- 能够爬取小区数据
- 能够爬取新楼盘数据
- 能够设置爬取的城市
- 能够存入MySQL
- 能够记录区县和版块
- 能够爬取二手房数据 (done)
- 进行提速 (done)
- 存入csv (done)
- 能够计时 (done)
beikespider's People
Contributors
Stargazers
Watchers