- 历次数据自动采集(自动下载相应pdf,解析pdf数据到mysql数据库)
- 自动爬取最新数据(爬虫自动采集每月最新数据,数据发布5分钟内即由爬虫爬取并解析)
- 爬取当月数据后,推送中签数据到指定端口,方便做下一步拓展(短信通知)
- 提供对外接口,只需输入姓名或编码即可查询中签情况
- 只要摇号网站的模板是采用 广州、深圳、杭州 这种的,都可以自动爬取
- ps:wx 只通过了我 “广州小型汽车摇号” 小程序的申请,其他地区由于主体与地区不符不给我通过,坑。开源,有想搞这方面的可以用起来。
- 首先将sql/内的sql文件导入到数据库中
- 配置config/内的文件。
{
"title":"shenzhen",
"indexUrl":"http://xqctk.jtys.sz.gov.cn/gbl/",
"allowUrls":["xqctk.jtys.sz.gov.cn"],
"ignoreUrls":["http://xqctk.jtys.sz.gov.cn/attachment/2015212/1423707141859.pdf",
"http://xqctk.jtys.sz.gov.cn"],
"dbUrl":"your db url",
"dbPort":"db port",
"dbUser":"db user",
"dbPwd":"db passwd",
"dbName":"db name",
"dbTable":"data table name",
"historyTable":"history table name",
"listenPort":"listen port",
"finishTxt":"中签详细列表数据完成",
"timeTxt":"本期编号",
"totalNumTxt":"指标总数",
"personTxt":"个人",
"companyTxt":"单位",
"normalTxt":"普通",
"newEngineTxt":["新能源","电动"],
"pageTxt":["增量指标摇号结果公告","指标配置结果"],
"resultDate":26,
"http":"http",
"noticeUrl":"http://localhost:2000"
}其中需要重点关注 title 字段的值,这个值关联到不少地方
>> 需要将导入数据库的数据表名字的 template 改为 title 的值
>> 对外接口访问时,需要提供该 title 值
| Author | royalchen |
|---|---|
| royalchen@royalchen.com | |
| royalchen@royalchen.com | |
| website | www.royalchen.com |





