一、利用第三方网站接口
(1) IPIP.NET
http://freeapi.ipip.net/131.230.255.255
(2)百度开放平台
http://opendata.baidu.com/api.php?query=128.199.117.130&co=&a...
二十画生
6年前 (2018-04-18) 1937℃ 0评论
22喜欢
一、覆盖式发布到非覆盖式发布
由于静态资源与页面的分集群部署,采取覆盖式发布,先发布静态资源还是先发布页面,均会导致在一定时间内页面的错乱或者服务的中断。
采用非覆盖式发布避免了以上问题,实现平滑升级。
二、静态资源版本替换
2.1 利用gulp的replace实现
...
二十画生
6年前 (2018-04-16) 1182℃ 0评论
1喜欢
这是一个对HTML进行分析的快速实时的解析器,可以通过DOM或CSS选择器来查找,提取数据。
下面例子展示此解析器的用法,例子还用到了上方提到的Java采集引擎。
package cfw.test;
import cfw.html.TagSearchRange;
imp...
二十画生
7年前 (2018-04-10) 1279℃ 0评论
3喜欢
此采集引擎利用HttpClient实现,支持http与https,支持自定义UserAgent,自定义Header,支持Proxy,支持HTML抓取,也支持图片抓取。此框架分三个部分:WebClient,Webquest以及ResponseResult,其中WebClient为引...
二十画生
7年前 (2018-04-01) 1217℃ 0评论
3喜欢