使用 spynner 欺骗流量统计

首先流量统计的标准 一般分为两种情况,第一种是后端直接做的统计,这种比较好搞,直接requests获取源代码就可以统计到了,但是大部分是另一种情况,使用CNZZ站长统计、百度统计等,这类统计使用外部js加载统计的,这种直接使用requests获取源代码理论是解析不了js的,没去测试,想了一种模拟真实浏览器去解析js请求,使用spynner扩展就可以了,然后需要获取有效代理,使用有效代理访问就可以了。

看了下主要用到 spynner 的下面几个方法:

#创建一个浏览器对象
browser = spynner.Browser()

#打开浏览器,并隐藏或显示
browser.hide()
browser.show()

#webkit加载页面
browser.load(“http://www.0535code.com”)
print browser.html.encode(“utf-8″)

#关闭该浏览器并删掉实例
browser.close()
del browser

#使用jquery
browser.load_jquery(True)
browser.radio(‘#radiomea’)
browser.wk_check(‘#checkmea’)
browser.check(‘#checkmea’)
browser.wk_select(‘#sel’, ‘aa’)
browser.select(‘#asel option[name=”bbb”]’, remove=False)
browser.fill(‘input[name=”w”]’, ‘foo’)

#配置代理和使用代理下载
browser.set_proxy(‘http://127.0.0.1:8888’)
browser.download(‘http://0535code.com’, proxy_url=’http://127.0.0.1:8888′)

更多使用参考:
https://pypi.python.org/pypi/spynner

发表评论

电子邮件地址不会被公开。 必填项已用*标注