web分析4种方法
更新时间:2024-03-05 19:08:01 阅读量: 综合文库 文档下载
- web攻击方法有以下哪种推荐度:
- 相关推荐
进行web分析,首要也是非常重要的一步就是有效的收集web数据,当用户和web站点进行交互时,通常有四种方法可以用来收集数据:web日志文件、web beacons、Javascript标记以及包嗅探器,本文将对这种方法进行详细描述。
一. 捕获点击流数据的方法
1) Web日志——应当用于搜索引擎日志分析 捕获过程:
? ? ?
客户在浏览器上输入url 页面的请求到达web服务器
web服务器接受请求,在web日志中为这个请求创建一个条目(通常捕获的数据包
括页面的名称、IP地址、客户的浏览器以及日期时间戳等)
web服务器将页面发送给客户
优点:web日志可能是最容易被访问的数据源;可以捕获和存储搜索引擎机器人对于站点的访问和行为的唯一的数据捕获机制;使用web日志,总是可以拥有数据。
注意点:web日志主要是为了捕获技术信息(404错误、服务器使用趋势、浏览器类型等)而创建的,如果用于捕获商务和市场信息并不理想;如果web服务器没有设置cookie,对访客进行某种程度的准确识别将是比较困难的;ISP和代理服务器缓存的页面意味着一些流量对web服务器来说是不可见的,因此日志文件里就没有那个请求的条目。
2) Web beacons——用于追踪客户行为和电子邮件的打开和查看机率
Web beacons通常是web页面中1*1像素的透明图像,位于一个img src的html标记之内。这个透明图像通常存放在一个第三方的服务器上,与存放web页面的服务器不同。
捕获过程:
?
? ? ? ?
客户在浏览器上输入url 页面的请求到达一个web服务器
web服务器将页面返回,连同一个对第三方服务器上的1*1像素的图像的获取请求 页面被加载,执行对该1*1像素的图像的调用,发送页面视图的数据给第三方服务
器
第三方服务器将图像返回浏览器,一起返回的还包括可以读cookie和捕获匿名访客
数据,这些数据包括已经浏览的页面、IP地址、页面浏览的时间、之前设置的cookie和更多的内容
Web beacons也可以用于电子邮件,和web页面一样,当邮件被下载到邮件阅读器则请求透明图像,邮件是否被阅读的数据就被返回和记录。
优点:web beacons易于实现;由于机器人并不执行图像请求,所以web beacons不会收集到无用于数据,这样可以使得日志可以维持在一个可管理的规模上,不需要复杂的过滤
注意点:
?
? beacons常常和广告以及广告网联系在一起,因此可能受到一些指责;跨越多个站点
追踪一个访客的行为,其中很多隐私问题会被披露,因此很多访客使用全局的选项配置,或者使用工具软件自动删除cookie,这些都削弱了web beacons的数据收集能力
? ?
如果在邮件程序中关闭了图像请求,web beacons也无法收集邮件信息了
beacons不能像javascrip标记那样,可以对要捕获的数据进行扩展和定制,它捕获的
数据少,但可以跨越很大范围的站点
根据其特性,beacons和第三方的服务器进行交互,主要是设置第三方的cookie,有
些浏览器不接受或者不显示第三方的cookie,工具软件也可能会删除第三方的cookie,这都使得beacons难以追踪用户的访问
3) Javascript标记——最流行的捕捉方式 捕获过程:
?
? ? ? ?
客户在浏览器中输入url 页面的请求到达一个web服务器
Web服务器将页面返回,连同附加在这一页面上的javascrip的代码片段
页面被加载,执行javascript的代码,收集信息,包括浏览的页面、关于访问者会话
的细节、cookie,然后返回给数据收集服务器
有些情况下,当收到第一批数据的时候,服务器就将其余的代码返回给浏览器来设
置cookie或者获取更多的数据
好处:如果不能访问web服务器和web服务器日志,javscrip标记是唯一的选择,通过这种方式可以轻松的在页面中安装这些标记,或者使用ASP供应商来生成报表;不用担心页面缓存的问题,只要javscript标记可以执行,分析工具就可以收集数据;收集数据更灵活,还可以在一些特定的页面上实现定制的标记;javascript使得数据服务和数据捕获相分离;如果使用第三方的cookie,跨越多个域来跟踪用户变得更容易。
注意点:
?
? ?
不是所有的用户都会开启javascript,目前还是有极少数的用户关闭了javascript 在页面上创建标记以收集数据,是一个艰苦的过程,需要在站点演化的过程中进行
定期的维护
javascript标记收集的是“浏览器端”的数据,而不是“服务器端”的,一些站点并不是
在cookie或url参数中存储数据,而是在访客会话期间,将数据存储在服务器上,这种情况下,标记是不能获取到相应的数据的
?
? ?
用javascript标记捕获关于下载和重定向的数据要比web日志更困难
如果站点的javascript已经负荷很重,站点上已经有大量的javascript在完成一系列
智能化工作,慎用javascript标记来收集数据,有些情况下,可能造成冲突,甚至使网站无法正常工作
4) 包嗅探器——专业性更强,但是也更复杂;如果javascript能够满足,暂时不考虑包嗅探器
捕获过程:
? ?
客户在浏览器中输入url
请求被路由到web服务器。但在请求到达之前,它会通过一个基于软件或硬件的包
嗅探器,收集请求的一些属性,将关于访问的更多数据返回给包嗅探器
包嗅探器将请求发送给web服务器
请求先传送给包嗅探器,然后返回给客户。包嗅探器捕获返回的页面信息并存储数
据。一些包嗅探器方案的厂家还附加了javascript标记,从而可以回送给包嗅探器更多关于访问者的数据
? ?
? 包嗅探器将页面发送给用户浏览器
好处:既可以收集到服务器端信息可以收集到用户端信息,可以即刻收集大量信息,要比用标准的javascript标记快得多
注意点:对于大多数公司来说,很难说服IT部门在web服务器端加一个额外的软件层或者物理硬件,对于这种非标准的做法,可能会遭到反对;包嗅控器收集Internet web服务器流量的原始包,面临着两个挑战:一个是需要将需要数据从原始数据中解析出来,另一个是隐私问题,原始数据中包括了用户的隐私数据;使用包嗅探器方法的同时,还需要使用javascript标记的方法,否则数据收集不全面。
正在阅读:
web分析4种方法03-05
建设工程施工技术资料目录06-04
律师尽职调查报告07-17
迈出勇敢的一步作文450字07-07
秋天的作文200字04-01
某车间零件传送设备的传动装置设计05-08
《钱学森在美国》阅读答案09-08
育种资料05-31
第四章 - -帐务处理程序01-24
- 多层物业服务方案
- (审判实务)习惯法与少数民族地区民间纠纷解决问题(孙 潋)
- 人教版新课标六年级下册语文全册教案
- 词语打卡
- photoshop实习报告
- 钢结构设计原理综合测试2
- 2014年期末练习题
- 高中数学中的逆向思维解题方法探讨
- 名师原创 全国通用2014-2015学年高二寒假作业 政治(一)Word版
- 北航《建筑结构检测鉴定与加固》在线作业三
- XX县卫生监督所工程建设项目可行性研究报告
- 小学四年级观察作文经典评语
- 浅谈110KV变电站电气一次设计-程泉焱(1)
- 安全员考试题库
- 国家电网公司变电运维管理规定(试行)
- 义务教育课程标准稿征求意见提纲
- 教学秘书面试技巧
- 钢结构工程施工组织设计
- 水利工程概论论文
- 09届九年级数学第四次模拟试卷
- 方法
- 分析
- web
- 出嫁回门宴司仪主持词
- 采矿工程参考文献
- 电大国际经济法练习案例期末资料
- 甲控材料材料、设备管理办法
- 在市委组织部干部监督员座谈会上的讲话
- 第1章三角函数测试1(苏教版必修4)
- 湖南省浏阳一中、攸县一中、醴陵一中2014-2015学年高一上学期12
- 管理培训通讯稿
- 政治环境对会计的影响
- 海康威视ehome协议设备操作流程
- 《常州市市区普通住宅物业公共服务分项目收费标准》
- 2015年春浙大远程法学专业经济法在线作业答案
- 广告公司邀标书及附件
- 财政学复习提纲0
- 机设设计要求 - 图文
- 一年级奥数排队中的问题练习
- 经典法语爱情美句伤感
- 学校田径运动会管理系统
- 2019电子政务实验报告
- CSSCI来源核心期刊目录(2019-2020)完整版1 - 图文