Piwik的数据库结构图
更新时间:2023-07-19 17:02:01 阅读量: 实用文档 文档下载
- piwik统计监控推荐度:
- 相关推荐
Piwik的数据库结构图,Piwik的数据库结构讲解
Piwik的数据库结构图(下载到本地后,另存为放大)
Piwik的数据库结构按照简洁、效率和模块化进行设计。其数据库包含以下部分
Statistics logger(统计记录) Users & Permissions(用户和权限) Site(网站) Archived data(存档数据) Debug / Info log(调试/信息记录) SQL query profiling(SQL查询分析) Statistics logger
统计记录部分包含统计到的用户访问日志,这些数据一些来自于Javascript的标记,
一些包逊于Cookie,一些有PHP获取。每个单独的访问者在Cookie中标记了一个唯一的
visitor_idcookie。在数据库表log_visit中记录了用户的每一次“visit”。例如一个访问者在一天内访问网站两次(中间相隔30分钟),log_visit中就会有两条该用户的记录。
在一次访问中,一个访问者至少会浏览一个页面,我们称每浏览一个页面为一个“action”,每个action都会被定义一个名称(”homepage”, “/blog/hello-world”)和类型(一个定义行为种类的整数)。所有的单独“action”都被储存在表log_action中。
每个用户新的action都被记录到表log_link_visit_action中,其中包含了idaction和idvisit。同时这个表还包含idaction_ref 和time_spent_ref_action 字段,用来记录用户的上一次action。当我们请求第二个页面,程序将从cookie中读取上一个页面的idaction ,并作为
Piwik的数据库结构图,Piwik的数据库结构讲解
action_ref保存,并记录中间的时间time_spent_ref_action.使用这个技术是因为我们不需要去更新上一条记录的时间:我们只需要记录当前上层页面的信息。
Users & Permissions
一个用户被定义为login, password, email 和一个用于请求API的token_auth。对于一个网站一个用户会有不同的access级别(浏览、管理、没有权限或是超级管理员。 Site
一个网站被定义为idsite和 main_url,main_url 是用来指向 site_url,所以它可以有很多的url。
Archived data
存档在piwik中是一段时间的数据聚合。它是由日志处理后得到的有具体含义的数据。 archive_* 表中的每行数据包含一个网站给定的日期/时间段的数据。例如,提条记录idsite = 3的这个网站在2008年2月7日的这周访问网站用户的国家列表。
Piwik的存档中总共有两种不同的数据类型的表:float和blob
archive_numeric_* 表是用来储存数值的。改字段值value使用的是FLOAT类型,
即他可以保存整型和浮点数。比如储存给定时间点网站的访问者数。
archive_blob_* 表用来储存出数字以外的其他任何数据。BLOB是二进制数据类型,可以用来任何数据,比如字符串、字符串转化的序列数组、序列化的对象等。例如用来储存用户在一定时间段内所有的关键词。
事实上两个表都有相同的结构,除了value 字段的类型不同。他们同时包含以下字段: idarchive 用来定义单独的存档。对于一个特殊的网站在一个特殊的时期内(特定的
日期)会是相同的idarchive. 换句话说如果(idsite,period,date1,date2)相同,则idarchive 相同且为主键。
name 是用来记录值value 的描述。例如你想储存不同关键词的数量,比较恰当的name 可以是’Referers_distinctKeywords’
idsite 是记录所属的网站
date1 和 date2 使记录的起始日期和结束日期,如果记录的是一天的数据则
date1 = date2.
period 用来定义周期的类型有: day / week / month / year.
ts_archived 是存档创建的时间戳。这个对确认存档是否还是有效很很大的帮助。比如今天的存档将会有效1小时或1分钟,这个取决于cache lifetime value的值。 value 包含name描述的数据
Piwik的数据库结构图,Piwik的数据库结构讲解
存档表里的每条记录都是由存档处理类进行自动处理的,其中存档处理有多个类:记录管理的是Piwik_ArchiveProcessing_Record_Manager,数值记录的
Piwik_ArchiveProcessing_Record_Numeric,
blob记录的是Piwik_ArchiveProcessing_Record_Blob和字符串blob记录的
Piwik_ArchiveProcessing_Record_Blob_Array。
存档的逻辑可以在Piwik_ArchiveProcessing类中找到,按日存档可以从
Piwik_ArchiveProcessing_Day类中找到,按时间点的存档可以从
Piwik_ArchiveProcessing_Period类中找到。需要注意的是大多数实时处理的存档都是通过插件来执行特殊的事件。
加载存档(或加载处理中的存档)是使用Piwik_Archive类完成的。
从性能上考虑,表按月划分。这就意味着每个月新标就会创建,所以数据会被有规律的划分。如果值使用一张表来储存所有数据,它将变的非常的巨大且查询起来非常的缓慢。数据表划分由Piwik_TablePartitioning类进行处理,按月划分的由Piwik_TablePartitioning_Monthly类完成。
我们使用不同的表结构(FLOAT 和 BLOB),因为它可以非常快速的查询整型/浮点数值。SQL查询会因为数据表非常的轻量(light)而非常的快(并且archive_numeric_* 的每行有固定的长度)。比如我们可以快速的查询最近30天的访客数。
Debug / Info log
表logger_error, logger_message, logger_api_call 和 logger_exception 是用来记录各种各样信息的。
logger_error 是用来记录错误信息。message 中包含line, php
file errfile,backtrace。等。
logger_message 是用来记录所有的调试和系统信息的。
logger_api_call 是用来记录所有的API请求的。他会记录所有的请求参数
(parameter_values)和返回的值(returned_value)、执行时间
(execution_time)和请求地址的IP地址(caller_ip)等。这个信息又来使API请求更加的具体,当返回的值(returned_value)不正确的时候用于调试,监测API接口的使用情况等。
logger_exception 是用来记录所有的异常的。
而整体的逻辑控制是由Piwik_Log来完成的。
SQL query profiling
表log_profiling是用来储存SQL查询的概要信息的。
其他
Piwik的数据库结构图,Piwik的数据库结构讲解
注意:所有的时间戳都是由PHP生成的,而不是使用Mysql自带的NOW(),
CURRENT_DATE()等函数。这是用来确保系统使用不同时间的服务器上的MySQL正常的运行。程序不是基于MySQL服务器的时间的。
未来的改进与优化
整个系统目前还存在很多性能改进的空间。比如,我们可以从以下几个方面进行改进。
按日期划分log_* 表(和archive_* 采用相同的处理方式) 审核大数据量下存档数据的SQL查询。 审核所有的索引策略。 为了避免大量的jions连接(log_visit, log_link_visit_action),我们可以通过复制
(idsite, visit_server_date)字段使数据表非规范化。
正在阅读:
Piwik的数据库结构图07-19
NBU故障解决12-01
光伏系统最大功率点跟踪方法06-04
关于绘画的作文500字07-03
常识判断103-29
2014年EDIUS入门指南手册09-14
英语介词试题经典及解析04-06
中南大学本科生毕业设计题目一览表-中南大学土木工程学院 - 图文04-26
计算机组成原理经典大题及解析06-01
- 教学能力大赛决赛获奖-教学实施报告-(完整图文版)
- 互联网+数据中心行业分析报告
- 2017上海杨浦区高三一模数学试题及答案
- 招商部差旅接待管理制度(4-25)
- 学生游玩安全注意事项
- 学生信息管理系统(文档模板供参考)
- 叉车门架有限元分析及系统设计
- 2014帮助残疾人志愿者服务情况记录
- 叶绿体中色素的提取和分离实验
- 中国食物成分表2020年最新权威完整改进版
- 推动国土资源领域生态文明建设
- 给水管道冲洗和消毒记录
- 计算机软件专业自我评价
- 高中数学必修1-5知识点归纳
- 2018-2022年中国第五代移动通信技术(5G)产业深度分析及发展前景研究报告发展趋势(目录)
- 生产车间巡查制度
- 2018版中国光热发电行业深度研究报告目录
- (通用)2019年中考数学总复习 第一章 第四节 数的开方与二次根式课件
- 2017_2018学年高中语文第二单元第4课说数课件粤教版
- 上市新药Lumateperone(卢美哌隆)合成检索总结报告
- 结构图
- 数据库
- Piwik
- 2015-2016七年级数学上册 3.1.3 列代数式教案 (新版)华东师大版
- 2014年赣州医疗事业单位护理学专业备考指导
- 法律方法论的意义
- 痴呆简易筛查量表
- 卵泡穿刺治疗PCOS所致不孕症
- 中国汽车改装维修市场深度全景调研及“十三五”发展前景预测报告2015-2020年
- “山峰”和“谷底”——MACD股票原油实战修正技巧
- 安全生产管理机构和人员制度 (5)
- 维多利亚风格专题报道
- 2009_2010年浙江大学儿童医院肺炎链球菌耐药性和血清分型
- 2011年吉林师范大学博达学院 人文地理学复习题.doc
- 学术英语理工类abstrcat 1,3,5,6,8,9,11,15,18
- 2011.2012 同济817真题回忆版
- 光伏电站环境风险应急预案
- xx镇2010年世界献血者日 国际禁毒日宣传活动总结
- 二元一次方程说课稿
- 无空列正交试验的设计及SPSS软件的数据处理
- 语义网络:基于语义网络的家族人物关系推理算法的研究
- 标点符号二轮复习
- 物流员试题及答案