网站群标准规范2011版

更新时间:2024-01-11 18:19:01 阅读量: 教育文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

xx网站群开发技术规范

1.1 GSCI概述

为加强对各部门网站的管理,提高相关部门建设与管理网站的水平,我区开发建设了xx网站群系统。新建部门网站可以完全依托于网站群系统进行开发,可省去硬件投资,提高安全性能;已建部门网站也可以通过适当调整,加入网站群系统,提高日常管理效率。为便于部门网站能顺利加入网站群系统,特制定GSCI技术规范,作为我区政府网站内容整合的标准。

1.2 GSCI规范定义

GSCI使用XML作为彼此共享内容的标准方式。它要求综合政府门户网站及其下属部门子网站按照一定的规范发布信息,并按照统一的内容格式发布信息更新列表文件(GSCI文件)。上级政府门户网站则根据GSCI规范进行内容的整合。

GSCI主要由两部分组成,一部分为网站稿件更新列表文件的规范,另一部分为稿件发布的规范。

注:RSS规范本身只对信息更新列表的格式定义了规范,目的是使用户可以通过RSS客户端浏览器阅读信息。而GSCI规范的最终目的是实现门户网站对分散在各子网站系统中信息的整合、分类、汇总、检索、导航,进而提供统一信息检索访问入口,仅有信息更新列表是不够的。要实现这个目标,就需要在RSS规范之上增加网站稿件发布的规范。

1.2.1 稿件更新列表文件(GSCI文件)

GSCI要求子网站定期将最近更新的稿件的名称、链接地址、描述、时间等信息生成一个XML文件,即稿件更新列表文件(GSCI文件),并发布于子网站上,

主网站的抓取系统可以通过HTTP连接的形式取得该文件。

稿件更新列表文件(GSCI文件)内容主要由两部分构成: GSCI Head GSCI Body GSCI Head是对GSCI文件自身进行描述,我们要求GSCI Head中必需具有下面的属性信息: 属性名称 Title 类型 Varchar(50) 属性说明 填写说明 子网站名称(必需属性) 如:区信息委网站填写“xx信息化委员会”; Link Copyright Varchar(100) 子网站的域名(必需属性) Varchar(200) 版权信息 各子网站自定义(可为空) Description Varchar(200) 网站的描述信息 Subsite Varchar(50) 网站所属部门(必需属性) 名字规范要求如字典表中区县委办局名称定义 Location Int 所属地区 填地区编号,具体参见按国家行政部门编号填写

GSCI Body GSCI Body是对更新列表所记录的稿件进行描述,每个稿件包含下表的属性信息:

属性名称 类型 属性说明 定义规范以及备注

属性名称 Title Link Description Status 类型 属性说明 定义规范以及备注 文章的标题 url 可为空 0---新增 1---撤稿 Varchar(200) 名称 Varchar(4000) 文章链接 Varchar(4000) 描述 Int 稿件状态 PubDate datetime 发布时间 文章发布时间 注:Varchar 字符串类型,Int 整数类型Datetime日期类型

1.2.2 GSCI文件格式

GSCI文件在RSS 2.0的基础上扩展而形成,文件命名格式为:GSCIYYYYMMDDhhmm.xml的形式,即GSCI+年(4位)+月(2位)+日(2位)+小时(2位)+分钟(2位)+.xml,如:GSCI200504180124.xml。文件格式如下:

网站名称(为上海普陀) 网站地址

网站版权

网站所在委办局名称(为xx) 地区(区县)(普陀为4)

<![CDATA[稿件名称]]> 稿件地址(为http完整地址) 稿件日期

0

<![CDATA[稿件名称]]> 稿件地址(为http完整地址) 稿件日期

0

1.2.3 稿件发布规范

为统一和规范子网站的信息发布,GSCI要求子网站发布的每一篇稿件必须在HTML的头区中,以meta的形式将网站名称、信息类别、稿件ID等信息发布出来,以利于门户网站实现信息整合。

各级政府网站在发布信息时在页面上增加以下属性。

属性名称 Title Guid 类型 属性说明 定义规范以及备注 文章的标题 Varchar(200) 名称 Varchar 文章唯一标机构代码(3位)+类别(1识 位)+文章类型代码(5位,一般通用稿件为00001,信息公开稿件为00002)年(4位)+稿件id(7位) PubDate Description datetime 发布时间 文章发布时间 可为空 Varchar(4000) 描述

属性名称 Source 类型 属性说明 定义规范以及备注 Varchar(4000) 文章的原始可为空 来源 Category Varchar 信息类别 填类别。名字规范参见:1.4.6 字典/标准类别。 Author TimeAvailability Varchar(200) 作者 Int 有效时间 可为空 以天为单位,默认0永远有效 importance Int 重要性级别 (默认0或缺省不区分重要性),状态按要求由区县委办局自行定义 Language Int 语种 1----中文 2----英文 Text Location Varchar Int 正文 所属地区 可为空 填地区编号,具体参见按国家行政部门编号填写 Status Int 稿件状态 0---新增 1---撤稿 Subsite Varchar 稿件所属网填部门名称。名字规范参站 见:1.4.2 字典/部门。 注:Varchar 字符串类型,Int 整数类型Datetime日期类型

1.2.4 稿件发布规范格式

遵循GSCI规范的网站稿件发布规范格式如下:

\

在正文处标记

…………..正文内容……….…

1.3 XML规范

1.3.1 XML命名和存放路径规范

XML命名规范:gsci+年(四位yyyy)+月(两位,mm)+日(两位,dd).xml (),即gsciyyyymmdd.xml , 例如:gsci200504180000.xml

XML存放路径规范:区县委办局网站域名+gb+xml, 即

http://website/gb/xml/gsciyyyymmdd.xml

1.3.2 XML文件更新频率

区县委办局政府门户网站XML文件按照上级政府门户网站规范的更新时间进行更新XML文件,XML文件增量更新文章。

1.4 字典表

1.4.1 语种

语种 中文 英文 1 2 编号 1.4.2 部门

部门名称 区政府各部门全称 编号 国家行政单位编号 1.4.3 稿件状态

状态名称 新增 撤稿

0 1 编号 1.4.4 地区

4--xx

1.4.5 区县委办局名称

xx(具体名称见1.4.7)

1.4.6 标准类别

主站类别(13大主类,其他可根据实际情况自行决定添加)

政务新闻 网上办事 查询服务 市民办事 企业办事 投资上海 城市生活 政策法规 上海概览 服务导航 政府信息公开 便民问答 公众监督

1.4.7 机构代码和类别

机构代码 机构名称 机构代码 PA0 xx人民政府 PC3 PA1 xx人民政府办公PC4 室 PA2 xx人民政府法制PC5 办公室 PA3 xx监察委员会 PC6 PA4 xx发展计划委员PC7 会 PA5 xx经济委员会 PC8 PA6 xx商业委员会 PC9 PA7 xx对外经济委员PD0 会 PA8 xx人民政府协作PD1 办公室 PA9 xx国有资产管理PD2 办公室 PB0 xx民防办公室 PD3 PB1 xx科学技术委员PD4 会 PB2 xx人口和计划生PD5 育委员会 PB3 xx信息化委员会 PD6 PB4 xx教育局 PD7 PB5 PB6 PB7 PB8 PB9 PC0 PC1 PC2 PF1 PF2 xx卫生局 xx文化局 xx体育局 xx人事局 xx财政局 xx劳动和社会保障局 xx民政局 xx审计局 长风新村街道办事处 真如镇人民政府 PD8 PD9 PE0 PE1 PE2 PE3 PE4 PE5 PE6 PE7 机构名称 xx档案局 xx建设和管理委员会 xx城市规划管理局 xx房屋土地管理局 xx住宅发展局 xx环境保护局 xx市容管理局 xx城市管理监察大队 xx绿化局 上海市国家安全局普陀分局 上海市公安局普陀分局 xx人民检察院 xx人民法院 xx司法局 上海市工商行政管理局普陀分局 上海市地方税务局xx分局 上海市药监局普陀分局 xx质量技术监督局 xx工商业联合会 xx残疾人联合会 xx人民政府台湾事务办公室 xx人民政府侨务办公室 xx人民政府宗教事务办公室 长寿路街道办事处 宜川路街道办事处

PF3 PF4 PI0 PI1 长征镇人民政府 桃浦镇人民政府 共青团上海市xx委员会 xx红十字会 PE8 PE9 PF0 甘泉路街道办事处 石泉路街道办事处 曹杨新村街道办事处

注:1、分类号按目录分类的结构层次编,共由9位字符表示。其中:一级类目为机构代码,由3位字符表示,具体编码另定。二级类由1位数字表示,为0—9,即机构职能类为0、政策法规类为1、规划计划类为2、业务类为3、其它类为9。

2、区县的机构代码取前三位

本文来源:https://www.bwwdw.com/article/u9no.html

Top