计算机系统可靠性

更新时间:2023-08-30 05:05:01 阅读量: 教育文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

第二章 计算系机的可靠性统

统可靠性(余冗、错容、用专 )系统可性用(可正运行、故障可恢常复 系)统部一件致性(臵配理合 )络互连性(连网和隔通的离矛,布线) 环盾安境性(全配电、地接、护) 防检验收:查按照准标、范规、合同协和议

一第节 计机算统的系可靠性与错容

性系统靠可的定义性 :在特时定间内和定特条下系件正常统作工的应相 程度,(d即gree eo fsitaublitiy。) 可性靠的量方测式 系统的:用性可(avilaailbity),即用利。 率可用的平性值均平即均利用,率其计算法方为 :A M=TFB (/TBF + MTMRT)M TF(BMeaTime nBtweee Fniauresl) 故障间隔平均间时 MTR(MTeaTimn To eRpeai)r 统平系均复修间时

系统靠性的获可得靠性 可─┌────┴──────┐ 容─错 性美性完 (fuatl otelrane)c( erfpcteino │)┌ ──┴──── ┐余技术─┬硬件冗冗余完 美件硬完美软件 ( erudnadcy)├软n件冗余├整机完美性 │ ├时|间冗余├ 件完部性 美可信软 | └件信息余冗└器件 完性 | | 静态冗美余(件部余冗 可)用硬 件态重动组 |-被-动重(组后备 tasndb-) |y--动重组主(优美降 级grcaful deegadraitn)o

美性避错技与术 美完追性一种求避技错,即术避免出。要求 组成错系的统个部各、器件件有具可高靠 不性许允错,出或者出率错至降最。 低硬㈠的件可靠性完与美性 电:规范路设、电路计构结、序与竞争 时元器:制造件、筛选、化、容老、寿命差部 :PC件B板、布、位局、臵结、布构、线焊接、安装、 热散机、性械、能率 频机整:体整一、结构致合理、扰干蔽 环境屏:布、局弱强电干、扰静电

美性与完避错技术(续) ㈡软件的可靠与完性美性 )1确正:性件软正有性吗确?软完美件? 吗确性证正的范畴。 2)可用明:软件在一性的环定条件境和用条应 下可件以常运行,正能功正。常3 )兼性容软:对运件环境行运行、平和运 行台件条的适性。 应4)可性信对:户用来,所说使用软件值得的 赖信对,件软生产的心理依赖。性(

三 软件的可)靠与性硬的件靠性可的区 (共别点9 1)最.明的是硬件显有化损耗老现象;软不 件发生变,没化磨损现象有,陈有旧后 的问落题。 .硬2可靠性件决的因定是素时,间受设、 计产、运用的所生有过程响,影软件可 靠性的定决素是与输因入数有关据软件 差的,更错地多定决于人。

3.件的硬错维护纠通可修过复或换失效 更系统重新恢复的能,功软只有通过重 件设。计4. 对件可采用预硬防性护维术预防故技,障 采用开断效部件失办法诊断故障,而的软 则不能件用这采些术技 。.事先估5可靠性测试和可靠计性逐步增 长等技的

术对软件硬件有和同不的义意。

6.

为高硬件提靠可性采可冗余用技,术而同 一件软的余不能提冗高可靠。性7 .件硬靠性检验可法方已建立并,已准标 化且一整有完套整理论的而,件软靠性验 证可法方未仍立,更建没有整完理的论系。体8

.件硬可靠已性有成的产品熟市,而软件场 产品场还很新市。9 .软件错是永恒的,误重可的,而现一些瞬 的间硬错误件可能被会误为认是软件误。 总的说错,来件可靠软性比硬件靠性更 难保可,证即使美是宇航国的局软件统,系其可靠性仍 比件可靠性低一个硬量级数。

容性错容错与技

术㈠错系容的概统念容 技错:在一定术度程容忍故障的 上技。术错容统:采用系错容术的技统 当系统因某种原系因错或出者失效, 系统能继够工续,作序能程够继续行,不 会运因算计机障故而中止被或修改执行,结 构不也包含系统中故引起的障错。差容错 技术称也故为掩障技术(盖aufl tmaksig)n。

容性与容错错技(续)术 余冗术技是错容术技的重要构,它 结增以资源的办法加取可靠性。换由于源资 不同的冗,余技分为术件硬余、软冗冗 件、时间冗余和信余冗余。息资与源成按本线性 加增,故而障概则率按对数可规下 律降 冗余要。耗消源资,当在可应靠与性资 消源耗之进行间权和衡折。衷

双CP容错系U 统一个当 PC板U现故障时出另,个 C一UP保 持继运续。这个过程行用对户是明透的系,没统有 受丝毫到影响,不会更引交易起的失丢充 ,分保证数据一的致和性完整。性系统的容错结构 够提供能系统续连运行的能力,任单何点故 障不会引起统停系,机统提供系线在维护的诊断 工具在应可继续用运转的况下修复情点单 故。障

冗类型余:1.硬 冗余件 :加线路增、设、部件备,成形份。 备.2件软余: 增冗加程,序一个序分程别几用种径途编写, 一按定式执方,行分或多段种表。决3. 间时冗:余 指重复执行,程序令回技卷术。 4.息信冗: 余增信息数加据数位,检错、纠错。

容错㈡统系工方作 式.1自侦动(测Aut-Detecot )通专过的用冗侦测余路线和件软断系统判运行情况 ,现发可的能误和故错障,行严进的 判断与谨析。分认确主机错后,出动后启备系统 侦。测程需序检查主要硬机件处理器与外( 部件设)主、机络、网作操统、系数据库重要、 应程用、序部存外子储系(如磁统盘列)等阵。

为了保证测的侦正性确,止错误判防,断系 可以设臵安统侦测全间时侦测、间间时隔 、测侦数次安等系全,数通冗过余通连线,收信集并记 录些数这据作,分析出处理 数。据可是切换信的基。

.2动切换(自Atuo-witSc)

h当确某一主机认出错时正常主机,除了证 自身保原来任的务继续运行,将根据各种不同 外容错后备模式,的管预接设定的后先作备业程 序进,后续程行及序务服。 系统的管工接作括文包件统、系据数库系、 环境(操统作系平台统)、网地址和应络程 序用等。 如不能确定果统出错系容,错控监心通中过 与理管交互进者有行的效处理。 决定切基换础条件、、延时、断

3.自点恢动复(uAto-Recovry)e故 障主被机换替后,离进线行障故修。修 复复通后过冗通信余线与常主正机连,继而将线 来的工原作序程磁和盘的上数据动切自换回修 复完成的机主上这。个自完动的恢复过程成 户可用以预先设臵,可也以设臵半为动自不恢 或。

复容㈢系错统与部件 包括统级系容错和件部容级错 )系统1容级:错多 系种统错后容备式 模如例:

*

本文来源:https://www.bwwdw.com/article/1evi.html

Top