命令服务器维修
服务器维修 时间:2021-05-13 阅读:(
)
SunMicrosystems,Inc.
www.
sun.
com请将有关本文档的意见和建议提交至:http://www.
sun.
com/hwdocs/feedbackSunFireV125服务器管理指南文件号码819-7643-102006年10月,修订版A请回收版权所有2006SunMicrosystems,Inc.
,4150NetworkCircle,SantaClara,California95054,U.
S.
A.
保留所有权利.
对于本文档中介绍的产品,SunMicrosystems,Inc.
对其所涉及的技术拥有相关的知识产权.
需特别指出的是(但不局限于此),这些知识产权可能包含在http://www.
sun.
com/patents中列出的一项或多项美国专利,以及在美国和其他国家/地区申请的一项或多项其他专利或待批专利.
本文档及其相关产品的使用、复制、分发和反编译均受许可证限制.
未经Sun及其许可方(如果有)的事先书面许可,不得以任何形式、任何手段复制本产品或文档的任何部分.
第三方软件,包括字体技术,均已从Sun供应商处获得版权和使用许可.
本产品的某些部分可能是从BerkeleyBSD系统衍生出来的,并获得了加利福尼亚大学的许可.
UNIX是X/OpenCompany,Ltd.
在美国和其他国家/地区独家许可的注册商标.
Sun、SunMicrosystems、Sun徽标、SunFire、SunVTS、SunEnterpriseAuthenticationMechanism、StorEdge、SunATM、Java、OpenBoot、docs.
sun.
com和Solaris是SunMicrosystems,Inc.
在美国和其他国家/地区的商标或注册商标.
所有SPARC商标的使用均已获得许可,它们是SPARCInternational,Inc.
在美国和其他国家/地区的商标或注册商标.
标有SPARC商标的产品均基于由SunMicrosystems,Inc.
开发的体系结构.
OPENLOOK和Sun图形用户界面是SunMicrosystems,Inc.
为其用户和许可证持有者开发的.
Sun感谢Xerox在研究和开发可视或图形用户界面的概念方面为计算机行业所做的开拓性贡献.
Sun已从Xerox获得了对Xerox图形用户界面的非独占性许可证,该许可证还适用于实现OPENLOOKGUI和在其他方面遵守Sun书面许可协议的Sun许可证持有者.
美国政府权利—商业用途.
政府用户应遵循SunMicrosystems,Inc.
的标准许可协议,以及FAR(FederalAcquisitionRegulations,即"联邦政府采购法规")的适用条款及其补充条款.
本文档按"原样"提供,对于所有明示或默示的条件、陈述和担保,包括对适销性、适用性或非侵权性的默示保证,均不承担任何责任,除非此免责声明的适用范围在法律上无效.
iii目录前言xiii1.
简介1挡板特性1服务器状态指示灯2打开定位器指示灯2关闭定位器指示灯2显示定位器指示灯的状态3前面板3On/Standby按钮3控制服务器电源状态4硬盘驱动器4DVD驱动器5系统配置卡5后面板特性8I/O端口8网络状态指示灯9USB端口10外部SCSI端口10电源单元10ivSunFireV125服务器管理指南2006年10月系统提示符112.
拆除和替换组件13可替换组件13避免静电放电14避免在操作前面板时发生静电放电14打开前挡板14打开前挡板14控制服务器电源15打开服务器电源15关闭服务器电源15在服务器之间交换系统配置卡16交换系统配置卡16拆除和替换硬盘驱动器17拆除硬盘驱动器18替换硬盘驱动器19在Solaris运行时安装SCSI硬盘驱动器19在SolarisOS运行时拆除SCSI硬盘驱动器20拆除和替换DVD驱动器22拆除DVD驱动器22替换DVD驱动器233.
SunAdvancedLightsOutManager25SunAdvancedLightsOutManager25电子邮件传送警报26ALOM监视的组件26AutomaticServerRestart27ALOM管理端口27设置admin密码28目录v设置admin密码28ALOM的基本功能28切换到ALOM提示符29切换到服务器控制台提示符29将串行端口的速度设置回默认值29scadmresetrsc命令30TTYB控制台输出304.
SunManagementCenter31SunManagementCenter31SunManagementCenter如何工作32SunManagementCenter其他功能32非正式跟踪32HardwareDiagnosticSuite32互操作性-第三方监视工具33使用SunManagementCenter33获取最新信息33HardwareDiagnosticSuite33何时运行HardwareDiagnosticSuite33使用HardwareDiagnosticSuite的要求345.
SunVTS35SunVTS35SunVTS软件和安全性36使用SunVTS36检查是否安装了SunVTS37安装SunVTS37查看SunVTS文档386.
诊断39viSunFireV125服务器管理指南2006年10月诊断工具概述39状态指示灯40SunAdvancedLightsOutManager40开机自检诊断41启动开机自检诊断-方法141启动开机自检诊断-方法242控制开机自检诊断43OpenBootDiagnostics44启动OpenBootDiagnostics45控制OpenBootDiagnostics测试46test和test-all命令47OpenBootDiagnostics错误消息的内容48OpenBoot命令48probe-scsi命令49probe-ide命令49show-devs命令50运行OpenBoot命令52操作系统诊断工具52错误和系统消息日志文件52Solaris系统信息命令52prtconf命令53prtdiag命令54prtfru命令55psrinfo命令57showrev命令57运行Solaris系统信息命令58最近的诊断测试结果59查看最近的测试结果59目录viiOpenBoot配置变量59查看OpenBoot配置变量59设置OpenBoot配置变量60用于特定设备的其他诊断测试60使用probe-scsi命令确认硬盘驱动器是否处于活动状态60使用probe-ide命令确认是否已连接DVD或CD-ROM驱动器61使用watch-net和watch-net-all命令检查网络连接62自动系统恢复63Auto-Boot选项63设置开关64错误处理摘要64复位过程65启用ASR65禁用ASR66viiiSunFireV125服务器管理指南2006年10月ix图图1-1状态指示灯的位置1图1-2I/O端口8图1-3网络状态指示灯的位置9图1-4系统提示符流程图11图2-1打开挡板14图2-2插入系统配置卡17图2-3拆除硬盘驱动器18图2-4拆除DVD驱动器24xSunFireV125服务器管理指南2006年10月xi表表1-1服务器状态指示灯2表1-2On/Standby开关的操作及结果4表1-3对电源状态的解释4表1-4硬盘驱动器服务指示灯5表1-5系统配置卡上存储的OpenBootPROM配置参数6表1-6网络链路指示灯9表1-7网络速度指示灯10表1-8电源单元指示灯10表3-1ALOM监视的组件26表4-1SunManagementCenter监视的内容31表5-1SunVTS测试36表6-1诊断工具汇总39表6-2OpenBoot配置变量43表6-3obdiag菜单45表6-4用于test-argsOpenBoot配置变量的关键字46表6-5使用Solaris信息显示命令58xiiSunFireV125服务器管理指南2006年10月xiii前言《SunFireV125服务器管理指南》的目标读者是有经验的系统管理员.
本指南包含了有关SunFireV125服务器的一般描述性信息,并包括了对各种服务器管理任务的详细说明.
要使用本手册中的信息,您必须具备有关计算机网络的概念和术语的工作知识,并深入了解Solaris操作系统(SolarisOS).
阅读本书之前本文档不介绍服务器的安装和机架安装.
有关这些主题的详细信息,请参阅《SunFireV125服务器安装指南》.
执行本文档所述的过程之前,请确保已阅读《SunFireV125ServerSafetyandComplianceManual》.
本书的结构第1章概述了SunFireV125服务器的主要特性.
第2章介绍了如何拆除位于挡板后面的硬件组件.
第3章介绍了SunAdvancedLightsOutManager的基本特性和功能.
第4章介绍了SunManagementCenter的特性和功能.
第5章介绍了SunVTS.
xivSunFireV125服务器管理指南2006年10月第6章介绍了SunFireV125服务器的诊断工具.
使用UNIX命令本文档不会介绍基本的UNIX命令和操作过程,如关闭系统、启动系统和配置设备等.
欲获知此类信息,请参阅以下文档:《Solaris10Sun硬件平台指南》Solaris操作系统的有关文档,其URL如下:http://docs.
sun.
com系统附带的其他软件文档Shell提示符Shell提示符Cshellmachine-name%Cshell超级用户machine-name#Bourneshell和Kornshell$Bourneshell和Kornshell超级用户#ALOMshellsc>OpenBootPROMshellok前言xv印刷约定相关文档您可以从以下位置获得所列出的联机文档:http://www.
sun.
com/products-n-solutions/hardware/docs/字体11浏览器的设置可能会与这些设置有所不同.
含义示例AaBbCc123命令、文件和目录的名称;计算机屏幕输出编辑.
login文件.
使用ls-a列出所有文件.
%Youhavemail.
AaBbCc123用户键入的内容,与计算机屏幕输出的显示不同%suPassword:AaBbCc123保留未译的新词或术语以及要强调的词.
要使用实名或值替换的命令行变量.
这些称为class选项.
要删除文件,请键入rmfilename.
新词术语强调新词或术语以及要强调的词.
您必须成为超级用户才能执行此操作.
《书名》书名阅读《用户指南》的第6章.
应用书名文件号码格式所在位置入门《SunFireV125服务器入门指南》819-7625PDF和HTML联机提供管理《SunFireV125服务器管理指南》819-7643PDF和HTML联机提供服务《SunFireV125服务器维修手册》819-7652PDF和HTML联机提供安全和符合标准《SunFireV125ServerSafetyandComplianceManual》817-7425PDF和HTML联机提供最新消息《SunFireV125ServerProductNotes》819-7424PDF和HTML联机提供OpenBootPROM《OpenBootPROMEnhancementsforDiagnosticOperation》817-6957PDF联机提供ALOM《SunAdvancedLightsOutManager(ALOM)1.
6AdministrationGuide》819-2445PDF和HTML联机提供xviSunFireV125服务器管理指南2006年10月文档、支持和培训第三方Web站点Sun对本文档中提到的第三方Web站点的可用性不承担任何责任.
对于此类站点或资源中的(或通过它们获得的)任何内容、广告、产品或其他材料,Sun并不表示认可,也不承担任何责任.
对于因使用或依靠此类站点或资源中的(或通过它们获得的)任何内容、产品或服务而造成的或连带产生的实际或名义损坏或损失,Sun概不负责,也不承担任何责任.
Sun欢迎您提出意见Sun致力于提高其文档的质量,并十分乐意收到您的意见和建议.
您可以通过以下网址提交您的意见和建议:http://www.
sun.
com/hwdocs/feedback请在您的反馈信息中包含文档的书名和文件号码:《SunFireV125服务器管理指南》,文件号码819-7643-10Sun提供的服务URL文档http://www.
sun.
com/documentation/支持http://www.
sun.
com/support/培训http://www.
sun.
com/training/1第1章简介本章介绍了SunFireV125服务器并概述了它的以下主要特性:第1页"挡板特性"第8页"后面板特性"第11页"系统提示符"挡板特性SunFireV125服务器的前挡板上有服务器状态指示灯和用于粘贴标识标签的空白区.
图1-1状态指示灯的位置"定位器"状态指示灯"需要维修""活动"状态指示灯状态指示灯2SunFireV125服务器管理指南2006年10月服务器状态指示灯服务器具有三个状态指示灯.
它们位于前挡板上,在后面板上重复出现.
表1-1中给出了指示灯的汇总.
您可以通过系统控制台或SunAdvancedLightOutManager(ALOM)的命令行界面(Command-lineInterface,CLI)打开和关闭定位器指示灯.
打开定位器指示灯执行以下操作之一:以超级用户身份键入:在ALOM命令行界面键入:关闭定位器指示灯执行以下操作之一:以超级用户身份键入:表1-1服务器状态指示灯指示灯LED指示灯颜色LED指示灯状况含义活动绿色亮起服务器的电源已打开,正在运行Solaris操作系统.
熄灭没有接通电源,或没有运行Solaris操作系统.
需要维修黄色亮起服务器已检测到问题并需要维修人员进行检查.
熄灭服务器未检测到故障.
定位器白色亮起将该服务器与机架中的其他服务器区分开来.
#/usr/sbin/locator-nsc>setlocatoron#/usr/sbin/locator-f第1章简介3在ALOM命令行界面键入:显示定位器指示灯的状态执行以下操作之一:以超级用户身份键入:在ALOM命令行界面键入:前面板要使用前面板,请按下挡板两侧的释放按钮并向前旋转挡板将其打开.
前面板上包含以下组件:On/Standby按钮硬盘驱动器系统配置卡On/Standby按钮On/Standby按钮仅控制服务器的电源状态,它不会断开服务器的电源.
On/Standby按钮是一个瞬时开关,您可使用以下两种方式对其进行操作:按下随即松开持续按住4秒以上这些操作的结果在表1-2中进行了汇总.
sc>setlocatoroff#/usr/sbin/locatorsc>showlocator4SunFireV125服务器管理指南2006年10月控制服务器电源状态服务器一旦与电源相连便会立即进入待机模式.
只要保持接通电源,服务器就会处于"待机"或"打开"这两种电源状态之一.
表1-3给出了对电源状态的解释.
注–彻底断开服务器电源的唯一方法是拔下电源电缆.
硬盘驱动器SunFireV125服务器本身附带一个硬盘驱动器;但服务器还有用于两个硬盘驱动器的插槽.
插槽可以用于符合1英寸SCA-2格式参数的任何SunLVDSCSI硬盘驱动器.
硬盘驱动器有两个与之关联的指示灯.
有关指示灯含义的汇总,请参见表1-4.
表1-2On/Standby开关的操作及结果服务器电源状态按下随即松开持续按住4秒以上On(正在运行Solaris操作系统)软件执行正常的关机过程.
服务器进入Standby(待机)状态.
服务器直接进入Standby(待机)状态.
On(没有运行Solaris操作系统)没有效果.
服务器直接进入Standby(待机)状态.
Standby(待机)服务器进入电源On(打开)电源状态.
服务器进入电源On(打开)电源状态.
表1-3对电源状态的解释电源状态说明打开服务器已连接到电源且已启用电源.
待机服务器已连接到电源但未启用电源.
关闭服务器未连接到电源.
已拔下电源电缆.
第1章简介5有关拆除和替换硬盘驱动器的信息,请参见第17页"拆除和替换硬盘驱动器".
DVD驱动器SunFireV125服务器包含一个托架,用于容纳可选的超薄ATAPIDVD驱动器.
该托架位于前面板上,打开挡板便可使用.
有关安装DVD驱动器的信息,请参见第22页"拆除和替换DVD驱动器".
系统配置卡系统配置卡(SystemConfigurationCard,SCC)位于前挡板后的一个插槽中,在On/Standby按钮的旁边.
该卡包含唯一的网络标识信息,其中包括MAC地址和主机ID(称为IDPROM)以及OpenBootPROM配置(也称为NVRAM).
服务器在引导期间会尝试访问SCC.
如果读卡器中不存在正确格式化的卡,则系统将不会进行引导.
如果NVRAM部分的内容无效,则系统将不使用它的默认NVRAM配置进行初始化.
如果您需要从服务器中取出SCC,请务必妥善保存,并在重新启动系统前将其装回.
有关更多信息,请参见第16页"在服务器之间交换系统配置卡".
表1-4硬盘驱动器服务指示灯指示灯LED指示灯颜色LED指示灯状况组件状态活动绿色闪烁活动SCSI事务熄灭无活动可以拆除蓝色亮起可以拆除熄灭不可以拆除6SunFireV125服务器管理指南2006年10月表1-5系统配置卡上存储的OpenBootPROM配置参数参数默认值说明diag-passes1定义自检方法的执行次数.
asr-policynormal定义由asr-package命令实现的策略.
test-args无定义要为obpdiag测试所用的测试参数.
local-mac-addresstrue如果为true,则网络驱动程序将使用自己的MAC地址,而不是服务器的地址.
fcode-debugfalse如果为true,则包含插件设备FCodes的名称字段.
ttyb-rts-dtr-offtrue如果为true,则操作系统不会在TTYB端口上断言RTS和DTR.
ttyb-ignore-cdfalse如果为true,则操作系统将忽略TTYB上的载波检测.
ttya-rts-dtr-offtrue如果为true,则操作系统不会在TTYA端口上断言RTS和DTR.
ttya-ignore-cd如果为true,则操作系统将忽略TTYA端口上的载波检测.
silent-modefalse如果该值为true且diag-switch为false,则将抑制所有消息.
scsi-initiator-id7SCSI控制器的SCSI-ID.
oem-logofalse如果为true,则使用自定义的OEM徽标,否则使用Sun徽标.
oem-bannerfalse如果为true,则使用自定义的OEM标题.
ansi-terminaltrue如果为true,则会显示可打印字符并对控制字符进行解释.
verbositynormal定义POST和obpdiag的详细级别.
screen-#columns80设置屏幕上的列数.
screen-#rows34设置屏幕上的行数.
ttya-mode9600,8,n,1,-TTYA(波特率,无数据位,奇偶校验,无停止位,握手).
ttyb-mode9600,8,n,1,-TTYB(波特率,无数据位,奇偶校验,无停止位,握手).
output-devicettya打开电源输出设备.
input-devicettya打开电源输入设备.
load-base16384从设备读取数据时使用的地址.
第1章简介7auto-boottrue如果为true,则在打开电源或复位后系统会自动引导到操作系统.
boot-commandboot在boot命令后执行的操作.
diag-filenone当diag-switch为true时用于引导系统的文件.
diag-devicenet当diag-switch为true时用于引导系统的设备.
boot-filenone当diag-switch为false时用于引导系统的文件.
boot-devicedisknet当diag-switch为false时用于引导系统的一个或多个设备.
use-nvramrcfalse如果为true,则在服务器启动时执行NVRAM中存储的命令.
nvramrcnone如果use-nvramrc为true,则为要执行的命令脚本.
security-modenone固件的安全级别(选项为:none、command或full).
security-passwordnone如果security-mode的值不是none(不显示),则为固件安全密码.
请勿直接设置该密码.
security-#badloginsnone允许输入错误的安全密码的次数.
diag-scriptnormal定义由obpdiag执行的脚本名称.
diag-levelmax定义诊断测试的运行方式(选项包括off、min、menu和max).
diag-switchfalse如果为true:以诊断模式运行.
在收到boot请求后,从diag-device引导diag-file.
如果为false:以非诊断模式运行.
在收到boot请求后,从boot-device引导boot-file.
表1-5系统配置卡上存储的OpenBootPROM配置参数(续)参数默认值说明8SunFireV125服务器管理指南2006年10月有关OpenBootPROM配置参数的其他信息,请参见:http://www.
sun.
com/documentation搜索《OpenBoot4.
xCommandReferenceManual》即可.
后面板特性后面板上有服务器的I/O端口和电源插口.
图1-2I/O端口I/O端口在SunFireV125服务器的背面,I/O端口的排列如图1-2中所示.
有关I/O端口的更多信息,请参阅《SunFireV125服务器入门指南》.
diag-triggererror-resetpower-on-reset定义将触发POST和obpdiag操作的系统复位类型.
service-modefalse指定OBP的操作模式,该模式可以是normal,也可以是service.
error-reset-recoveryboot由于错误导致系统复位后要执行的命令.
表1-5系统配置卡上存储的OpenBootPROM配置参数(续)参数默认值说明电源插口NETMGTSERIAL(10101)SERIALMGT以太网USBSCSI第1章简介9网络状态指示灯每个网络连接器都有两个状态指示灯.
图1-3网络状态指示灯的位置网络状态指示灯可传达以下信息:网络链路状态网络速度状态(不适用于NETMGT端口)有关网络链路状态指示灯含义的汇总,请参见表1-6.
表1-6网络链路指示灯指示灯颜色LED指示灯状况网络链路状态绿色亮起已建立链路.
闪烁链路正在传输数据.
熄灭未建立链路.
网络链路指示灯网络速度指示灯10SunFireV125服务器管理指南2006年10月有关网络速度指示灯含义的汇总,请参见表1-7.
USB端口服务器配有两个USB端口,用于连接支持的USB设备.
这两个端口符合USB1.
1标准.
它们支持1.
5兆位/秒和12兆位/秒两种设备速度,每个连接器均通有5伏的电源为外部设备供电.
外部SCSI端口SCSI端口是一个多模式的Ultra160SCSI接口.
要使用Ultra160SCSI速度运行,它必须处于低压差动(LowVoltageDifferential,LVD)模式.
如果将单端设备连接至服务器,则它会自动切换为单端模式.
电源单元SunFireV125服务器有一个电源单元(PowerSupplyUnit,PSU)和两个与之关联的状态指示灯.
表1-8汇总了指示灯的功能.
表1-7网络速度指示灯指示灯颜色LED指示灯状况网络速度状态绿色亮起网络链路已建立,并正在以系统支持的最高速度运行.
熄灭如果网络活动指示灯亮起,则表示网络链路已建立但未以所支持的最高速度运行.
如果网络活动指示灯熄灭,表示未建立网络链路.
表1-8电源单元指示灯指示灯颜色LED指示灯状况组件状态绿色亮起电源已接通,PSU处于活动状态.
熄灭未接通电源,或电源单元因内部保护事件而关闭.
琥珀色亮起电源单元因内部保护事件而关闭,并要求进行维修.
熄灭电源单元运转正常.
第1章简介11注意–只要服务器连接有交流电源,服务器内就可能存在危险电压.
系统提示符SunFireV125服务器使用以下默认的服务器提示符:ok-OpenBootPROM提示符sc-AdvancedLightsOutManager(ALOM)提示符#-SolarisOS超级用户(Bourne和Kornshell)图1-4显示了三种提示符之间的关系以及如何从一种提示符更改为另一种提示符.
图1-4系统提示符流程图有关从OpenBootPROM切换到服务器控制台(sc)提示符的其他信息,请参见第28页"ALOM的基本功能".
12SunFireV125服务器管理指南2006年10月13第2章拆除和替换组件本章介绍了如何拆除和替换位于服务器前挡板后的组件.
合格的维修人员不必阅读本章所述的过程.
注意–执行本节中的过程之前,请先阅读第14页"避免静电放电",并佩戴正确接地的防静电腕带.
本章包括以下几节:第13页"可替换组件"第14页"避免静电放电"第16页"在服务器之间交换系统配置卡"第17页"拆除和替换硬盘驱动器"第22页"拆除和替换DVD驱动器"可替换组件打开挡板,对以下这些组件进行操作:系统配置卡硬盘驱动器DVD驱动器(作为选件附带或安装)注–对其他任何组件的操作都需要拆除服务器机盖,并要求完成一些必须由受过训练的人员执行的过程.
14SunFireV125服务器管理指南2006年10月避免静电放电操作服务器之前,您必须将防静电腕带连接到服务器.
避免在操作前面板时发生静电放电1.
将防静电腕带的一端连接到手腕.
2.
将另一端连接到机架或机箱上的接地柱.
打开前挡板要安装或替换前挡板上的组件,必须先将前挡板打开.
本节介绍了打开前挡板的过程.
打开前挡板1.
确保您已采取正确的接地措施.
请参见第14页"避免在操作前面板时发生静电放电".
2.
要打开挡板,请按下释放按钮并沿合叶向下旋转.
图2-1打开挡板第2章拆除和替换组件15注–打开挡板时,应始终抓住挡板的两端,而不要只抓住一端.
控制服务器电源拆除或替换系统配置卡或DVD驱动器之前,必须关闭服务器的电源.
提示–有关使用软件控制服务器电源的详细信息,请参见:http://docs.
sun.
com,然后搜索ALOM文档.
打开服务器电源注意–切勿在系统电源打开的情况下移动系统.
否则可能会导致硬盘驱动器的灾难性故障.
移动系统之前请务必切断其电源.
1.
将服务器连接至AC电源.
接通服务器电源后,服务器会自动进入"待机"电源模式.
2.
打开已连接到服务器的所有外设和外部存储设备的电源.
有关具体指导,请阅读设备附带的文档.
3.
打开前挡板.
4.
按下On/Standby按钮.
检验On/Standby按钮的指示灯是否亮起.
5.
关闭前挡板.
关闭服务器电源注–系统关闭不当会对SolarisOS上运行的应用程序产生不利的影响.
切断系统电源之前,请确保已正常关闭所有应用程序.
1.
通知用户系统电源将要被切断.
16SunFireV125服务器管理指南2006年10月2.
如有必要,对系统文件和数据进行备份.
3.
按下随即释放前挡板后面的On/Standby按钮.
系统即会执行正常的软件关机过程.
注–按下随即释放On/Standby按钮会启动正常的软件关机过程.
如果按住此开关四秒钟,则会使系统立即执行硬件关机.
只要可能,请尽量执行正常的关机.
强制立即执行硬件关机会损坏磁盘驱动器,并导致数据丢失.
4.
等待前面板上的绿色指示灯熄灭.
5.
关闭前挡板.
在服务器之间交换系统配置卡注意–请勿在服务器引导过程中或运行SolarisOS时拆除系统配置卡(SystemConfigurationCard,SCC).
拆除或插入系统配置卡之前,请切断服务器的电源或使其进入"待机"模式.
注意–请勿对系统配置卡进行操作,除非您需要把它转到另一个系统上.
如果出于此原因您需要操作系统配置卡,请避免接触卡下面的金色端头.
注意–如果您拆除了系统配置卡,并将其替换为来自不同平台类型的系统的SCC,则该卡将会被重新配置.
重新配置结束后系统会显示信息通知您,但系统在对卡进行重新格式化之前不会要求确认.
交换系统配置卡1.
关闭两台服务器的电源.
请参见第15页"控制服务器电源".
2.
打开两台服务器的前挡板.
请参见第14页"打开前挡板".
3.
拆下用于固定系统配置卡的电缆带,然后将配置卡拆除.
第2章拆除和替换组件174.
将旧服务器上的系统配置卡插入新服务器.
5.
将电缆带装回新系统.
6.
打开新系统的电源.
图2-2插入系统配置卡拆除和替换硬盘驱动器如果可以安装多个驱动器,则您可以直接安装或拆除硬盘驱动器而无需关闭服务器电源或将其从机架上拆除.
然而,您必须确保在拆除硬盘驱动器时没有系统或应用程序软件正在使用它.
注–如果您想在运行SolarisOS时拆除硬盘驱动器,请先按照第20页"在SolarisOS运行时拆除SCSI硬盘驱动器"中的指导进行操作,然后再执行以下步骤.
18SunFireV125服务器管理指南2006年10月注意–服务器和硬盘驱动器包含对静电极为敏感的电子元件.
执行本过程之前,请佩戴已接地的防静电腕带.
拆除硬盘驱动器1.
打开前挡板.
请参见第14页"打开前挡板".
2.
检查硬盘驱动器上的蓝色指示灯是否亮起.
蓝色指示灯亮起表明可以拆除硬盘驱动器.
3.
将硬盘驱动器正面的锁扣向右滑动.
这样可使硬盘驱动器正面的手柄松开.
图2-3中显示了具有可选第二硬盘驱动器的服务器.
图2-3拆除硬盘驱动器4.
拉动手柄,将硬盘驱动器滑出托架,从服务器上将其拆除.
第2章拆除和替换组件19替换硬盘驱动器注意–服务器和硬盘驱动器包含对静电极为敏感的电子元件.
执行本过程之前,请佩戴已接地的防静电腕带.
1.
打开前挡板.
请参见第14页"打开前挡板".
2.
将硬盘驱动器正面的锁扣向右滑动.
这样可以释放硬盘驱动器正面的手柄.
在您插入硬盘驱动器之前,必须首先将杆打开.
如果杆未打开,则硬盘驱动器将不能与服务器正确啮合.
3.
从服务器正面将硬盘驱动器滑入托架.
牢固地推入硬盘驱动器,直到金属杆开始关闭.
此时,硬盘驱动器的连接器便与服务器紧密啮合.
4.
推动金属杆,直至驱动器卡入到位.
5.
关闭挡板.
如果您已经在运行SolarisOS时安装了一个硬盘驱动器,请执行第19页"在Solaris运行时安装SCSI硬盘驱动器"中的步骤.
在Solaris运行时安装SCSI硬盘驱动器执行本节的指导之前,请先按照第19页"替换硬盘驱动器"中的指导安装硬盘驱动器.
请结合cfgadm(1M)手册页来执行以下指导.
1.
将新硬盘驱动器物理安装在驱动器托架中后,以超级用户的身份登录系统.
2.
在超级用户提示符下,键入cfgadm-al以找到新硬盘驱动器的标签(位于范例输出的Ap_Id栏中).
注–所提供的这些输出文本是cfgadm(1M)命令输出的摘录.
Ap_IdTypeReceptacleOccupantConditionc0::dsk/c0t0d0diskconnectedconfiguredunknownc0::sd0diskconnectedunconfiguredunknown20SunFireV125服务器管理指南2006年10月3.
将新驱动器逻辑连接到操作系统.
键入以下命令,为未配置的驱动器指定Ap_Id标签:4.
确认现在已连接和配置驱动器.
键入:5.
确保新驱动器可以被format(1M)命令识别:现在,您即可装入该驱动器以执行操作.
在SolarisOS运行时拆除SCSI硬盘驱动器如果您要在操作系统运行时拆除硬盘驱动器,则您必须首先将驱动器从操作系统中逻辑删除,然后再进行物理拆除.
执行本节中的指导,然后按照第18页"拆除硬盘驱动器"中的指导物理拆除硬盘驱动器.
请结合cfgadm(M)手册页来执行以下指导.
#cfgadm-cconfigurec0::sd0Ap_IdTypeReceptacleOccupantConditionc0::dsk/c0t0d0diskconnectedconfiguredunknownc0::dsk/c0t1d0diskconnectedconfiguredunknown#formatSearchingfordisks.
.
.
doneAVAILABLEDISKSELECTIONS:0.
c0t0d0/pci@1c,600000/scsi@2/sd@0,01.
c0t1d0/pci@1c,600000/scsi@2/sd@1,0Specifydisk(enteritsnumber):第2章拆除和替换组件211.
检查您要拆除的硬盘驱动器是否可以被操作系统识别.
键入:2.
为您要拆除的硬盘驱动器找到正确的Ap_Id标签.
键入:注–在继续进行之前,您必须将硬盘驱动器从其所有软件安装位置上删除,并删除该驱动器上所有正在使用的交换区.
如果该驱动器是系统的引导设备,请勿继续执行这些指导.
请勿尝试取消配置引导磁盘.
3.
取消配置您要拆除的硬盘驱动器.
使用unconfigure命令并指定您要拆除的设备.
例如,如果是Disk1,请键入:4.
检验该设备现在已被取消配置.
键入:#formatSearchingfordisks.
.
.
doneAVAILABLEDISKSELECTIONS:0.
c0t0d0/pci@1f,0/pci@1/scsi@8/sd@0,01.
c0t1d0/pci@1f,0/pci@1/scsi@8/sd@1,0#cfgadm-alAp_IdTypeReceptacleOccupantCondition.
.
.
c1::dsk/c1t1d0diskconnectedconfiguredunknown.
.
.
#cfgadm-cunconfigurec1::dsk/c1t1d0#cfgadm-alAp_IdTypeReceptacleOccupantCondition.
.
.
c1::dsk/c1t1d0unavailableconnectedunconfiguredunknown.
.
.
22SunFireV125服务器管理指南2006年10月5.
确认您要从服务器上拆除的硬盘驱动器对于操作系统已不再是可见的.
键入:现在,您可以在不关闭操作系统的情况下安全地拆除硬盘驱动器.
拆除和替换DVD驱动器DVD驱动器是一种不可热交换的可选组件.
在您拆除或安装DVD驱动器之前,必须关闭服务器电源,然后从后面板拔下电源电缆.
注意–请小心执行本节中的指导.
DVD驱动器中包含激光设备.
请勿试图打开DVD驱动器的外壳或使用本节以外的任何过程拆除DVD驱动器.
否则,您可能会受到辐射.
拆除DVD驱动器1.
通知用户系统电源将要被切断.
2.
如有必要,对系统文件和数据进行备份.
3.
使用halt(1M)命令来停止系统.
4.
在ok提示符下,键入power-off.
5.
等待前面板上的绿色指示灯熄灭.
6.
拔下系统背面的电源电缆.
7.
打开挡板.
请参见第14页"打开前挡板".
8.
打开将DVD驱动器固定到机架的锁扣(图2-4).
#formatSearchingfordisks.
.
.
doneAVAILABLEDISKSELECTIONS:0.
c0t0d0/pci@1f,0/pci@1/scsi@8/sd@0,0第2章拆除和替换组件239.
将DVD驱动器向您的方向拉,直到它从连接器上脱离并离开机架.
替换DVD驱动器1.
插入新的DVD驱动器.
2.
将其牢固地向里按,直至固定夹与服务器机架啮合.
3.
将电源电缆插入电源.
4.
在ALOM提示符下,以admin用户身份登录.
5.
在sc提示符下,键入poweron.
6.
在sc提示符下,键入console.
7.
在ok提示符下,键入boot.
8.
系统启动后,以超级用户身份登录.
9.
在超级用户提示符下,键入devfsadm-C.
10.
键入cfgadm-al以确保系统识别DVD.
您将在输出中看到下行内容.
11.
关闭挡板.
c2::dsk/c2t0d0CD-ROMconnectedconfiguredunknown24SunFireV125服务器管理指南2006年10月图2-4拆除DVD驱动器25第3章SunAdvancedLightsOutManager本章概述了SunAdvancedLightsOutManager(ALOM)软件.
它包括以下几节:第25页"SunAdvancedLightsOutManager"第27页"ALOM管理端口"第28页"设置admin密码"第28页"ALOM的基本功能"SunAdvancedLightsOutManagerSunFireV125服务器预装有SunAdvancedLightsOutManager(ALOM)1.
6.
1或ALOM软件的后续兼容版本.
默认情况下,系统控制台已指向ALOM,并已配置为在启动时显示服务器控制台信息.
有关ALOM的最新文档,请参见以下Web站点:http://www.
sun.
com/serverhttp://www.
sun.
com/documentation请务必下载和使用与您正在使用的OpenBootPROM版本兼容的最新版ALOM.
ALOM使您能够通过串行连接(使用SERIALMGT端口)或以太网连接(使用NETMGT端口)来监视和控制服务器.
注–标有"SERIALMGT"的ALOM串行端口仅用于服务器管理.
如果需要通用串行端口,请使用标有"10101"的串行端口.
注–如果使用ALOM对服务器进行复位,并且diag-switch被设置为true,则当服务器重新引导时系统不会执行bootscript命令.
如果使用OpenBootPROM对服务器进行复位,bootscript可正确执行.
26SunFireV125服务器管理指南2006年10月可以将ALOM配置为发送电子邮件通知,以通知与服务器或ALOM相关的硬件故障和其他事件.
ALOM可在网络通信中使用安全Shell(SecureShell,SSH)协议.
电子邮件传送警报如果为电子邮件传送配置了警报,则在发送下一个警报前ALOM会等待电子邮件传送成功或失败的确认.
这会影响发送到ALOMshell和syslog的事件警报.
邮件警报配置不正确会导致明显的延迟.
这种延迟在没有配置电子邮件警报时是不会发生的.
如果您的警报发生延迟,请检查您为mgt_mailhost和mgt_mailalert配置变量所输入的值是否正确.
有关更多信息,请参阅ALOM的联机帮助.
注–当邮件警报发生,并且邮件主机无法与网络命名服务(例如NIS)进行通信时,ALOM将停止生成和记录消息.
ALOM监视的组件ALOM电路使用服务器提供的待机电源.
这意味着:一旦服务器接通电源,便会激活ALOM,直到拔下电源电缆切断服务器的电源.
服务器的操作系统处于脱机状态时,ALOM固件和软件仍继续处于有效状态.
有关ALOM监视的组件以及它为每个组件提供的信息的列表,请参见表3-1.
表3-1ALOM监视的组件组件信息硬盘驱动器存在和状态系统和CPU风扇速度和状态CPU存在、温度以及与热量有关的警告或故障情况DIMM内存错误电源存在和状态系统温度环境温度以及与热量有关的警告或故障情况服务器前面板钥控开关位置和LED指示灯状态电压状态和阈值SCSI断路器状态第3章SunAdvancedLightsOutManager27注–当您从ALOM命令shell中发出showfru命令时,该命令不会读取DIMM的布局.
注–当OpenBootPROM向ALOM报告DIMM错误时,它会发送系统控制台(sc)警报消息,其中包含了错误的内存插槽位置.
但这些内存错误仍然是有效的.
AutomaticServerRestart注–AutomaticServerRestart不同于SunFireV125服务器支持的另一个组件AutomaticSystemRecovery(ASR).
有关AutomaticSystemRecovery的其他信息,请参见第63页"自动系统恢复".
AutomaticServerRestart是ALOM的一个组件.
它负责监视运行中的SolarisOS,并且在默认情况下,使多个文件系统同步以及在服务器挂起时重新启动服务器.
ALOM使用一个监视程序进程专门监视内核.
如果某一进程挂起而内核仍在运行,则ALOM不会重新启动服务器.
用户不能自行配置ALOM监视程序用于监视时间间隔和监视超时的参数.
如果内核挂起并且监视程序超时,则ALOM会报告和记录该事件,并执行以下三种可由用户配置的操作之一.
xir-这是默认操作,它不会使服务器同步文件系统和重新启动.
如果发生同步挂起,则ALOM将在15分钟后低效运行以进行硬复位.
复位-该操作是一个硬复位,它可以使系统迅速恢复,但不会存储有关挂起的诊断数据.
无-该操作将导致系统在报告监视程序超时之后无限期地停留在挂起状态.
有关其他信息,请参见ALOM文档,其URL为:http://www.
sun.
com/documentationALOM管理端口默认的管理端口标有"SERIALMGT".
该端口使用RJ-45连接器且只能用于服务器管理-它只支持与外部控制台的ASCII连接.
首次操作服务器时,需要使用此端口.
28SunFireV125服务器管理指南2006年10月另一个串行端口(标有"10101")可以用于常规的串行数据传输.
该端口使用DB-9连接器.
此外,服务器还具有一个10BASE-T以太网管理域接口,标有"NETMGT".
要使用此端口,需要对ALOM进行配置.
注–如果您使用OpenBoot命令setenvttya-mode将ALOM串行端口(SERIALMGT)的速度更改为默认值(9600波特)以外的数值,请复位主机服务器.
这样可以把端口速度设置为指定的值.
设置admin密码当您在初始加电后切换到ALOM提示符下时,您将以admin用户身份登录,系统会提示您设置密码.
您必须设置此密码才能执行某些特定的命令.
设置admin密码如果收到此提示,请为admin用户设置密码.
密码必须符合以下条件:至少包含两个字母字符至少包含一个数字字符或特殊字符至少具有六个字符设置完密码后,admin用户将具有完全的权限,可以执行所有ALOMCLI命令.
提示–如果使用16个字符的用户名登录到ALOM并执行showusers命令,ALOM将进入循环并拒绝其他所有连接尝试.
如果遇到该问题,请建立与主机服务器的Telnet连接,然后使用scadmresetrsc命令复位ALOM.
ALOM的基本功能本节介绍ALOM的一些基本功能.
第3章SunAdvancedLightsOutManager29切换到ALOM提示符键入以下命令:注–当您切换到ALOM提示符时,您将以admin身份登录.
请参见第28页"设置admin密码".
切换到服务器控制台提示符键入以下命令:可以有多个ALOM用户连接到服务器控制台流,但只有一个用户有权向控制台输入字符.
如果已有另一个用户登录并且该用户具有写入权限,则在运行console命令后会看到以下消息:要取消另一个用户的控制台写入权限,请键入以下命令:将串行端口的速度设置回默认值键入以下命令:##.
sc>consolesc>Consolesessionalreadyinuse.
[viewmode]sc>console-fsc>bootmodereset-nvramsc>reset30SunFireV125服务器管理指南2006年10月scadmresetrsc命令如果两个用户同时运行ALOM,一个用户向SolarisOS发出scadmresetrsc命令,而同时另一个用户正在使用scadmdownload命令或ALOMshell命令flashupdate更新ALOM固件,则可能会破坏该固件并导致ALOM无法使用.
在固件更新完成之前,请勿执行scadmresetrsc命令.
在固件更新完成之后60秒内,请勿执行scadmresetrsc命令.
TTYB控制台输出如果您将控制台设置为TTYB(10101)而不是TTYA(ALOM串行端口,标为"SERIALMGT"),则您可能不会看到控制台的所有输出.
默认情况下,OpenBootPROM和开机自检(Power-OnSelf-Test,POST)都会将诊断输出发送到TTYA.
31第4章SunManagementCenter本章介绍了SunMC.
它包括以下几节:第31页"SunManagementCenter"第33页"HardwareDiagnosticSuite"SunManagementCenterSunManagementCenter软件能够对Sun服务器和工作站(包括它们的子系统、组件和外围设备)进行企业范围内的监视.
所监视的系统必须已打开电源并且正常运行.
此外,您还需要在网络的各个系统中安装所有适当的软件组件.
SunManagementCenter使您能够监视SunFireV125服务器上的以下各项(表4-1).
表4-1SunManagementCenter监视的内容监控项SunManagementCenter监视的内容硬盘驱动器状态风扇状态CPU温度以及与热量有关的警告或故障情况电源状态系统温度温度以及与热量有关的警告或故障情况32SunFireV125服务器管理指南2006年10月SunManagementCenter如何工作SunManagementCenter包括三个组件:代理服务器监视器您可以在要进行监视的系统上安装代理.
代理负责从日志文件、设备树和平台特定源收集系统状态信息,并向服务器组件报告这些数据.
服务器组件负责维护一个记录各种Sun平台状态信息的大型数据库.
此数据库更新频繁,其中的信息涉及到板、磁带、电源、硬盘驱动器以及操作系统参数(如负荷、资源使用情况和驱动器空间).
您可以创建报警阈值.
当超过这些阈值时,会向您发出通知.
监视器组件将收集到的数据以标准格式显示给您.
SunManagementCenter软件提供了独立的Java应用程序和基于浏览器的界面.
Java界面提供了用于进行高度直观监视的系统物理视图和逻辑视图.
SunManagementCenter其他功能SunManagementCenter软件为您提供了附加工具,这些工具可以与其他公司生产的管理实用程序协同工作.
这些工具是非正式跟踪机制和可选的附加软件HardwareDiagnosticsSuite.
非正式跟踪必须在您希望监视的系统上加载SunManagementCenter代理软件.
然而,该产品允许您在所支持的平台尚未安装代理软件的情况下非正式地跟踪它.
在这种情况下,您没有完全的监视功能,但您可以将系统添加到浏览器,使SunManagementCenter定期检查系统是否已打开电源以及是否正在运行,并且在停止使用时通知您.
HardwareDiagnosticSuiteHardwareDiagnosticSuite是一个可以作为SunManagementCenter的附加软件购买的软件包.
在系统已打开电源并且正在某个产品环境中运行时,该套件允许您对系统进行测试.
有关更多信息,请参见第33页"HardwareDiagnosticSuite".
第4章SunManagementCenter33互操作性-第三方监视工具如果您在管理一个异构网络,并使用基于网络的第三方系统监视或管理工具,则您可以在工作中利用SunManagementCenter软件对TivoliEnterpriseConsole、BMCPatrol和HPOpenview的支持.
使用SunManagementCenterSunManagementCenter软件适用于需要监视大型数据中心或其他多计算机平台安装的系统管理员.
如果您在管理一个较小的系统,则您需要在SunManagementCenter软件的优点和维护一个大型系统状态信息数据库(一般超过700MB)的要求之间进行权衡.
要监视的服务器必须正在运行,这是因为SunManagementCenter依靠Solaris操作系统进行操作.
获取最新信息有关此产品的最新信息,请访问SunManagementCenter的Web站点:http://www.
sun.
com/sunmanagementcenterHardwareDiagnosticSuiteSunManagementCenter特别带有一个可选的HardwareDiagnosticSuite,您可以作为附加软件购买.
HardwareDiagnosticSuite通过按顺序运行各个测试对产品系统进行测试.
顺序测试意味着HardwareDiagnosticSuite对系统的影响较小.
与SunVTS(该软件运行许多并行测试时会消耗系统资源,从而加重系统负荷,请参见第35页"SunVTS".
)不同,HardwareDiagnosticSuite允许服务器在测试期间运行其他应用程序.
何时运行HardwareDiagnosticSuite使用HardwareDiagnosticSuite可在一个其他部分运转正常的系统中确定某一个非关键部件可能存在的或间歇出现的问题.
例如,一个具有充足或冗余的磁盘和内存资源的服务器,其中可能存在有问题的驱动器或内存模块.
34SunFireV125服务器管理指南2006年10月在这种情况下,HardwareDiagnosticSuite可以在不造成干扰的情况下运行,直到确定问题来源为止.
所测试的计算机可以保持工作状态,除非必须关闭它进行维修.
如果出现故障的是可热插拔或可热交换的部件,则可以在系统用户几乎不受影响的情况下完成整个诊断和维修过程.
使用HardwareDiagnosticSuite的要求由于HardwareDiagnosticSuite是SunManagementCenter的一部分,因此只有将数据中心设置为运行SunManagementCenter,您才能够运行HardwareDiagnositicSuite.
您需要一个专用的主服务器来运行支持SunManagementCenter软件平台状态信息数据库的SunManagementCenter服务器软件.
此外,您还必须在要监视的各系统上安装和设置SunManagementCenter代理软件.
最后,您需要安装SunManagementCenter软件的控制台部分,它是使用HardwareDiagnosticSuite时的界面.
有关设置SunManagementCenter和使用HardwareDiagnosticSuite的指导,请参见《SunManagementCenter软件用户指南》.
35第5章SunVTS本章介绍了有关SunVTS的信息:第35页"SunVTS"第38页"查看SunVTS文档"SunVTSSunVTS是用于对系统、子系统和配置进行测试的软件套件.
您可以通过网络查看和控制SunVTS会话.
通过使用远程系统,您可以针对网络上的另一台计算机查看其测试会话进度、更改测试选项以及控制所有测试功能.
可使用三种不同的测试模式运行SunVTS软件:连接测试模式,对选定设备的可用性和连通性进行低负荷且无干扰的测试.
功能测试模式,对系统和设备进行全面测试.
该测试使用系统资源,并假定系统上没有其他应用程序正在运行.
这是默认的模式.
独占测试模式,使您可以在不需要其他SunVTS测试或应用程序的情况下运行测试.
联机测试模式,允许您在应用程序运行期间运行测试.
由于SunVTS软件可同时运行多项测试,且占用大量系统资源,因此,在生产系统中使用该软件时需谨慎.
如果使用SunVTS软件的功能测试模式或独占测试模式对系统执行负荷测试,请勿运行任何其他应用程序.
如果要使用SunVTS软件测试服务器,服务器必须运行SolarisOS.
由于SunVTS软件包是可选的,因此您的系统可能并未安装该软件包.
有关说明,请参见第37页"检查是否安装了SunVTS".
36SunFireV125服务器管理指南2006年10月SunVTS软件和安全性在安装SunVTS软件的过程中,您必须在基本安全性和SunEnterpriseAuthenticationMechanism安全性之间选择其一.
基本安全性使用SunVTS安装目录中的本地安全性文件来限制允许使用SunVTS软件的用户、组和主机.
SunEnterpriseAuthenticationMechanism安全性基于标准的网络验证协议Kerberos,为通过网络进行的事务提供了安全用户验证、数据完整性和保密性.
如果您的站点要使用SunEnterpriseAuthenticationMechanism安全性,您必须在网络上安装SunEnterpriseAuthenticationMechanism客户机和服务器软件,并对Solaris和SunVTS软件进行正确的配置.
如果您的站点不使用SunEnterpriseAuthenticationMechanism安全性,请勿在安装SunVTS软件时选择SunEnterpriseAuthenticationMechanism选项.
如果您在安装过程中启用了错误的安全性方案,或者未正确配置所选择的安全性方案,可能会导致无法运行SunVTS测试.
有关更多信息,请参见《SunVTSUser'sGuide》和SunEnterpriseAuthenticationMechanism软件附带的相关指导.
使用SunVTSSunVTS即SunValidationandTestSuite(Sun验证和测试套件),它是一种联机诊断工具.
您可以使用它检验硬件控制器、设备和平台的配置和功能.
SunVTS在SolarisOS上运行,提供了以下界面:命令行界面串行(TTY)界面CDE或Gnome环境下的图形用户界面SunVTS软件使您可以查看和控制远程连接的服务器上的测试会话.
下表列出了一些可用的测试:表5-1SunVTS测试SunVTS测试说明cputest测试CPU.
disktest测试本地磁盘驱动器.
cddvdtest测试DVD驱动器.
fputest测试浮点单元.
nettest测试系统板上的以太网硬件和任何可选的PCI卡上的联网硬件.
netlbtest进行回送测试以检查以太网适配器是否可以发送和接收包.
pmemtest测试物理内存(只读).
serialtest测试服务器的板载串行端口.
第5章SunVTS37检查是否安装了SunVTS键入以下命令:如果已加载SunVTS软件,则会显示有关该软件包的信息.
如果未加载SunVTS软件,则您会看到以下错误消息:安装SunVTS在默认情况下,不会在SunFireV125服务器上安装SunVTS.
但是,Solaris操作系统附带的SoftwareSupplementCD中提供了SunVTS.
有关从该CD中下载SunVTS的信息,请参阅与您所使用的SolarisOS发行版相对应的《Sun硬件平台指南》.
要查找使用SunVTS的更多信息,请参阅与您所运行的Solaris操作系统发行版对应的SunVTS文档.
vmemtest测试虚拟内存(交换分区和物理内存的组合).
env6test测试温度传感器、电源状态和风扇速度.
打开和关闭指示灯,以便对其进行测试.
ssptest测试ALOM硬件的功能性.
测试板载以太网、闪存、SEEPROM、TOD、从ALOM到主机系统的I2C连接以及串行端口.
i2c2test检验所有可用的I2C设备和系统总线连接.
对SCC和FRUSEEPROM设备进行数据检查.
#pkginfo-lSUNWvtsERROR:informationfor"SUNWvts"wasnotfound表5-1SunVTS测试(续)SunVTS测试说明38SunFireV125服务器管理指南2006年10月查看SunVTS文档SunVTS文档包含在SoftwareSupplementCD中(各发行版Solaris介质工具包中均包含此CD).
此外,也可从以下URL地址获取这些文档:http://www.
sun.
com/documentation有关进一步的信息,您还可以参考以下SunVTS文档:《SunVTSUser'sGuide》介绍了如何安装、配置和运行SunVTS诊断软件.
《SunVTSQuickReferenceCard》概述了如何使用SunVTSCDE界面.
《SunVTSTestReferenceManual》提供了每一种SunVTS测试的详细信息.
39第6章诊断本章介绍了SunFireV125服务器可使用的诊断工具.
它包括以下几节:第39页"诊断工具概述"第40页"SunAdvancedLightsOutManager"第40页"状态指示灯"第41页"开机自检诊断"第44页"OpenBootDiagnostics"第48页"OpenBoot命令"第52页"操作系统诊断工具"第59页"最近的诊断测试结果"第59页"OpenBoot配置变量"第60页"用于特定设备的其他诊断测试"第63页"自动系统恢复"诊断工具概述Sun提供了一系列用于SunFireV125服务器的诊断工具.
表6-1汇总了这些诊断工具.
表6-1诊断工具汇总诊断工具类型作用可访问性和可用性远程能力指示灯硬件指示整个系统和特定组件的状态.
从系统机箱上查看.
只要通电就可以查看.
位于本地,但可以通过ALOM查看ALOM硬件和软件监视环境情况、执行基本的故障隔离并提供远程控制台访问功能.
可以使用待机电源工作,无需操作系统.
设计用于远程访问开机自检固件测试系统的核心组件.
在启动时自动运行.
在没有运行操作系统时可用.
位于本地,但可以通过ALOM查看40SunFireV125服务器管理指南2006年10月状态指示灯有关服务器状态指示灯的汇总,请参见第2页"服务器状态指示灯".
SunAdvancedLightsOutManagerSunFireV125服务器中预装了SunAdvancedLightsOutManager(ALOM).
ALOM使您能够通过串行连接(使用SERIALMGT端口)或以太网连接(使用NETMGT端口)来监视和控制服务器.
ALOM可以发送电子邮件通知,通知硬件故障或其他服务器事件.
ALOM电路使用服务器提供的待机电源.
这意味着:一旦服务器接通电源,便会激活ALOM,直到拔下电源电缆切断服务器的电源.
OpenBootDiagnostics固件测试系统组件,主要是外围设备和I/O设备.
自动或交互运行.
在没有运行操作系统时可用.
位于本地,但可以通过ALOM查看OpenBoot命令固件显示各种系统信息.
在没有运行操作系统时可用.
位于本地,但可以通过ALOM访问Solaris命令软件显示各种系统信息.
需要操作系统.
位于本地,但可以通过ALOM访问SunVTS软件测试系统并增加系统负荷,并行运行测试.
需要操作系统功能.
可能需要安装可选软件包.
通过网络查看和控制SunManagementCenter软件监视多台计算机的硬件环境情况和软件性能.
针对各种情况生成警报.
要求受监视的服务器和主服务器均运行操作系统.
要求主服务器上具有专用数据库.
设计用于远程访问HardwareDiagnosticSuite软件通过运行顺序测试来检查可操作的系统.
同时报告存在故障的FRU.
单独购买的SunManagementCenter可选附加软件.
需要操作系统和SunManagementCenter.
设计用于远程访问表6-1诊断工具汇总(续)诊断工具类型作用可访问性和可用性远程能力第6章诊断41服务器的操作系统处于脱机状态时,ALOM仍继续处于有效状态.
有关ALOM监视的组件以及它为每个组件提供的信息的列表,请参见表3-1.
提示–有关其他信息,请参见《SunAdvancedLightsOutManagement(ALOM)1.
6AdministrationGuide》.
开机自检诊断开机自检是一个固件程序,用于确定系统中的某个部分是否出现故障.
开机自检检验系统的核心功能,包括CPU模块(一个或多个)、主板、内存以及一些板载I/O设备.
开机自检可以生成可用于确定硬件故障性质的消息.
即使无法引导系统,开机自检也可运行.
开机自检可以检测到大多数系统故障,它位于主板的OpenBootPROM中.
通过设置两个环境变量diag-switch和diag-level标志(这两个变量存储在系统配置卡中),可以将开机自检设置为在打开电源时由OpenBoot固件运行.
在系统加电并且满足以下所有条件时自动运行开机自检:diag-switch已设置为true(默认值为false)diag-level已设置为min、max或menus(默认值为min)在系统复位并且满足以下所有条件时也会自动运行开机自检:diag-switch已设置为false(默认值为false)系统复位的当前类型与post-trigger中设置的任何一种复位类型匹配diag-level已设置为min、max或menus(默认值为min)如果diag-level被设置为min或max,则开机自检会分别执行缩减测试或扩展测试.
如果diag-level被设置为menus,则屏幕上会显示打开电源时执行的所有测试的菜单.
开机自检诊断和错误消息报告会显示在控制台上.
启动开机自检诊断-方法11.
转至ok提示符.
2.
键入:42SunFireV125服务器管理指南2006年10月3.
键入:根据所需范围的不同,其中value的值可以是min或max.
4.
关闭服务器的电源然后再打开.
关闭服务器的电源后,等待60秒钟再打开服务器的电源.
打开服务器电源后将执行开机自检.
注–状态和错误消息会显示在控制台窗口中.
如果开机自检检测到错误,则它会显示一条描述故障的错误消息.
5.
运行完开机自检后,您可以键入以下命令将diag-switch的值恢复为false:将diag-switch的值重置为false可使引导时间最短.
启动开机自检诊断-方法21.
转至ok提示符.
2.
键入:3.
键入:根据所需范围的不同,其中value的值可以是min或max.
oksetenvdiag-switchtrueoksetenvdiag-levelvalueoksetenvdiag-switchfalseoksetenvdiag-switchfalseoksetenvdiag-levelvalue第6章诊断434.
键入:5.
键入:注–状态和错误消息会显示在控制台窗口中.
如果开机自检检测到错误,则它会显示一条描述故障的错误消息.
控制开机自检诊断通过设置OpenBoot配置变量,您可以控制开机自检诊断以及引导过程的其他方面.
通常只有在重新启动系统后,对OpenBoot配置变量的更改才会生效.
表6-2列出了这些变量中最重要和最有用的变量.
您可以在第59页"OpenBoot配置变量"中找到更改OpenBoot配置变量的指导.
oksetenvdiag-triggeruser-resetoksetenvdiag-triggerall-resets表6-2OpenBoot配置变量OpenBoot配置变量描述和关键字auto-boot确定操作系统是否自动启动.
默认值为true.
true-在固件测试结束后,立即自动启动操作系统.
false-系统停留在ok提示符,直到您键入boot命令.
diag-level确定所执行的诊断的级别或类型.
默认值为min.
off-不进行测试.
min-仅运行基本测试.
max-根据设备的不同,可以运行更为全面的测试.
diag-script确定OpenBootDiagnostics测试哪些设备.
默认值为none.
none-不对任何设备进行测试.
normal-对具有自检功能的板上(基于中心板的)设备进行测试.
all-对具有自检功能的所有设备进行测试.
diag-switch使系统进入或退出诊断模式.
默认值为false.
true-诊断模式:可以运行开机自检诊断和OpenBootDiagnostics测试.
false-默认模式:不运行开机自检或OpenBootDiagnostics测试.
44SunFireV125服务器管理指南2006年10月1-无法在图形终端上显示开机自检消息.
即使将output-device设置为screen,开机自检消息仍然会被发送到TTYA.
注–这些变量既会影响OpenBootDiagnostics测试程序,也会影响开机自检诊断程序.
开机自检诊断程序运行完毕后,就会向OpenBoot固件报告它所运行的每一个测试的状态.
随后,控制权返回给OpenBoot固件代码.
如果开机自检诊断程序没有发现故障,并且服务器仍然不能启动,请运行OpenBootDiagnostics测试程序.
OpenBootDiagnostics与开机自检诊断程序相同,OpenBootDiagnostics代码是基于固件的,它驻留在OpenBootPROM中.
diag-trigger指定导致开机自检和OpenBootDiagnostics运行的复位事件类.
这些变量可以接受单个关键字,也可以接受前三个关键字的组合(由空格分隔).
error-reset-由某些不可恢复的硬件错误导致的复位.
一般情况下,硬件问题破坏系统数据时会发生错误复位.
例如CPU和系统监视程序复位、致命错误以及某些CPU复位事件(默认).
power-on-reset-按下"电源"按钮导致的复位(默认).
user-reset-由用户或操作系统引起的复位.
all-resets-任何类型的系统复位.
none-不运行开机自检或OpenBootDiagnostics测试.
input-device选择从何处获取控制台输入.
默认值为TTYA.
TTYA-从内置的SERIALMGT端口获取.
TTYB-从内置的通用串行端口(10101)获取.
keyboard-从属于图形终端一部分的已连接键盘获取.
output-device选择在何处显示诊断程序和其他控制台的输出.
默认值为TTYA.
TTYA-显示到内置的SERIALMGT端口.
TTYB-显示到内置的通用串行端口(10101).
screen-显示到属于图形终端一部分的已连接屏幕1.
表6-2OpenBoot配置变量(续)OpenBoot配置变量描述和关键字第6章诊断45启动OpenBootDiagnostics1.
键入:2.
键入:此命令可以显示OpenBootDiagnostics菜单.
请参见表6-3.
注–如果服务器中安装了PCI卡,则obdiag菜单中会显示其他的测试.
3.
键入:其中n表示您希望运行的测试所对应的编号.
oksetenvdiag-switchtrueoksetenvdiag-levelmaxoksetenvauto-bootfalseokreset-allokobdiag表6-3obdiag菜单obdiag1flashprom@2,04network@27scsi@210serial@0,3f82i2c@0,3205network@2,18scsi@2,111usb@a3ide@d6rtc@0,709serial@0,2e812usb@bCommands:testtest-allexcepthelpwhatsetenvset-defaultexitdiag-passes=1diag-level=maxtest-args=subtests,verboseobdiag>testn46SunFireV125服务器管理指南2006年10月系统提供了各个测试程序的摘要.
在obdiag>提示符下,键入:控制OpenBootDiagnostics测试大多数用于控制开机自检的OpenBoot配置变量(请参见第43页上的表6-2)还会影响OpenBootDiagnostics测试程序.
使用diag-level变量来控制OpenBootDiagnostics测试级别.
使用test-args来自定义测试的运行方式.
在默认情况下,test-args被设置为包含一个空字符串.
您可以使用表6-4中所示的一个或多个保留关键字来修改test-args变量.
obdiag>help表6-4用于test-argsOpenBoot配置变量的关键字关键字作用bist在外部和外围设备上调用内置自检(Buitl-InSelf-Test,BIST).
debug显示所有调试消息.
iopath检验总线/互连的完整性.
loopback测试设备的外部回送路径.
media检验外部和外围设备介质的可访问性.
restore如果上一次执行测试失败,则尝试将设备恢复到初始状态.
silent只显示错误,而不显示每个测试的状态.
subtests显示主测试和每一个被调用的子测试.
verbose显示所有测试的状态的详细消息.
callers=n当错误发生时,显示n个调用方的回溯.
callers=0-显示错误发生前所有调用方的回溯.
默认值为callers=1.
errors=n继续执行测试,直到发生n个错误.
errors=0-显示所有错误报告,不终止测试.
默认值为errors=1.
第6章诊断47如果您希望自定义OpenBootDiagnostics测试,则您可以将test-args设置为一个以逗号分隔的关键字列表,如本示例所示:test和test-all命令您还可以在ok提示符下直接运行OpenBootDiagnostics测试.
为此,请键入test命令,后边紧跟要进行测试的设备(或设备集)的完整硬件路径.
例如:要想知道如何构建适当的硬件设备路径,需要对SunFireV125服务器的硬件体系结构有准确的了解.
提示–使用show-devs命令可以列出硬件设备路径.
要自定义单个测试,您可以按以下方式使用test-args:此操作只会影响当前测试,而不会更改OpenBoot配置变量test-args的值.
您可以使用test-all命令对设备树中的所有设备进行测试:如果您为test-all命令指定一个路径参数,则只会对指定的设备及其子设备进行测试.
以下示例显示了测试USB总线以及连接到USB总线的具有自检功能的所有设备所使用的命令:oksetenvtest-argsdebug,loopback,mediaoktest/pci@x,y/SUNW,qlc@2oktest/usb@1,3:test-args={verbose,debug}oktest-alloktest-all/pci@9,700000/usb@1,348SunFireV125服务器管理指南2006年10月OpenBootDiagnostics错误消息的内容OpenBootDiagnostics的错误结果以表格的形式进行报告,其内容包括问题概要、所影响的硬件设备、失败的子测试以及其他诊断信息.
代码示例6-1显示了OpenBootDiagnostics错误消息的范例.
代码示例6-1OpenBootDiagnostics错误消息要在第一次引导后更改系统的默认设置和诊断设置,请参阅《OpenBootPROMEnhancementsforDiagnosticOperation》(817-6957).
您可以访问以下网址查看或打印该文档:http://www.
sun.
com/documentationOpenBoot命令OpenBoot命令是指您在ok提示符下键入的命令.
以下OpenBoot命令可以提供有用的诊断信息:probe-scsiprobe-ideshow-devsTesting/pci@1e,600000/isa@7/flashprom@2,0ERROR:ThereisnoPOSTinthisFLASHPROMorPOSTheaderisunrecognizedDEVICE:/pci@1e,600000/isa@7/flashprom@2,0SUBTEST:selftest:crc-subtestMACHINE:SunFireV125SERIAL#:51347798DATE:03/05/200315:17:31GMTCONTR0LS:diag-level=maxtest-args=errors=1Error:/pci@1e,600000/isa@7/flashprom@2,0selftestfailed,returncode=1Selftestat/pci@1e,600000/isa@7/flashprom@2,0(errors=1)failedPass:1(of1)Errors:1(of1)TestsFailed:1ElapsedTime:0:0:0:1第6章诊断49probe-scsi命令probe-scsi命令用于诊断SCSI设备的问题.
注意–如果您使用halt命令或Stop-A键序进入ok提示符,则运行probe-scsi命令会使系统挂起.
probe-scsi命令与连接到板上SCSI控制器的所有SCSI设备进行通信.
对于任何已连接并处于活动状态的SCSI设备,probe-scsi命令可以显示它的回路ID、主机适配器、逻辑单元编号、唯一的全局名称(WorldWideName,WWN)以及包含类型和生产商的设备描述信息.
以下是probe-scsi命令的输出范例.
代码示例6-2probe-scsi命令输出probe-ide命令probe-ide命令与连接到集成驱动器电路(IntegratedDriveElectronics,IDE)总线的所有IDE设备进行通信.
此总线是介质设备(如DVD驱动器)的内部系统总线.
注意–如果您使用halt命令或Stop-A键序进入ok提示符,则运行probe-ide命令会使系统挂起.
以下是probe-ide命令的输出范例.
{1}okprobe-scsiTarget0Unit0DiskSEAGATEST336605LSUN36G0238Target1Unit0DiskSEAGATEST336605LSUN36G0238Target2Unit0DiskSEAGATEST336605LSUN36G0238Target3Unit0DiskSEAGATEST336605LSUN36G023850SunFireV125服务器管理指南2006年10月代码示例6-3probe-ide命令输出show-devs命令show-devs命令可以列出固件设备树中每一个设备的硬件设备路径.
以下的代码示例显示了show-devs命令的输出范例.
{1}okprobe-ideDevice0(PrimaryMaster)RemovableATAPIModel:DV-28E-BDevice1(PrimarySlave)NotPresentDevice2(SecondaryMaster)NotPresentDevice3(SecondarySlave)NotPresent代码示例6-4show-devs命令的输出okshowdevs/pci@1d,700000/pci@1c,600000/pci@1e,600000/pci@1f,700000/memory-controller@0,0/SUNW,UltraSPARC-IIIi@0,0/virtual-memory/memory@m0,0/aliases/options/openprom/chosen/packages/pci@1c,600000/scsi@2,1/pci@1c,600000/scsi@2/pci@1c,600000/scsi@2,1/tape/pci@1c,600000/scsi@2,1/disk/pci@1c,600000/scsi@2/tape/pci@1c,600000/scsi@2/disk/pci@1e,600000/ide@d第6章诊断51/pci@1e,600000/usb@a/pci@1e,600000/pmu@6/pci@1e,600000/isa@7/pci@1e,600000/ide@d/cdrom/pci@1e,600000/ide@d/disk/pci@1e,600000/pmu@6/gpio@80000000,8a/pci@1e,600000/pmu@6/i2c@0,0/pci@1e,600000/isa@7/rmc-comm@0,3e8/pci@1e,600000/isa@7/serial@0,2e8/pci@1e,600000/isa@7/serial@0,3f8/pci@1e,600000/isa@7/power@0,800/pci@1e,600000/isa@7/i2c@0,320/pci@1e,600000/isa@7/rtc@0,70/pci@1e,600000/isa@7/flashprom@2,0/pci@1e,600000/isa@7/i2c@0,320/gpio@0,70/pci@1e,600000/isa@7/i2c@0,320/gpio@0,68/pci@1e,600000/isa@7/i2c@0,320/gpio@0,46/pci@1e,600000/isa@7/i2c@0,320/gpio@0,44/pci@1e,600000/isa@7/i2c@0,320/idprom@0,50/pci@1e,600000/isa@7/i2c@0,320/nvram@0,50/pci@1e,600000/isa@7/i2c@0,320/rscrtc@0,d0/pci@1e,600000/isa@7/i2c@0,320/dimm-spd@0,b8/pci@1e,600000/isa@7/i2c@0,320/dimm-spd@0,b6/pci@1e,600000/isa@7/i2c@0,320/power-supply-fru-prom@0,b0/pci@1e,600000/isa@7/i2c@0,320/chassis-fru-prom@0,a8/pci@1e,600000/isa@7/i2c@0,320/motherboard-fru-prom@0,a2/pci@1e,600000/isa@7/i2c@0,320/i2c-bridge@0,18/pci@1e,600000/isa@7/i2c@0,320/i2c-bridge@0,16/pci@1f,700000/network@2,1/pci@1f,700000/network@2/openprom/client-services/packages/obdiag-menu/packages/obdiag-lib/packages/SUNW,asr/packages/SUNW,fru-device/packages/SUNW,i2c-ram-device/packages/obp-tftp/packages/kbd-translator/packages/dropins/packages/terminal-emulator/packages/disk-label/packages/deblocker/packages/SUNW,builtin-driversok代码示例6-4show-devs命令的输出(续)52SunFireV125服务器管理指南2006年10月运行OpenBoot命令注意–如果您使用halt命令或Stop-A键序进入ok提示符,则运行probe-scsi命令会使系统挂起.
1.
停止系统以进入ok提示符.
如何完成此操作取决于系统的具体情况.
如果可能,则您应该在关闭系统之前警告用户.
2.
在控制台提示符下,键入适当的命令.
操作系统诊断工具通常情况下,如果系统通过了OpenBootDiagnostics测试,则会尝试引导它的多用户操作系统.
对于大多数Sun系统来说,这意味着Solaris操作系统.
一旦服务器以多用户模式运行,您就可以使用基于软件的诊断工具:SunVTS和SunManagementCenter.
这些工具使您可以监视和测试服务器,并对故障进行隔离.
注–如果您将OpenBoot配置变量auto-boot设置为false,则在基于固件的测试完成后操作系统将不会进行引导.
除以上提到的工具外,您还可以参阅错误和系统消息日志文件以及Solaris系统信息命令的输出.
错误和系统消息日志文件错误和其他系统消息被保存在/var/adm/messages文件中.
该文件中记录的消息有许多来源,这些来源包括操作系统、环境控制子系统以及各种软件应用程序.
Solaris系统信息命令以下Solaris命令能够显示评估SunFireV125服务器情况时可以使用的数据:prtconfprtdiagprtfrupsrinfoshowrev第6章诊断53本节介绍了这些命令所提供的信息.
相应的手册页中包含了使用每个命令的更多信息.
prtconf命令prtconf命令可显示Solaris设备树.
该树包括了OpenBoot固件探测到的所有设备,以及只有操作系统软件才能检测到的其他设备(如单独的磁盘).
prtconf的输出还包括系统内存总量.
代码示例6-5显示了一个prtconf输出的摘录.
代码示例6-5prtconf命令的输出prtconf命令的-p选项可以生成与OpenBootshow-devs命令类似的输出.
该输出只列出由系统固件检测到的设备.
#prtconfSystemConfiguration:SunMicrosystemssun4uMemorysize:1024MegabytesSystemPeripherals(SoftwareNodes):SUNW,Sun-Fire-V125packages(drivernotattached)SUNW,builtin-drivers(drivernotattached)deblocker(drivernotattached)disk-label(drivernotattached)terminal-emulator(drivernotattached)dropins(drivernotattached)kbd-translator(drivernotattached)obp-tftp(drivernotattached)SUNW,i2c-ram-device(drivernotattached)SUNW,fru-device(drivernotattached)SUNW,asr(drivernotattached)ufs-file-system(drivernotattached)chosen(drivernotattached)openprom(drivernotattached)client-services(drivernotattached)options,instance#0aliases(drivernotattached)memory(drivernotattached)virtual-memory(drivernotattached)SUNW,UltraSPARC-IIIi(drivernotattached)memory-controller,instance#054SunFireV125服务器管理指南2006年10月prtdiag命令prtdiag命令可以显示一个归纳系统组件状态的诊断信息表.
prtdiag命令所使用的显示格式因系统上运行的Solaris操作系统的版本而异.
以下是prtdiag命令在正常运行SolarisOS的SunFireV125服务器上所产生输出的摘录.
代码示例6-6prtdiag命令的输出#prtdiagSystemConfiguration:SunMicrosystemssun4uSunFireV125Systemclockfrequency:167MHZMemorysize:1GBCPUsE$CPUCPUTemperatureCPUFreqSizeImplementationMaskDieAmb.
StatusLocation--------01002MHz1MBSUNW,UltraSPARC-IIIi3.
4--onlineMB/P0IODevicesBusFreqSlot+Name+TypeMHzStatusPathModelpci66MBpci108e,1648(network)okay/pci@1f,700000/network@2pci33MBisa/su(serial)okay/pci@1e,600000/isa@7/serial@0,3f8MemoryConfigurationSegmentTable:BaseAddressSizeInterleaveFactorContains0x01GB1BankIDs0BankTable:PhysicalLocationIDControllerIDGroupIDSizeInterleaveWay0001GB0MemoryModuleGroups:ControllerIDGroupIDLabelsStatus00MB/P0/B0/D000MB/P0/B0/D1第6章诊断55除代码示例6-6中的信息外,带有详细选项(-v)的prtdiag命令还会报告前面板状态、磁盘状态、风扇状态、电源、硬件修订版本以及系统温度.
某一设备温度过高时,prtdiag会在该设备的"Status"栏中报告错误.
代码示例6-7prtdiag温度过高指示输出类似地,如果特定组件存在故障,则prtdiag会在相应的"Status"栏中报告故障.
代码示例6-8prtdiag故障指示输出prtfru命令SunFireV125服务器维护一个系统中所有现场可更换单元(Field-ReplacableUnit,FRU)的分层列表,以及有关各种FRU的特定信息.
prtfru命令可以显示该分层列表,以及许多FRU上串行可电擦除可编程的只读存储器(SerialElectrically-ErasableProgrammableRead-OnlyMemory,SEEPROM)设备中包含的数据.
代码示例6-9显示了带有-l选项的prtfru命令生成的FRU分层列表的摘录.
SystemTemperatures(Celsius):DeviceTemperatureStatusCPU0102ERRORFanStatus:BankRPMStatusCPU00000[FAULT]56SunFireV125服务器管理指南2006年10月代码示例6-9prtfru-l命令的输出代码示例6-10显示了带有-c选项的prtfru命令生成的SEEPROM数据的摘录.
代码示例6-10prtfru-c命令的输出prtfru命令显示的数据因FRU的类型而异.
该数据通常包括:FRU描述生产商名称和位置部件号和序列号硬件修订版本级别#prtfru-l/frutree/frutree/chassis(fru)/frutree/chassis/MBLabel=MB/frutree/chassis/MBLabel=MB/system-board(container)/frutree/chassis/MBLabel=MB/system-board/SCLabel=SC/frutree/chassis/MBLabel=MB/system-board/SCLabel=SC/sc(fru)/frutree/chassis/MBLabel=MB/system-board/BATLabel=BAT/frutree/chassis/MBLabel=MB/system-board/BATLabel=BAT/battery(fru)/frutree/chassis/MBLabel=MB/system-board/P0Label=P0/frutree/chassis/MBLabel=MB/system-board/P0Label=P0/cpu(fru)/frutree/chassis/MBLabel=MB/system-board/P0Label=P0/cpu/F0Label=F0#prtfru-c/frutree/chassis/MBLabel=MB/system-board(container)SEGMENT:SD/SpecPartNo:885-0092-02/ManR/ManR/UNIX_Timestamp32:WednesdayApril1011:34:49BST2006/ManR/Fru_Description:FRUID,INSTR,M'BD,0CPU,0MB,ENXU/ManR/Manufacture_Loc:HsinChu,Taiwan/ManR/Sun_Part_No:3753107/ManR/Sun_Serial_No:abcdef/ManR/Vendor_Name:MitacInternational/ManR/Initial_HW_Dash_Level:02/ManR/Initial_HW_Rev_Level:01第6章诊断57psrinfo命令psrinfo命令可以显示每个CPU联机的日期和时间.
带有详细(-v)选项时,该命令还会显示有关CPU的其他信息(包括时钟速度).
以下是带有-v选项的psrinfo命令的输出范例.
代码示例6-11psrinfo-v命令的输出showrev命令showrev命令可以显示当前硬件和软件的修订版本信息.
代码示例6-12显示了showrev命令的输出范例.
代码示例6-12showrev命令的输出使用-p选项时,该命令会显示已安装的修补程序.
代码示例6-13显示了带有-p选项的showrev命令的部分输出范例.
#psrinfo-vStatusofvirtualprocessor0asof:08/21/200617:14:11on-linesince08/19/200617:25:54.
Thesparcv9processoroperatesat1002MHz,andhasasparcv9floatingpointprocessor.
#showrevHostname:griffithHostid:830f8192Release:5.
10Kernelarchitecture:sun4uApplicationarchitecture:sparcHardwareprovider:Sun_MicrosystemsDomain:Kernelversion:SunOS5.
10Generic108528-16August200658SunFireV125服务器管理指南2006年10月代码示例6-13showrev-p命令的输出运行Solaris系统信息命令1.
确定希望显示的系统信息的类型.
有关更多信息,请参见第52页"Solaris系统信息命令".
2.
在控制台提示符下,键入适当的命令.
有关命令的汇总,请参见表6-5.
#showrev-pPatch:109729-01Obsoletes:Requires:Incompatibles:Packages:SUNWcsuPatch:109783-01Obsoletes:Requires:Incompatibles:Packages:SUNWcsuPatch:109807-01Obsoletes:Requires:Incompatibles:Packages:SUNWcsuPatch:109809-01Obsoletes:Requires:Incompatibles:Packages:SUNWcsuPatch:110905-01Obsoletes:Requires:Incompatibles:Packages:SUNWcsuPatch:110910-01Obsoletes:Requires:Incompatibles:Packages:SUNWcsuPatch:110914-01Obsoletes:Requires:Incompatibles:Packages:SUNWcsuPatch:108964-04Obsoletes:Requires:Incompatibles:Packages:SUNWcsr表6-5使用Solaris信息显示命令命令显示内容键入内容注释prtconf系统配置信息/usr/sbin/prtconf—prtdiag诊断和配置信息/usr/platform/sun4u/sbin/prtdiag使用-v选项可以获取其他详细信息.
prtfruFRU分层结构和SEEPROM内存内容/usr/sbin/prtfru使用-l选项显示分层结构.
使用-c选项显示SEEPROM数据.
psrinfo每个CPU联机的日期和时间;处理器时钟速度/usr/sbin/psrinfo使用-v选项获取时钟速度和其他数据.
showrev硬件和软件的修订版本信息/usr/bin/showrev使用-p选项显示软件修补程序.
第6章诊断59最近的诊断测试结果通过关闭系统电源然后再次打开,可以保存由最近一次的开机自检(Power-OnSelf-Test,POST)和OpenBootDiagnostics测试程序生成的结果的汇总.
查看最近的测试结果1.
转至ok提示符.
2.
键入以下命令:OpenBoot配置变量IDPROM中存储的参数和诊断配置变量决定了如何和何时执行开机自检(Power-OnSelf-Test,POST)诊断程序和OpenBootDiagnostics测试程序.
本节介绍了如何访问和修改OpenBoot配置变量.
有关重要的OpenBoot配置变量的列表,请参见表6-2.
对OpenBoot配置变量所做的更改通常在系统下一次引导时生效.
查看OpenBoot配置变量1.
停止服务器以进入ok提示符.
2.
要显示所有OpenBoot配置变量的当前值,请使用printenv命令.
以下示例显示了此命令输出的简短摘录.
okshow-post-resultsokprintenvVariableNameValueDefaultValuediag-levelminmindiag-switchfalsefalse60SunFireV125服务器管理指南2006年10月设置OpenBoot配置变量1.
停止服务器以进入ok提示符.
2.
要设置或更改OpenBoot配置变量的值,请使用setenv命令:要设置接受多个关键字的OpenBoot配置变量,请使用空格分隔关键字.
注–用于OpenBoot配置变量test-args的关键字必须使用逗号分隔.
用于特定设备的其他诊断测试本节介绍了可用于特定设备的其他诊断测试.
使用probe-scsi命令确认硬盘驱动器是否处于活动状态probe-scsi命令向连接到系统内部SCSI接口的SCSI设备发出查询.
如果SCSI设备已连接并且处于活动状态,则此命令会显示该设备的单元编号、设备类型和生产商名称.
oksetenvdiag-levelmaxdiag-level=max代码示例6-14probe-scsi的输出消息okprobe-scsiTarget0Unit0DiskSEAGATEST336605LSUN36G4207Target1Unit0DiskSEAGATEST336605LSUN36G0136第6章诊断61probe-scsi-all命令向连接到系统内部和外部SCSI接口的所有SCSI设备发出查询.
代码示例6-15显示了一个服务器的输出范例,该服务器没有从外部连接的SCSI设备,但包含两个处于活动状态的36GB硬盘驱动器.
使用probe-ide命令确认是否已连接DVD或CD-ROM驱动器probe-ide命令向连接到系统板上IDE接口的内部和外部IDE设备发出查询.
以下的输出范例报告服务器中安装了一个DVD驱动器(作为Device0)并且该驱动器处于活动状态.
代码示例6-15probe-scsi-all的输出消息okprobe-scsi-all/pci@1f,0/pci@1/scsi@8,1/pci@1f,0/pci@1/scsi@8Target0Unit0DiskSEAGATEST336605LSUN36G4207Target1Unit0DiskSEAGATEST336605LSUN36G0136代码示例6-16probe-ide的输出消息okprobe-ideDevice0(PrimaryMaster)RemovableATAPIModel:DV-28E-BDevice1(PrimarySlave)NotPresentDevice2(SecondaryMaster)NotPresentDevice3(SecondarySlave)NotPresent62SunFireV125服务器管理指南2006年10月使用watch-net和watch-net-all命令检查网络连接watch-net诊断测试命令负责监视主网络接口上的以太网数据包.
watch-net-all诊断测试命令负责监视主网络接口以及连接到系统板的其他网络接口上的以太网数据包.
系统接收到的良好数据包由句点(.
)表示.
错误(如帧错误和循环冗余码校验(CyclicRedundancyCheck,CRC)错误)由X表示,并且附带相关的错误描述.
在ok提示符下键入watch-net命令启动watch-net诊断测试.
对于watch-net-all诊断测试,请在ok提示符下键入watch-net-all.
代码示例6-17watch-net诊断的输出消息{1}okwatch-net100MbpsFDXLinkupLookingforEthernetPackets.
'.
'isaGoodPacket.
'X'isaBadPacket.
Typeanykeytostop.
代码示例6-18watch-net-all诊断的输出消息{1}okwatch-net-all/pci@1d,700000/network@2,1TimedoutwaitingforAutonegotationtocompleteCheckcableandtryagainLinkDown/pci@1f,700000/network@2100MbpsFDXLinkupLookingforEthernetPackets.
'.
'isaGoodPacket.
'X'isaBadPacket.
Typeanykeytostop.
{1}ok第6章诊断63有关OpenBootPROM诊断测试的其他信息,请参见:《OpenBootPROMEnhancementsforDiagnosticOperation》.
自动系统恢复AutomaticSystemRecovery(ASR)包含自检功能和自动配置功能,可以检测出现故障的硬件组件并取消配置它们.
这样,服务器可以在发生某些非致命硬件故障后继续运行.
注–ASR不同于SunFireV125服务器支持的另一个组件AutomaticServerRestart.
有关AutomaticServerRestart的其他信息,请参见第27页"AutomaticServerRestart".
如果某个组件受到ASR的监视,并且在没有该组件的情况下服务器也能运行,则当该组件发生故障或失败时,服务器会自动重新引导.
ASR监视内存模块.
如果在打开电源的过程中检测到某个故障,则会禁用出现故障的组件.
如果系统仍可正常运行,则引导过程会继续进行.
如果服务器在运行期间出现故障,并且服务器可以在没有故障组件的情况下运行,则服务器会自动重新引导.
这样可以防止出现故障的硬件组件重复导致整个系统关闭或崩溃.
为支持降级引导功能,OpenBoot固件使用1275Client界面(通过设备树)将一个设备标记为failed或disabled.
这样可以在设备树节点上创建适当的状态属性.
Solaris操作系统不会激活如此标记的子系统的驱动程序.
在拨打服务电话的同时,只要故障组件处于"电休眠"状态(例如,不引起随机总线错误或信号噪音),系统就会自动重新引导并继续运行.
注–只有激活ASR才能启用它.
Auto-Boot选项auto-boot设置负责控制在每次复位后固件是否自动引导操作系统.
默认的设置为true.
64SunFireV125服务器管理指南2006年10月auto-boot-on-error设置负责控制在检测到子系统故障时系统是否尝试进行降级引导.
auto-boot和auto-boot-on-error均必须设置为true以启用自动降级引导.
设置开关键入:注–auto-boot-on-error的默认设置是false.
因此,系统不会尝试进行降级引导,除非您将该设置更改为true.
此外,对于不可恢复的致命错误,即使启用降级引导功能,系统也不会尝试进行降级引导.
有关不可恢复的致命错误的示例,请参见第64页"错误处理摘要".
错误处理摘要加电序列中的错误处理包括如下三种情况:如果开机自检或OpenBootDiagnostics没有检测到错误,并且auto-boot为true,则系统会尝试进行引导.
如果开机自检或OpenBootDiagnostics只检测到非致命错误,则在auto-boot设置为true且auto-boot-on-error也设置为true的情况下,系统会尝试进行引导.
注–如果开机自检或OpenBootDiagnostics检测到与标准引导设备关联的非致命错误,则OpenBoot固件会自动取消配置故障设备,并尝试使用boot-device配置变量指定的下一个引导设备.
如果开机自检或OpenBootDiagnostics检测到致命错误,则无论auto-boot或auto-boot-on-error的设置为何值,系统均不会进行引导.
致命且不可恢复的错误包括以下几种:所有CPU均出现故障所有逻辑内存存储体发生故障快擦写RAM(FlashRAM)循环冗余码校验(CyclicalRedundancyCheck,CRC)发生故障关键的现场可更换单元(Field-ReplaceableUnit,FRU)的PROM配置数据错误oksetenvauto-boottrueoksetenvauto-boot-on-errortrue第6章诊断65关键的特定应用集成电路(Application-SpecificIntegratedCircuit,ASIC)发生故障复位过程两个OpenBoot配置变量diag-switch和diag-trigger负责控制系统如何针对系统复位事件来运行固件诊断程序.
标准的系统复位过程会跳过开机自检和OpenBootDiagnostics,除非diag-switch被设置为true或diag-trigger被设置为reset事件.
该变量的默认设置为false.
由于ASR依靠固件诊断程序检测故障设备,因此要运行ASR就必须将diag-switch设置为true.
有关指导,请参见第65页"启用ASR".
要控制哪些复位事件(如果有)可以自动启动固件诊断程序,请使用diag-trigger.
有关这些变量及其使用的详细解释,请参见第43页"控制开机自检诊断".
启用ASR1.
在ok系统提示符下,键入:2.
将diag-trigger变量设置为power-on-reset、error-reset或user-reset.
例如,键入以下命令:3.
键入:4.
键入:如果OpenBoot变量auto-boot被设置为true(该变量的默认值),则系统将永久性地存储参数更改并自动进行引导.
oksetenvdiag-switchtrueoksetenvdiag-triggeruser-resetoksetenvauto-boottrueoksetenvauto-boot-on-errortrueokreset-all66SunFireV125服务器管理指南2006年10月注–要存储参数更改,您还可以使用前面板上的"电源"开关将系统的电源关闭然后再重新打开.
禁用ASR1.
在ok系统提示符下,键入:2.
键入:系统会永久存储参数更改.
注–要存储参数更改,您还可以使用前面板上的"电源"开关将系统电源关闭然后再重新打开.
oksetenvdiag-switchfalseoksetenvdiag-triggernoneokreset-all67索引Aauto-boot变量,43安装硬盘驱动器,19BBIST,请参见built-inself-testBMCPatrol,参见第三方监视工具built-inself-testtest-args变量和,46CCPU,显示有关信息,57测试系统使用SunVTS,35拆除DVD驱动器,22硬盘驱动器,18,19,20处理器速度,显示,57错误消息OpenBootDiagnostics,解释,48Ddiag-level,41diag-level变量,43,46diag-script变量,43diag-switch,41diag-switch变量,43代理,SunManagementCenter,32第三方监视工具,33FFRU部件号,56分层列表,55生产商,56硬件修订版本级别,56FRU数据IDPROM的内容,56负荷测试,另请参见测试系统,35复位事件,种类,44HHardwareDiagnosticSuite,32HPOpenview,参见第三方监视工具回路ID(probe-scsi),49IIDE总线,49input-device变量,4468SunFireV125服务器管理指南2006年10月J集成驱动器电路,请参见IDE总线间歇性问题,33解释错误消息OpenBootDiagnostics测试,48静电放电(electrostaticdischarge,ESD)预防措施,14K开机自检消息,41L逻辑单元编号(probe-scsi),49逻辑视图(SunManagementCenter),32Oobdiag-trigger变量,44OpenBootDiagnostics,45OpenBootDiagnostics测试错误消息,解释,48test命令,47test-all命令,47硬件设备路径,47在ok提示符下运行,47OpenBoot命令probe-ide,49probe-scsi和probe-scsi-all,49show-devs,50OpenBootPROM参数diag-level,41diag-switch,41OpenBoot配置变量表,43用途,43output-device变量,44Ppost-trigger变量,44probe-devs命令(OpenBoot),50probe-ide命令(OpenBoot),49probe-scsi和probe-scsi-all命令(OpenBoot),49prtconf命令(Solaris),53prtdiag命令(Solaris),54prtfru命令(Solaris),55psrinfo命令(Solaris),57Q全局名称(probe-scsi),49R日志文件,32,52软件修订版本,使用showrev显示,57Sshowrev命令(Solaris),57Solaris命令prtconf,53prtdiag,54prtfru,55psrinfo,57showrev,57SunEnterpriseAuthenticationMechanism,36SunManagementCenter,非正式跟踪系统,32SunVTS,测试系统,35设备路径,硬件,47,50设备树Solaris,显示,53已定义,32时钟速度(CPU),57树,设备,32输出消息watch-net诊断,62watch-net-all诊断,62索引69Ttest命令(OpenBootDiagnostics测试),47test-all命令(OpenBootDiagnostics测试),47test-args变量,46关键字(表),46TivoliEnterpriseConsole,参见第三方监视工具通用串行总线(UniversalSerialBus,USB)设备运行OpenBootDiagnostics自检,47Wwatch-net诊断输出消息,62watch-net-all诊断输出消息,62温度过高情况使用prtdiag确定,55物理视图(SunManagementCenter),32X系统内存确定数量,53系统配置卡,41消息,开机自检,41修补程序,已安装使用showrev确定,57修订版本,硬件和软件使用showrev显示,57Y移动系统,预防措施,15硬件设备路径,47,50硬件修订版本,使用showrev显示,57硬盘驱动器安装,19拆除,20Z诊断开机自检(POST),41OpenBootDiagnostics,45probe-ide,61probe-scsi,probe-scsi-all,60SunVTS,36watch-net和watch-net-all,62诊断测试跳过,44诊断工具汇总(表),39中央处理单元,请参见CPU主机适配器(probe-scsi),4970SunFireV125服务器管理指南2006年10月
vpsdime怎么样?vpsdime是2013年成立的国外VPS主机商,以大内存闻名业界,主营基于OpenVZ和KVM虚拟化的Linux套餐,大内存、10Gbps大带宽、大硬盘,有美国西雅图、达拉斯、新泽西、英国、荷兰机房可选。在上个月搞了一款达拉斯Linux系统VPS促销,详情查看:vpsdime夏日促销活动,美国达拉斯vps,2G内存/2核/20gSSD/1T流量,$20/年,此次推出一款Wi...
racknerd怎么样?racknerd最近发布了一些便宜美国服务器促销,包括大硬盘服务器,提供120G SSD+192TB HDD,有AMD和Intel两个选择,默认32G内存,1Gbps带宽,每个月100TB流量,5个IP地址,月付$599。价格非常便宜,需要存储服务器的朋友可以关注一下。RackNerd主要经营美国圣何塞、洛杉矶、达拉斯、芝加哥、亚特兰大、新泽西机房基于KVM虚拟化的VPS、...
香港ceranetworks提速啦是成立于2012年的十分老牌的一个商家这次给大家评测的是 香港ceranetworks 8核16G 100M 这款产品 提速啦老板真的是豪气每次都给高配我测试 不像别的商家每次就给1核1G,废话不多说开始跑脚本。香港ceranetworks 2核2G 50G硬盘20M 69元/月30M 99元/月50M 219元/月100M 519元/月香港ceranetwork...
服务器维修为你推荐
深圳市富满电子集团股份有限公司微信群里正在组织赌博如时间选项无法打开请更改legraph支持ipadeaccelerator开启eAccelerator内存优化就各种毛病,DZ到底用哪个内存优化比较好。。。css3圆角如何用CSS实现圆角矩形?win7关闭445端口win7系统怎么关闭445和135这两个端口windows键是哪个windows 快捷键 大全谷歌sbgoogle一下"SB",虽然显示的是baidu排第一,链接的不是baidu.
网址域名注册 南通服务器租用 vps教程 美国vps评测 服务器配置技术网 z.com 好看的桌面背景大图 2017年万圣节 国外空间 新站长网 ibrs 申请个人网页 网站挂马检测工具 京东商城双十一活动 智能骨干网 福建天翼加速 网站木马检测工具 ntfs格式分区 域名评估 美国网站服务器 更多