SunMicrosystems,Inc.
www.
sun.
com请将有关本文档的意见和建议提交至:http://www.
sun.
com/hwdocs/feedbackSunFire入门级中型系统管理指南固件版本5.
20.
0文件号码819-5595-102006年4月,修订版A请回收版权所有2006SunMicrosystems,Inc.
,4150NetworkCircle,SantaClara,California95054,U.
S.
A.
保留所有权利.
对于本文档中介绍的产品,SunMicrosystems,Inc.
对其所涉及的技术拥有相关的知识产权.
需特别指出的是(但不局限于此),这些知识产权可能包含在http://www.
sun.
com/patents中列出的一项或多项美国专利,以及在美国和其他国家/地区申请的一项或多项其他专利或待批专利.
本文档及其相关产品的使用、复制、分发和反编译均受许可证限制.
未经Sun及其许可方(如果有)的事先书面许可,不得以任何形式、任何手段复制本产品或文档的任何部分.
第三方软件,包括字体技术,均已从Sun供应商处获得版权和使用许可.
本产品的某些部分可能是从BerkeleyBSD系统衍生出来的,并获得了加利福尼亚大学的许可.
UNIX是X/OpenCompany,Ltd.
在美国和其他国家/地区独家许可的注册商标.
Sun、SunMicrosystems、Sun徽标、AnswerBook2、docs.
sun.
com、SunFire和Solaris是SunMicrosystems,Inc.
在美国和其他国家/地区的商标或注册商标.
所有的SPARC商标的使用均已获得许可,它们是SPARCInternational,Inc.
在美国和其他国家/地区的商标或注册商标.
标有SPARC商标的产品均基于由SunMicrosystems,Inc.
开发的体系结构.
OPENLOOK和Sun图形用户界面是SunMicrosystems,Inc.
为其用户和许可证持有者开发的.
Sun感谢Xerox在研究和开发可视或图形用户界面的概念方面为计算机行业所做的开拓性贡献.
Sun已从Xerox获得了对Xerox图形用户界面的非独占性许可证,该许可证还适用于实现OPENLOOKGUI和在其他方面遵守Sun书面许可协议的Sun许可证持有者.
美国政府权利-商业用途.
政府用户应遵循SunMicrosystems,Inc.
的标准许可协议,以及FAR(FederalAcquisitionRegulations,即"联邦政府采购法规")的适用条款及其补充条款.
本文档按"原样"提供,对于所有明示或默示的条件、陈述和担保,包括对适销性、适用性或非侵权性的默示保证,均不承担任何责任,除非此免责声明的适用范围在法律上无效.
iii目录前言xix1.
概述1系统控制器1I/O端口2LOM提示符3Solaris控制台4环境监视4系统指示灯板4可靠性、可用性及可维护性(RAS)5可靠性6禁用组件或板和通电自测(POST)6手动禁用组件6环境监视6可用性7动态重新配置7电源故障7系统控制器重新引导7主机监视器(HostWatchdog)7ivSunFire入门级中型系统管理指南2006年4月可维护性7LED指示灯8命名原则8系统控制器错误日志8系统控制器XIR(外部重置)支持8即需即用选项82.
启动和设置SunFire入门级中型系统9设置硬件10安装硬件并连接硬件电缆10使用电源On/Standby开关10打开和关闭电源11使用On/Standby开关打开电源11使用LOMpoweron命令打开电源12使系统进入待机模式12使用Solarisshutdown命令13使用LOMshutdown命令13使用On/Standby开关发出shutdown命令13使用LOMpoweroff命令14使用On/Standby开关发出poweroff命令14打开电源之后15设置系统16设置日期和时间16设置密码17配置网络参数17安装和引导Solaris操作系统19安装和引导Solaris操作系统19目录v安装LightsOutManagement软件包20安装LOM驱动程序20安装LOM实用程序22安装LOM手册页23重置系统24强制重置系统24重置系统控制器253.
切换过程27建立LOM控制台连接28使用串行端口访问LOM控制台28连接到ASCII终端29连接到网络终端服务器30连接到工作站的串行端口B31使用远程连接访问LOM控制台32断开LOM控制台连接33在不同控制台之间切换34切换到LOM提示符36从LOM提示符切换到Solaris控制台36从OpenBootPROM切换到LOM提示符37在Solaris正在运行时切换到OpenBoot提示符37在通过串行端口连接到系统控制器时终止会话37在通过网络连接到系统控制器时终止会话38viSunFire入门级中型系统管理指南2006年4月4.
系统控制器消息日志395.
从SolarisOS中使用LightsOutManagement和系统控制器41LOM命令语法42在Solaris操作系统中监视系统42查看联机LOM文档43查看LOM配置(lom-c)43检查故障LED指示灯和报警LED指示灯的状态(lom-l)43查看事件日志(lom-e)44检查风扇(lom-f)45检查内部电压传感器(lom-v)45检查内部温度(lom-t)48查看所有组件的状态数据和LOM的配置数据(lom-a)49在Solaris中执行的其他LOM任务50打开和关闭报警(lom-A)50更改lom>提示符的转义序列(lom-X)50在LOM提示符下停止LOM向控制台发送报告(lom-Eoff)51升级固件(lom-G文件名)516.
运行POST53用于配置POST的OpenBootPROM变量54使用bootmode命令控制POST57控制系统控制器POST587.
自动诊断和恢复61自动诊断和恢复概述62自动恢复挂起系统64诊断事件65诊断和恢复控制65诊断参数65目录vii获取自动诊断和恢复信息67查看自动诊断事件消息67查看组件状态68查看其他错误信息708.
安全性指导71系统安全保护71定义控制台密码72使用SNMP协议缺省配置72重新引导SC以应用设置72选择远程连接类型73启用SSH73启用SSH74SSH不支持的功能74更改SSH主机密钥75其他安全注意事项76允许RTOSShell访问的专用键序76域最小化76Solaris操作系统安全性769.
即需即用77COD概述78COD许可证注册过程78CODRTU许可证分配79即时访问CPU79用作热备用的即时访问CPU80资源监视80viiiSunFire入门级中型系统管理指南2006年4月准备使用COD80管理CODRTU许可证81获得CODRTU许可证密钥并将其添加到COD许可证数据库81从COD许可证数据库中删除COD许可证密钥82查看COD许可证信息83激活COD资源84启用或禁用即时访问CPU并保留RTU许可证84监控COD资源86CODCPU/内存板86标识CODCPU/内存板86COD资源使用情况87查看COD使用情况87禁用COD的CPU88其他COD信息8910.
维护和故障排除91设备映射92CPU/内存映射92IB_SSC部件映射93系统故障97客户可更换单元98SunFireE2900系统98SunFireV1280系统98Netra1280和Netra1290系统99手动列入黑名单(等待维修期间)99有关CPU/内存板的特别注意事项100目录ix恢复挂起的系统101手动恢复挂起的系统102移动系统身份信息103温度104电源106显示诊断信息107协助Sun服务人员查明故障原因10711.
固件升级过程109使用flashupdate命令109使用flashupdate命令将SunFireV1280或Netra1280系统的固件版本从5.
13.
x升级到5.
17.
0111使用flashupdate命令将运行固件版本5.
17.
x、5.
18.
x或5.
19.
x的SunFireE2900、SunFireV1280或Netra1280系统升级到5.
20.
0112使用flashupdate命令将运行固件版本5.
17.
x的SunFireV1280或Netra1280系统降级到5.
13.
x112使用flashupdate命令将运行固件版本5.
18.
x、5.
19.
x或5.
20.
0的SunFireE2900、SunFireV1280或Netra1280系统降级到5.
17.
x113使用lom–G命令113示例114使用lom-G命令升级SunFireE2900、SunFireV1280或Netra1280系统的固件117使用lom-G命令降级SunFireE2900、SunFireV1280或Netra1280系统的固件11812.
CPU/内存板更换和动态重新配置(DR)119动态重新配置119命令行界面119DR概念120静止120Suspend-Safe和Suspend-Unsafe设备120连接点121xSunFire入门级中型系统管理指南2006年4月DR操作121热插拔硬件122情况和状况122板状况和情况122板插口状况122板插卡状况123板情况123组件状况和情况124组件插口状况124组件插卡状况124组件情况124组件类型124非持久性内存和持久性内存125限制125内存交错125重新配置持久性内存125命令行界面126cfgadm命令126显示基本板状态127显示详细板状态127命令选项129测试板和部件129测试CPU/内存板129安装或更换CPU/内存板131安装新板131热交换CPU/内存板132从系统中拆除CPU/内存板133临时断开CPU/内存板的连接133目录xi故障排除134CPU/内存板取消配置故障134无法取消配置其内存交叉存储于多块板上的板134无法取消配置已绑定某进程的CPU135无法在取消配置所有内存之前取消配置CPU135无法取消配置具有持久性内存的板上的内存135无法重新配置内存135没有足够的可用内存136内存需求增加136无法取消配置CPU136无法断开板的连接136CPU/内存板配置故障137无法同时配置CPU0和CPU1137板上的CPU必须在配置内存之前配置137A.
了解监视器定时器应用程序模式139了解监视器定时器应用程序模式140使用ntwdt驱动程序141了解用户API141设置超时间隔142启用或禁用监视器142重置,或复位监视器142获取监视器定时器的状况143查找和定义数据结构143使用监视器程序范例144对报警3进行编程145xiiSunFire入门级中型系统管理指南2006年4月了解错误消息146EAGAIN146EFAULT146EINVAL146EINTR146ENXIO146了解不支持的特性和限制147词汇表149索引153xiii图图1-1I/O端口2图1-2系统指示灯板4图2-1电源On/Standby开关10图3-1控制台间的切换过程35图4-1系统控制器日志40图7-1自动诊断和恢复过程62图10-1SunFire入门级中型系统IB_SSCPCI物理插槽分配(针对IB6)96图10-2系统指示灯97图12-1cfgadm-av显示内容的详细信息128xivSunFire入门级中型系统管理指南2006年4月xv表表1-1选择的系统控制器管理任务3表1-2系统指示灯LED功能5表2-1电源On/Standby开关说明11表6-1POST配置参数54表7-1诊断和操作系统恢复参数66表8-1SSH服务器属性73表9-1COD许可证信息83表9-2showcodusage信息87表9-3获取COD配置和事件信息89表10-1CPU和内存代理ID分配93表10-2I/O部件类型与插槽数93表10-3每个系统的I/O部件数和名称93表10-4I/O控制器代理ID分配94表10-5IB_SSC部件PCI设备映射95表10-6系统故障指示灯状况97表10-7黑名单组件名称99表10-8使用showenvironment命令检查温度情况104表12-1DR操作类型121表12-2板插口状况123表12-3板插卡状况123xviSunFire入门级中型系统管理指南2006年4月表12-4板情况123表12-5组件插卡状况124表12-6组件情况124表12-7组件类型124表12-8系统控制器(SC)产生的DR板状况126表12-9cfgadm-c命令选项129表12-10cfgadm-x命令选项129表12-11诊断级别130表A-1报警3的行为145xvii代码示例代码示例2-1系统控制器产生的硬件重置输出15代码示例2-2setupnetwork命令产生的输出18代码示例2-3安装LOM驱动程序20代码示例2-4安装LOM实用程序22代码示例2-5安装LOM手册页23代码示例5-1lom-c命令的输出范例43代码示例5-2lom-l命令的输出范例43代码示例5-3LOM事件日志的范例(先报告最早的事件)44代码示例5-4lom-f命令的输出范例45代码示例5-5lom-v命令的输出范例45代码示例5-6lom-t命令的输出范例48代码示例6-1使用max设置时的POST输出56代码示例6-2将SCPOST诊断级别设为min58代码示例6-3将诊断级别设为min时的SCPOST输出58代码示例7-1在控制台上显示的自动诊断事件消息实例63代码示例7-2在操作系统心跳停止后自动恢复域时出现的消息输出实例64代码示例7-3在操作系统未响应中断请求后自动恢复域时出现的控制台输出实例64代码示例7-4域诊断事件消息-非致命性的域硬件错误65代码示例7-5自动诊断消息实例68代码示例7-6showboards命令输出-状态为Disabled和Degraded的组件68xviiiSunFire入门级中型系统管理指南2006年4月代码示例7-7showcomponent命令输出-状态为Disabled的组件69代码示例7-8showerrorbuffer命令输出-硬件错误70代码示例9-1包含禁用CODCPU信息的控制台日志输出88代码示例9-2showcomponent命令输出-禁用的CODCPU88代码示例11-1下载lw8pci.
flash映像114代码示例11-2下载lw8cpu.
flash映像115代码示例12-1基本cfgadm命令的输出127代码示例12-2cfgadm-av命令的输出127代码示例A-1监视器/重置状况数据结构143代码示例A-2监视器/重置控制数据结构143代码示例A-3监视器实例144代码示例A-4LOMIOCALCTL和LOMIOCALSTATEIOCTL数据结构145xix前言本书简要介绍系统的有关信息并逐步说明一般的管理过程.
它介绍了如何在SunFire入门级中型服务器系列-SunFireE2900和SunFireV1280/Netra1280/Netra1290系统-上配置和管理系统控制器固件,并说明了如何拆卸和更换组件以及执行固件升级.
此外,本书还包含有关系统安全、故障排除和技术术语词汇表的信息.
本书的结构第1章介绍系统控制器、板状况、冗余系统组件、最低系统配置以及系统的可靠性、可用性和可维护性.
第2章介绍如何初次通电并设置系统.
第3章介绍如何切换系统控制器.
第4章介绍系统控制器消息日志.
第5章介绍如何在Solaris控制台中使用LOM.
第6章介绍如何运行通电自测(POST)诊断程序.
第7章介绍固件的自动诊断和域恢复功能.
第8章介绍安全准则.
第9章介绍即需即用(COD)选项以及如何分配、激活和监控COD资源.
第10章介绍故障排除信息,包括LED指示灯、系统故障、显示诊断信息、显示系统配置信息、禁用组件(列入黑名单)以及将设备路径名映射到物理系统设备.
第11章介绍有关固件更新的信息,包括如何更新闪存PROM以及更新系统控制器固件的过程.
第12章介绍动态重新配置功能以及您可执行的过程.
附录A介绍监视器定时器、报警3及其使用步骤.
xxSunFire入门级中型系统管理指南2006年4月使用UNIX命令本书假定您熟悉UNIX操作系统.
如果您不熟悉UNIX操作系统,请参阅下列一个或多个文档,了解相关信息:用于Solaris操作系统的AnswerBook2联机文档.
系统附带的其他软件文档.
印刷约定字体**浏览器的设置可能会与这些设置有所不同.
含义示例AaBbCc123命令、文件和目录的名称;计算机屏幕输出.
编辑.
login文件.
使用ls-a列出所有文件.
%Youhavemail.
AaBbCc123用户键入的内容,与计算机屏幕输出的显示不同.
%suPassword:AaBbCc123保留未译的新词或术语以及要强调的词.
要使用实名或值替换的命令行变量.
这些称为class选项.
要删除文件,请键入rmfilename.
新词术语强调新词或术语以及要强调的词.
您必须成为超级用户才能执行此操作.
《书名》书名阅读《用户指南》的第6章.
前言xxiShell提示符相关文档文档、支持和培训shell提示符Cshellmachine-name%Cshell超级用户machine-name#Bourneshell和Kornshell$Bourneshell和Kornshell超级用户#LOMshelllom>书籍类型书名文件号码命令参考《SunFireEntry-LevelMidrangeSystemControllerCommandReferenceManual》819-5085-10Sun提供的服务URL文档http://www.
sun.
com/documentation/支持http://www.
sun.
com/support/培训http://www.
sun.
com/training/xxiiSunFire入门级中型系统管理指南2006年4月Sun欢迎您提出意见Sun致力于提高其文档的质量,并十分乐意收到您的意见和建议.
您可以通过以下网址提交您的意见和建议:http://www.
sun.
com/hwdocs/feedback请在电子邮件主题行内包含本文档的文件号码(819-5595-10).
1第1章概述本章简要介绍SunFire入门级中型服务器(即SunFireE2900和SunFireV1280/Netra1280/Netra1290系统)的功能.
系统设置过程概述以及详细的操作步骤将在第2章中介绍.
本章包括下列主题:第1页的"系统控制器"第5页的"可靠性、可用性及可维护性(RAS)"第8页的"即需即用选项"系统控制器系统控制器(SC)是一种嵌入式系统,它驻留在与系统底板相连的IB_SSC组件上.
SC负责提供LightsOutManagement(LOM)功能,包括通电排序、排序模块通电自测(POST)、环境监视、故障指示以及报警.
SC配有一个RS-232串行接口和一个10/100以太网接口.
通过这些接口,可以共享和获得对LOM命令行界面以及Solaris和OpenBootPROM控制台的访问权限.
系统控制器的功能包括:监视系统提供Solaris和OpenBootPROM控制台提供虚拟TOD(TimeofDay)执行环境监视执行系统初始化协调POST运行在SC上的软件应用程序提供了命令行界面,通过此界面可修改系统设置.
2SunFire入门级中型系统管理指南2006年4月I/O端口系统背面设有以下端口:控制台串行(RS-232)端口(RJ-45)保留备用的串行(RS-232)端口(RJ-45)两个千兆位以太网端口(RJ-45)报警端口(DB-15)系统控制器10/100以太网端口(RJ-45)UltraSCSI端口六个PCI端口(五个33MHz端口,一个66MHz端口)它们的位置如图1-1中所示.
图1-1I/O端口AC3AC2AC1AC0SOURCEASOURCEASOURCEBSCSI3ALARMSBBAPCI333MHzPCI133MHzPCI233MHzPCI433MHzPCI566MHzPCI033MHzLinkActiveGBitLinkActiveGBitNET0NET1SerialASerialBSSC1SSC1PSU3输入PSU2输入PSU1输入PSU0输入PCI0-PCI568管脚SCSI串行端口Net0/Net1报警端口10/100以太网LOM/系统控制器第1章概述3控制台串行端口和10/100以太网端口可用于访问系统控制器.
控制台串行端口可以直接连接ASCII终端或NTS(网络终端服务器).
使用串行电缆连接系统控制器板时,您可以通过ASCII终端或NTS来访问系统控制器命令行界面.
10/100以太网端口用于将SC连接到网络.
LOM提示符LOM提示符提供了SC的命令行界面,同时它也是显示控制台消息的地方.
表1-1列出了一些系统管理任务.
lom>表1-1选择的系统控制器管理任务任务命令配置系统控制器password,setescape,seteventreporting,setupnetwork,setupsc配置系统setalarm,setlocator打开或关闭板和系统的电源poweron,poweroff,reset,shutdown测试CPU/内存板testboard重置系统控制器resetsc将组件标识为Faulty(故障)或OK(正常)disablecomponent,enablecomponent升级固件flashupdate显示系统控制器的当前设置showescape,showeventreporting,shownetwork,showsc显示当前系统状态showalarm,showboards,showcomponent,showenvironment,showfault,showhostname,showlocator,showlogs,showmodel,showresetstate设置日期、时间和时区setdate显示日期和时间showdate4SunFire入门级中型系统管理指南2006年4月Solaris控制台如果您正在运行Solaris操作系统、OpenBootPROM或POST,则可以访问Solaris控制台.
连接到Solaris控制台后,您将处于下列一种操作模式:Solaris操作系统控制台(%或#提示符).
OpenBootPROM(ok提示符).
系统将会运行POST,并且您可以查看POST输出.
要在这些提示符和LOM提示符之间切换,请参见第34页的"在不同控制台之间切换".
环境监视系统配有用于监视温度、电压和通风情况的传感器.
SC会及时轮询这些传感器,以便获取环境数据.
SC会在必要时关闭各个组件,以防损坏.
例如,当温度过高时,SC会通知Solaris操作系统,后者会采取相应的措施.
当极度超温时,SC软件会在事先不通知操作系统的情况下直接关闭系统.
系统指示灯板系统指示灯板包含On/Standby(打开/待机)开关和LED指示灯,如图1-2所示.
图1-2系统指示灯板SERVICEREQUIREDSYSTEMALARMPOWERSOURCE定位器系统故障系统活动On/Standby开关要求顶部进入UNIX正在运行报警1和报警2电源A和电源B或报警3第1章概述5表1-2列出了LED指示灯的功能.
可靠性、可用性及可维护性(RAS)可靠性、可用性和可维护性(RAS)是本系统具有的功能.
可靠性是指系统在正常环境条件下,在指定的时间间隔内保持正常运行的可能性.
可靠性与可用性的不同之处在于:可靠性仅涉及系统故障,而可用性却与故障和恢复都有关.
可用性也称为平均可用性,是指系统正常执行其功能所占时间的百分比.
可用性既可在系统级别上测定,也可根据终端客户机的可用服务来测定.
"系统可用性"限制可能会为安装在该系统顶端的任意产品强制设置可用性上限.
可维护性测定的是产品维护和系统维修的便利性与有效性.
没有单一明确定义的尺度,这是因为可维护性包含平均修复时间(MTTR)和可诊断性两方面.
以下几节提供有关RAS的详细信息.
有关与硬件相关的RAS信息,请参见《SunFireE2900SystemServiceManual》或《SunFireV1280/Netra1280ServiceManual》.
有关与Solaris操作系统相关的RAS功能,请参见《Sun硬件平台指南》.
表1-2系统指示灯LED功能名称颜色功能定位器**系统背面也有一个与此相同的指示灯.
白色常灭;可通过用户命令点亮系统故障*琥珀色LOM检测到故障时亮起系统活动*绿色系统通电时亮起TopAccess(顶部进入)琥珀色只能从系统顶部更换的FRU出现故障时亮起UNIX正在运行绿色Solaris正在运行时亮起.
在系统启动时熄灭,可通过监视器超时或用户定义的报警3断言来重置(有关详细信息,请参见第145页的"对报警3进行编程")报警1和报警2绿色当LOM中指定的事件被触发时亮起电源A和电源B绿色相关供电线路为系统供电时亮起6SunFire入门级中型系统管理指南2006年4月可靠性软件可靠性特性包括:禁用组件或板和通电自测(POST)手动禁用组件环境监视可靠性同时还提高了系统的可用性.
禁用组件或板和通电自测(POST)通电自测(POST)是系统开机过程的一部分.
如果某一板或组件未能通过测试,POST将会禁用该组件或板.
showboards命令会将该板显示为失败或已降级.
只有组件通过POST测试时,才能引导运行Solaris操作系统的系统.
手动禁用组件系统控制器可提供组件级状态并允许用户根据自身的需要修改组件的状态.
从控制台运行setls命令可以设置组件位置状态.
下一次重新引导域、关闭并打开板电源或者运行POST(例如,无论何时执行setkeyswitchon或off命令操作均会运行POST)时,将会更新组件位置状态.
注–enablecomponent和disablecomponent命令已由setls命令取代.
这些命令以前用于管理组件资源.
虽然enablecomponent和disablecomponent命令仍然可用,但还是建议您使用setls命令控制系统内外的组件配置.
showcomponent命令用于显示组件是否被禁用等状态信息.
环境监视SC可以监视系统的温度、通风情况和电压传感器.
SC向Solaris操作系统提供最新的环境状态信息.
如果需要关闭硬件的电源,SC会通知Solaris操作系统执行系统关闭过程.
第1章概述7可用性软件可用性特性包括:动态重新配置电源故障系统控制器重新引导主机监视器(HostWatchdog)动态重新配置以下组件可进行动态重新配置:硬盘驱动器CPU/内存板电源风扇电源故障如果电源在中断后恢复供电,SC会尝试将系统恢复到原来的状态.
系统控制器重新引导SC可重新引导,并会启动及恢复系统管理.
重新引导不会影响当前运行的Solaris操作系统.
主机监视器(HostWatchdog)SC监视Solaris操作系统的状态,如果系统没有反应,它将会启动重置过程.
可维护性软件可维护性特性可以提高系统日常及紧急维修的效率和时效.
LED指示灯命名原则系统控制器错误日志系统控制器XIR(外部重置)支持8SunFire入门级中型系统管理指南2006年4月LED指示灯所有可从系统外访问的现场可更换部件(FRU)都配有指示其状态的指示灯.
除电源设备LED指示灯之外,SC可以管理系统中的所有LED指示灯,电源设备LED指示灯由电源设备管理.
有关LED指示灯功能的说明,请参见《SunFireV1280/Netra1280ServiceManual》中相应的板或设备章节.
命名原则SC、Solaris操作系统、通电自测(POST)和OpenBootPROM错误消息所用的FRU名称与系统中FRU物理标签上的名称一致.
唯一的例外是对I/O设备的OpenBootPROM命名,此命名方法在设备检测过程中使用第10章中介绍的设备路径名来指示I/O设备.
系统控制器错误日志SC错误消息会自动通知给Solaris操作系统.
此外,SC还有一个用于存储错误消息的内部缓冲器.
您可以使用showlogs命令来显示存储在SC消息缓冲器内的SC日志事件.
系统控制器XIR(外部重置)支持SCreset命令使您可以恢复挂起的系统并抽取Solaris操作系统核心文件.
即需即用选项在包含UltraSPARCIVCPU/内存板的系统(例如:SunFireE2900服务器)上,即需即用(COD)选件可在必要时提供额外的处理资源(即额外的CPU).
这些附加CPU由安装在系统内的CODCPU/内存板提供.
但是,要访问这些CODCPU,必须先为其购买COD使用权(RTU)许可证.
获得CODCPU的CODRTU许可证之后,就可以根据需要激活这些CPU.
有关COD的详细信息,请参见第77页的"即需即用".
9'第2章启动和设置SunFire入门级中型系统本章介绍如何使用系统控制器命令行界面(LOM提示符)打开系统电源,如何使用setupnetwork命令设置系统控制器(SC)以及如何引导Solaris操作系统.
本章包括以下主题:第10页的"设置硬件"第10页的"使用电源On/Standby开关"第11页的"打开和关闭电源"第16页的"设置系统"第19页的"安装和引导Solaris操作系统"第24页的"重置系统"下面列出了您在打开系统电源和设置系统时必须执行的主要步骤:1.
安装硬件并连接硬件电缆.
2.
接通硬件的外部电源.
3.
设置系统日期和时间.
4.
设置SC密码.
5.
使用setupnetwork命令设置特定于系统的参数.
6.
使用poweron命令打开所有硬件的电源.
7.
安装Solaris操作系统(如果没有预装).
8.
引导Solaris操作系统.
9.
安装SolarisSupplementaryCD中的LightsOutManagement软件包.
10SunFire入门级中型系统管理指南2006年4月设置硬件安装硬件并连接硬件电缆1.
将终端连接到系统控制器板的串行端口(图1-1).
2.
设置终端,使其使用的波特率与SC串行端口(96008N1)相同.
系统控制器板的串行端口设置如下:9600波特8个数据位无奇偶校验1个停止位有关详细信息,请参阅《SunFireV1280SitePreparationandInstallationGuide》.
使用电源On/Standby开关SunFire入门级中型系统的电源(On/Standby)开关是摇杆式瞬时动作开关.
它只能控制低压信号,不能控制高压电路.
注–电源开关不是On/Off开关,而是On/Standby开关.
这种开关并不能完全切断设备的电源.
图2-1电源On/Standby开关SERVICEREQUIREDSYSTEMALARMPOWERSOURCEOn/Standby开关第2章启动和设置SunFire入门级中型系统11下表介绍了开关的位置.
使用LOMsetupsc命令可防止意外操作On/Standby开关.
打开和关闭电源当所有电源线都连接好,且合上外部电路断路器时,系统即会进入待机模式.
在系统指示灯板上,只有电源A和电源BLED指示灯亮起.
IB_SSC部件的活动LED指示灯也会亮起,但从系统前面看不到.
用户可用下列任何一种方法在待机模式下打开系统的电源:使用On/Standby开关通过LOM端口发送poweron命令如果在OBP中设置了auto-boot变量,则系统会自动引导至Solaris操作系统.
使用On/Standby开关打开电源1.
检查系统是否已接通电源且处于待机模式.
在系统指示灯板上的所有LED指示灯中,只有电源A和电源B指示灯亮起.
IB_SSC部件的活动LED指示灯也会亮起,但从系统前面看不到.
2.
快速将On/Standby开关按到右侧.
这会完全打开系统的电源.
除电源A和电源B指示灯之外,系统活动指示灯也将亮起.
系统将执行通电自测(POST)过程.
表2-1电源On/Standby开关说明符号说明打开按下然后松开,可以打开服务器电源.
这相当于LOMpoweron命令.
待机按住的时间短于四秒钟时,可以启动顺序关机过程,使系统进入待机模式.
这相当于在lom>提示符下运行shutdown命令.
此为正常操作时所用的方法.
按住的时间长于四秒钟时,可以关闭系统的电源并使系统进入待机模式.
这相当于在lom>提示符下运行poweroff命令.
此过程不可中断.
使系统进入待机模式之前,请确保有序地关闭Solaris操作系统,否则可能会丢失数据.
如果希望关闭系统电源并使之进入待机模式,建议在LOM提示符下键入shutdown命令.
12SunFire入门级中型系统管理指南2006年4月使用LOMpoweron命令打开电源在lom>提示符下键入:SC首先打开所有电源设备的电源,然后打开风扇托盘的电源.
最后,SC打开系统板的电源.
如果OpenBootPROM变量auto-boot的值为true,则系统也会引导Solaris操作系统.
此外,poweron命令还可用于打开各个模块的电源.
有关详细信息,请参见《SunFireEntry-LevelMidrangeSystemControllerCommandReferenceManual》.
系统活动指示灯亮起.
系统将会执行通电自测(POST)过程.
注–poweronall命令只能用于打开各个组件的电源,它不会引导Solaris软件.
有关poweron命令的详细信息,请参见《SunFireEntry-LevelMidrangeSystemControllerCommandReferenceManual》.
使系统进入待机模式可用五种方法来实现此目的:使用UNIXshutdown命令通过LOM端口发送shutdown命令使用On/Standby开关发送shutdown命令通过LOM端口发送poweroff命令使用On/Standby开关发送poweroff命令注–使系统进入待机模式之前,请确保有序地关闭Solaris操作系统,否则可能会丢失数据.
lom>poweron第2章启动和设置SunFire入门级中型系统13使用Solarisshutdown命令在系统提示符下键入:系统会关闭电源并进入待机模式.
在系统指示灯板上,只有电源A和电源BLED指示灯亮起.
IB_SSC部件的活动LED指示灯也会亮起,但从系统前面看不到.
使用LOMshutdown命令LOMshutdown命令会有序地关闭系统,接着关闭所有模块和系统机箱的电源并进入待机模式.
注–如果Solaris软件正在运行,此命令先尝试有序地终止系统,然后再关闭系统的电源并使之进入待机模式.
这相当于Solarisinit5命令.
在lom>提示符下键入:在Solaris停止运行后,系统会关闭电源并进入待机模式.
在系统指示灯板上,只有电源A和电源BLED指示灯亮起.
IB_SSC部件的活动LED指示灯也会亮起,但从系统前面看不到.
有关LOMshutdown命令的详细信息,请参见《SunFireEntry-LevelMidrangeSystemControllerCommandReferenceManual》.
使用On/Standby开关发出shutdown命令按下系统On/Standby开关的左侧.
这会启动系统的正常关闭过程,并使系统进入待机模式.
这相当于在lom>提示符下运行shutdown命令.
#shutdown-i5lom>shutdown14SunFire入门级中型系统管理指南2006年4月使用LOMpoweroff命令要关闭所有模块和系统机箱的电源并进入待机模式,请使用poweroff命令.
1.
在lom>提示符下键入:只有您想强制关闭系统电源而不考虑Solaris操作系统的运行状态时,才应回答yes.
在正常操作情况下,您应使用shutdown命令.
2.
键入y继续或按回车键取消命令.
系统会关闭电源并进入待机模式.
在系统指示灯板上,只有电源A和电源BLED指示灯亮起.
IB_SSC部件的活动LED指示灯也会亮起,但从系统前面看不到.
有关poweroff命令的详细信息,请参见《SunFireEntry-LevelMidrangeSystemControllerCommandReferenceManual》.
使用On/Standby开关发出poweroff命令只有您想强制关闭系统电源而不考虑Solaris操作系统的运行状态时,才应使用此方法.
在正常操作情况下,您应在lom>提示符下或使用On/Standby开关发出shutdown命令(请参见第13页的"使用On/Standby开关发出shutdown命令").
按下On/Standby开关的左侧,并至少按住四秒钟.
系统会关闭电源并进入待机模式.
在系统指示灯板上,只有电源A和电源BLED指示灯亮起.
IB_SSC部件的活动LED指示灯也会亮起,但从系统前面看不到.
lom>poweroffThiswillabruptlyterminateSolaris.
Doyouwanttocontinue[no]第2章启动和设置SunFire入门级中型系统15打开电源之后您会在系统控制器串行端口连接上看到以下输出信息:代码示例2-1系统控制器产生的硬件重置输出HardwareReset.
.
.
@(#)SYSTEMCONTROLLER(SC)POST232002/03/2218:03PSR=0x044010e5PCR=0x04004000Basicsanitychecksdone.
SkippingPOST.
.
.
ERIDevicePresentGettingMACaddressforSSC1UsingSCCMACaddressMACaddressis0:3:xx:xx:xx:xxHostname:some_nameAddress:xxx.
xxx.
xxx.
xxxNetmask:255.
255.
255.
0AttachedTCP/IPinterfacetoeriunit0Attachinginterfacelo0.
.
.
doneGateway:xxx.
xxx.
xxx.
xxxinterrupt:100MbpshalfduplexlinkupCopyright2001-2002SunMicrosystems,Inc.
Allrightsreserved.
Useissubjecttolicenseterms.
LightsOutManagementFirmwareRTOSversion:23ScAppversion:5.
13.
0007LW8_build0.
7SCPOSTdiaglevel:offThedateisFriday,July19,2002,3:48:50PMBST.
FriJul1915:48:51some_namelom:Boot:ScApp5.
13.
0007,RTOS23FriJul1915:48:54some_namelom:SBBCResetReason(s):PowerOnResetFriJul1915:48:54some_namelom:InitializingtheSCSRAMFriJul1915:48:59some_namelom:CachingIDinformationFriJul1915:49:00some_namelom:ClockSource:75MHzFriJul1915:49:02some_namelom:/N0/PS0:StatusisOKFriJul1915:49:03some_namelom:/N0/PS1:StatusisOKFriJul1915:49:03some_namelom:Chassisisinsinglepartitionmode.
FriJul1915:49:05some_namelom:Coldbootdetected:recoveringactivedomains16SunFire入门级中型系统管理指南2006年4月设置系统打开电源后,您必须使用本章所述的SCsetdate和setupnetwork命令设置系统.
本节包括下列主题:第16页的"设置日期和时间"第17页的"配置网络参数"第19页的"安装和引导Solaris操作系统"设置日期和时间如果您所在的时区使用标准时间或夏令时,则系统会自动进行此项设置.
在LOM提示符下,使用setdate命令设置系统日期、时间和时区:以下实例根据与格林尼治标准时间(GMT)的时差将时区设为太平洋标准时间(PST),日期和时间设为星期二,2004年4月20日18点15分10秒.
如果正在运行Solaris软件,请使用Solarisdate命令.
有关setdate命令的详细信息,请参见《SunFireEntry-LevelMidrangeSystemControllerCommandReferenceManual》.
FriJul1915:49:06some_namelom:NOTICE:/N0/FT0ispoweredoffConnected.
lom>lom>setdate-tGMT-8042018152004.
10代码示例2-1系统控制器产生的硬件重置输出(续)HardwareReset.
.
.
第2章启动和设置SunFire入门级中型系统17设置密码1.
在LOM提示符下,键入SCpassword命令.
2.
在Enternewpassword:提示符下,键入您的密码.
3.
在Enternewpasswordagain:提示符下,重新键入您的密码.
如果您丢失或遗忘了密码,请与SunService联系,获取相关建议.
配置网络参数您可以在SCLOM提示符下以及通过Solaris软件来管理SunFire入门级中型系统.
访问LOM控制台连接的方法有两种:通过SC串行端口连接.
通过远程(网络)连接(使用10/100以太网端口).
注–系统只能通过串行端口来管理,不过,如果您想使用10/100以太网端口,请使用独立的安全子网实现此连接.
默认情况下,未启用远程连接功能.
如您要使用SSH或Telnet来管理本系统,则必须使用setupnetwork命令将连接类型设置为SSH或Telnet.
在LOM提示符下键入setupnetwork注–如果您在每个问题后都按回车键,则当前值均不会改变.
lom>passwordEnternewpassword:Enternewpasswordagain:lom>lom>setupnetwork18SunFire入门级中型系统管理指南2006年4月有关setupnetwork命令的详细信息,请参见《SunFireEntry-LevelMidrangeSystemControllerCommandReferenceManual》.
代码示例2-2显示了setupnetwork命令的实例.
有关输入每个参数值条目的信息,可参照使用代码示例2-2中的信息.
代码示例2-2setupnetwork命令产生的输出LOM>setupnetworkNetworkConfigurationIsthesystemcontrolleronanetwork[yes]:UseDHCPorstaticnetworksettings[static]:Hostname[hostname]:IPAddress[xxx.
xxx.
xxx.
xxx]:Netmask[xxx.
xxx.
xxx.
x]:Gateway[xxx.
xxx.
xxx.
xxx]:DNSDomain[xxxx.
xxx.
xxx]:PrimaryDNSServer[xxx.
xxx.
xxx.
xx]:SecondaryDNSServer[xxx.
xxx.
xx.
x]:Connectiontype(ssh,telnet,none)[ssh]:RebootingtheSCisrequiredforchangesintheabovenetworksettingstotakeeffect.
lom>第2章启动和设置SunFire入门级中型系统19安装和引导Solaris操作系统要使用LOM命令,就必须从SolarisSupplemental光盘中安装LightsOutManagement2.
0软件包(SUNWlomu、SUNWlomr和SUNWlomm).
安装和引导Solaris操作系统1.
进入LOM提示符下.
有关如何进入LOM提示符下的详细信息,请参见第3章.
2.
要打开系统电源,请键入poweron.
根据OpenBootPROMauto-boot参数的设置,系统将尝试引导Solaris操作系统或继续处于OpenBootPROMok提示符下.
默认设置为true,此时,系统会尝试引导至Solaris操作系统.
如果auto-boot的设置为false或没有安装可引导的Solaris映像,则您会看到OpenBootPROMok提示符.
3.
安装Solaris操作系统(如有必要).
请参见Solaris操作系统版本附带的安装文档.
在ok提示符下键入OpenBootPROMboot命令以引导Solaris操作系统:有关其他可选的设备参数,请参见可用于显示预定义别名的OpenBootPROMdevalias命令.
引导Solaris操作系统之后,会显示login:提示符.
lom>poweron.
.
.
.
.
.
okokboot[device]login:20SunFire入门级中型系统管理指南2006年4月安装LightsOutManagement软件包SolarisSupplementaryCD中提供了SunFire入门级中型系统所需的三个LOM软件包.
SUNWlomu(LOMlite实用程序(usr))SUNWlomm(LOMlite手册页)SUNWlomr(LOM驱动程序)注–您可从SunSolve获得这些软件包的最新修补程序.
Sun强烈建议您从SunSolve获取最新版本的修补程序并将其安装在SunFireE2900和SunFireV1280/Netra1280/Netra1290上,以便使用最新的LOM实用程序.
安装LOM驱动程序以超级用户身份键入:代码示例2-3安装LOM驱动程序#pkgadd-d.
SUNWlomrProcessingpackageinstancefromLOMlitedriver(root)(sparc)2.
0,REV=2000.
08.
22.
14.
14Copyright2000SunMicrosystems,Inc.
Allrightsreserved.
##Executingcheckinstallscript.
Usingasthepackagebasedirectory.
##Processingpackageinformation.
##Processingsysteminformation.
9packagepathnamesarealreadyproperlyinstalled.
##Verifyingpackagedependencies.
##Verifyingdiskspacerequirements.
##Checkingforconflictswithpackagesalreadyinstalled.
##Checkingforsetuid/setgidprograms.
Thispackagecontainsscriptswhichwillbeexecutedwithsuper-userpermissionduringtheprocessofinstallingthispackage.
Doyouwanttocontinuewiththeinstallationof[y,n,]yInstallingLOMlitedriver(root)as##Installingpart1of1.
20blocksi.
drivers(INFO):Starting第2章启动和设置SunFire入门级中型系统21i.
drivers(INFO):Installing/var/tmp/SUNWlomr/reloc/platform/sun4u/kernel/drv/lomi.
drivers(INFO):Installing/var/tmp/SUNWlomr/reloc/platform/sun4u/kernel/drv/lompi.
drivers(INFO):Installing/var/tmp/SUNWlomr/reloc/platform/sun4u/kernel/drv/sparcv9/lomi.
drivers(INFO):Installing/var/tmp/SUNWlomr/reloc/platform/sun4u/kernel/drv/sparcv9/lompi.
drivers(INFO):Installing/var/tmp/SUNWlomr/reloc/platform/sun4u/kernel/drv/sparcv9/lomvi.
drivers(INFO):Identifieddrivers'lomlomplomv'i.
drivers(INFO):Cleaningupolddriver'lom'.
.
.
Cleaningupolddevlinkentry'type=ddi_pseudo;name=SUNW,lomlom'i.
drivers(INFO):Cleaningupolddriver'lomp'.
.
.
Cleaningupolddevlinkentry'type=ddi_pseudo;name=lomplomp'i.
drivers(INFO):Cleaningupolddriver'lomv'.
.
.
Cleaningupolddevlinkentry'type=ddi_pseudo;name=SUNW,lomv\M0type=ddi_pseudo;name=lomv\M0'i.
drivers(INFO):Cleaningupolddriver'lomh'.
.
.
Cleaningupolddevlinkentry'type=ddi_pseudo;name=SUNW,lomhlom'i.
drivers(INFO):Addingdriver'lomp'.
.
.
driver='lomp'aliases=''link='lomp'spec='lomp'Addingdevlinkentry'type=ddi_pseudo;name=lomplomp'addingdriverwithaliases''perm'*0644rootsys'devfsadm:driverfailedtoattach:lompWarning:Driver(lomp)successfullyaddedtosystembutfailedtoattachi.
drivers(INFO):Addingdriver'lomv'.
.
.
driver='lomv'aliases='SUNW,lomv'link='SUNW,lomvlomv'spec='\M0'Addingdevlinkentry'type=ddi_pseudo;name=SUNW,lomv\M0'Addingdevlinkentry'type=ddi_pseudo;name=lomv\M0'addingdriverwithaliases'SUNW,lomv'perm'*0644rootsys'devfsadm:driverfailedtoattach:lomvWarning:Driver(lomv)successfullyaddedtosystembutfailedtoattachi.
drivers(INFO):Addingdriver'lom'.
.
.
driver='lom'aliases='SUNW,lomhSUNW,lom'link='SUNW,lomhSUNW,lom'spec='lom'Addingdevlinkentry'type=ddi_pseudo;name=SUNW,lomhlom'Addingdevlinkentry'type=ddi_pseudo;name=SUNW,lomlom'addingdriverwithaliases'SUNW,lomhSUNW,lom'perm'*0644rootsys'devfsadm:driverfailedtoattach:lom代码示例2-3安装LOM驱动程序(续)22SunFire入门级中型系统管理指南2006年4月注–由于SunFire入门级中型系统上未使用SUWNlomr软件包,因此在安装SUNWlomr软件包期间,可以忽略与lomp、lomv和lom驱动程序相关的警告消息.
不过,用户必须安装此软件包,以后才能使用修补程序进行升级.
安装LOM实用程序以超级用户身份键入:Warning:Driver(lom)successfullyaddedtosystembutfailedtoattachi.
drivers(SUCCESS):Finished[verifyingclass]Installationofwassuccessful.
#代码示例2-4安装LOM实用程序#pkgadd-d.
SUNWlomuProcessingpackageinstancefromLOMliteUtilities(usr)(sparc)2.
0,REV=2000.
08.
22.
14.
14Copyright2000SunMicrosystems,Inc.
Allrightsreserved.
Usingasthepackagebasedirectory.
##Processingpackageinformation.
##Processingsysteminformation.
4packagepathnamesarealreadyproperlyinstalled.
##Verifyingpackagedependencies.
##Verifyingdiskspacerequirements.
##Checkingforconflictswithpackagesalreadyinstalled.
##Checkingforsetuid/setgidprograms.
InstallingLOMliteUtilities(usr)as##Installingpart1of1.
1432blocksInstallationofwassuccessful.
#代码示例2-3安装LOM驱动程序(续)第2章启动和设置SunFire入门级中型系统23安装LOM手册页以超级用户身份键入:代码示例2-5安装LOM手册页#pkgadd-d.
SUNWlommProcessingpackageinstancefromLOMlitemanualpages(sparc)2.
0,REV=2000.
08.
22.
14.
14Copyright2000SunMicrosystems,Inc.
Allrightsreserved.
Usingasthepackagebasedirectory.
##Processingpackageinformation.
##Processingsysteminformation.
5packagepathnamesarealreadyproperlyinstalled.
##Verifyingdiskspacerequirements.
##Checkingforconflictswithpackagesalreadyinstalled.
##Checkingforsetuid/setgidprograms.
InstallingLOMlitemanualpagesas##Installingpart1of1.
71blocksInstallationofwassuccessful.
24SunFire入门级中型系统管理指南2006年4月重置系统在系统挂起或硬件出现故障时,可用reset命令来重置本系统.
如果正在运行Solaris操作系统,系统会提示您确认此操作.
强制重置系统键入:默认情况下,重置程序将会使用XIR(外部启动重置)方式来重置系统中的CPU处理器.
外部启动重置程序会强制引导处理器进入OpenBootPROM,并启动OpenBootPROM错误重置恢复操作.
错误重置恢复操作将保留大部分的Solaris状态,以收集调试硬件和软件所需的数据,包括Solaris操作系统核心文件.
保存调试信息后,如果OpenBootPROM变量auto-boot的值为true,系统将引导Solaris操作系统.
通过设置OpenBootPROMerror-reset-recovery配置变量,可以控制OpenBootPROM错误重置恢复操作.
在待机模式下无法使用reset命令.
如果使用,则系统会显示消息resetnotallowed,domainAkeyswitchissettooff.
注–如果系统仍处于挂起状态(即您无法登录到Solaris操作系统),请键入break命令强制系统返回到OpenBootPROMok提示符下.
如果第一次键入reset命令不起作用,下次您必须键入reset-a以进行全面重置.
reset-a命令相当于OpenBootPROM下的reset-all命令.
lom>resetThiswillabruptlyterminateSolaris.
Doyouwanttocontinue[no]yNOTICE:XIRonCPU3第2章启动和设置SunFire入门级中型系统25重置系统控制器可用resetsc命令来重置系统控制器(SC).
当SC应用程序因硬件或软件问题而出现故障时,您可用此命令来重置SC.
此命令将重置SC,执行通过setupsc命令指定的SCPOST级别,并重新启动LOM软件.
lom>resetscAreyousureyouwanttorebootthesystemcontrollernow[no]y26SunFire入门级中型系统管理指南2006年4月27第3章切换过程本章逐步介绍连接系统以及在LOMshell和控制台之间进行切换的过程(附有图解).
此外,本章还介绍了如何终止系统控制器(SC)会话.
本章包括下列主题:第28页的"建立LOM控制台连接"第29页的"连接到ASCII终端"第30页的"连接到网络终端服务器"第31页的"连接到工作站的串行端口B"第32页的"使用远程连接访问LOM控制台"第34页的"在不同控制台之间切换"第36页的"切换到LOM提示符"第36页的"从LOM提示符切换到Solaris控制台"第37页的"从OpenBootPROM切换到LOM提示符"第37页的"在Solaris正在运行时切换到OpenBoot提示符"第37页的"在通过串行端口连接到系统控制器时终止会话"第38页的"在通过网络连接到系统控制器时终止会话"28SunFire入门级中型系统管理指南2006年4月建立LOM控制台连接可用两种方法访问LOM控制台连接.
通过SC串行端口(直接)连接.
通过Telnet(网络)连接(使用10/100以太网端口).
注意–从5.
17.
0版的固件起,缺省情况下会禁用网络连接.
除非您使用setupnetwork命令启用了网络连接,否则您必须使用串行(直接)连接来访问LOM控制台.
在正常运行(Solaris正在运行或系统处于OpenBootPROM提示符下)时,连接到LOM控制台将使系统自动选择一个到Solaris控制台的连接.
如果系统不能连接到Solaris控制台,则会选择到LOM提示符的连接.
LOM提示符为:使用串行端口访问LOM控制台通过串行端口,您可以连接到以下三种类型的设备.
ASCII终端网络终端服务器工作站有关如何进行物理连接的详细信息,请参见《SunFireV1280SitePreparationandInstallationGuide》.
连接这些设备的过程各不相同,如下所述.
lom>第3章切换过程29连接到ASCII终端如果已设置LOM密码(且原来的连接已退出),则系统将提示您输入密码.
1.
正确输入以前使用password命令所设置的密码.
如果密码被接受,SC会表明连接已完成.
如果系统处于待机模式,则会自动显示lom提示符.
2.
否则,请按回车键,系统会显示Solaris控制台提示符.
3.
如果已通过网络端口建立了到LOM控制台的连接,则您可强行退出其他连接以实现连接目的:否则,请按回车键,系统会显示Solaris控制台提示符.
EnterPassword:Connected.
lom>Connected.
#EnterPassword:Theconsoleisalreadyinuse.
Host:somehost.
acme.
comConnected:May2410:27Idletime:00:23:17Forcelogoutofotheruser(y/n)yConnected.
lom>Connected.
#30SunFire入门级中型系统管理指南2006年4月连接到网络终端服务器系统会提供您可连接的各个服务器的菜单.
选择所需的服务器.
如果已设置LOM密码(且原来的连接已退出),系统会提示您输入密码.
1.
正确输入以前使用password命令所设置的密码.
如果密码被接受,SC会表明连接已完成.
如果系统处于待机模式,则会自动显示lom提示符.
2.
否则,请按回车键,系统会显示Solaris控制台提示符.
3.
如果已通过网络端口建立了到LOM控制台的连接,则您可强行退出其他连接以实现连接目的:EnterPassword:Connected.
lom>Connected.
#EnterPassword:Theconsoleisalreadyinuse.
Host:somehost.
acme.
comConnected:May2410:27Idletime:00:23:17Forcelogoutofotheruser(y/n)yConnected.
lom>第3章切换过程314.
否则,请按回车键,系统会显示Solaris控制台提示符.
连接到工作站的串行端口B1.
在Solarisshell提示符下键入:有关tip命令的完整说明,请参见tip手册页.
如果已设置LOM密码(且原来的连接已退出),系统会提示您输入密码.
2.
正确输入以前使用password命令所设置的密码.
如果密码被接受,SC会表明连接已完成.
如果系统处于待机模式,则会自动显示lom提示符.
否则,请按回车键,系统会显示Solaris控制台提示符.
Connected.
##tiphardwireEnterPassword:Connected.
lom>Connected.
#32SunFire入门级中型系统管理指南2006年4月3.
如果已通过网络端口建立了到LOM控制台的连接,则您可强行退出其他连接以实现连接目的:使用远程连接访问LOM控制台要通过连接至10/100以太网端口的远程连接(例如:SSH连接)访问LOM控制台,您必须首先配置该接口.
请参阅第17页的"配置网络参数".
1.
在Solaris提示符下键入ssh命令以连接到SC.
2.
如果已设置LOM密码,系统会提示您输入密码.
3.
正确输入以前使用password命令所设置的密码.
如果密码被接受,SC会表明连接已完成.
如果系统处于待机模式,则会自动显示lom提示符.
EnterPassword:Theconsoleisalreadyinuse.
Host:somehost.
acme.
comConnected:May2410:27Idletime:00:23:17Forcelogoutofotheruser(y/n)yConnected.
lom>%sshhostname#Enterpassword:Connected.
lom>第3章切换过程334.
否则,请按回车键,系统会显示Solaris控制台提示符.
5.
如果已通过串行端口建立了到LOM控制台的连接,则您可强行退出其他连接以实现连接目的:此情况下,您应首先在串行连接上运行LOMlogout命令,以使该连接可用.
有关详细信息,请参阅《SunFireEntry-LevelMidrangeSystemControllerCommandReferenceManual》.
断开LOM控制台连接使用LOM控制台后,您可以使用logout命令断开连接.
通过串行端口连接时,系统会作出以下回应:通过网络连接时,系统会作出以下回应:Connected.
##sshhostnameTheconsoleisalreadyinuse.
Host:somehost.
acme.
comConnected:May2410:27Idletime:00:23:17Forcelogoutofotheruser(y/n)yConnected.
lom>lom>logoutConnectionclosed.
lom>logoutConnectionclosed.
Connectiontohostnameclosedbyremotehost.
Connectiontohostnameclosed.
Connectionclosed.
$34SunFire入门级中型系统管理指南2006年4月在不同控制台之间切换通过SC控制台连接,用户可访问SCLOM命令行界面、Solaris操作系统和OpenBootPROM.
本节介绍如何在以下控制台之间进行切换:LOM提示符.
SolarisOS.
OpenBootPROM.
图3-1汇总了这些切换过程.
第3章切换过程35图3-1控制台间的切换过程Solaris操作系统OpenBootPROMLOMshell#oklom>键入转义序列键入转义序列键入:lom>console键入:lom>break36SunFire入门级中型系统管理指南2006年4月切换到LOM提示符连接到Solaris控制台时,键入转义序列可从该控制台切换到LOM提示符.
缺省情况下,转义序列设置为'#.
'.
即#符号后面加一个英文句号.
例如,如果转义序列为缺省的#.
,您将看到:当您键入转义序列的第一个字符时,这个字符在一秒钟后才会显示在屏幕上.
这是因为系统在等待下一个键入的字符是否是转义序列中的下一个字符.
第二个字符必须在这一秒内键入.
键入所有转义序列字符后,系统将显示lom>提示符.
如果下一个键入的字符不是转义序列的下一个字符,屏幕将显示已键入的转义序列字符.
在选择转义序列时,不要以那些经常在控制台上键入的字符开头,否则,您所敲击的字符键与显示在屏幕上的字符可能会出现延迟,并且可能会造成混乱.
从LOM提示符切换到Solaris控制台在LOM提示符下键入console命令,然后按回车键.
如果Solaris软件正在运行,则系统会显示Solaris提示符:如果系统先前处于OpenBootPROM提示符下,则会显示OpenBootPROM提示符:如果系统处于待机模式,则会生成以下消息:lom>lom>console#lom>console{2}oklom>consoleSolarisisnotactive第3章切换过程37从OpenBootPROM切换到LOM提示符从OpenBootPROM切换到LOM提示符的过程与从Solaris操作系统切换到LOM提示符的过程相同.
键入转义序列字符(缺省为#.
).
在Solaris正在运行时切换到OpenBoot提示符在Solaris操作系统正在运行时,向控制台发送中断信号常见的效果是强制系统进入OpenBootPROM或内核调试程序.
在LOM提示符下键入break命令可以实现此目的:在通过串行端口连接到系统控制器时终止会话如果您现处于Solaris提示符或OpenBootPROM下,请键入转义序列以转至LOM提示符,然后键入logout并按回车键以终止LOM提示符会话:如果您通过终端服务器连接到系统控制器,请调用终端服务器命令以断开连接.
如果该连接是通过tip命令建立的,请键入tip退出序列~.
(波浪号和句点):{2}oklom>lom>breakThiswillsuspendSolaris.
Doyouwanttocontinue[no]yType'go'toresumedebuggerentered.
{1}oklom>logout~.
38SunFire入门级中型系统管理指南2006年4月在通过网络连接到系统控制器时终止会话如果您处于Solaris提示符或OpenBootPROM下,请键入lom转义序列转至LOM提示符下,然后键入logout命令以终止LOM提示符会话.
远程会话(SSH或Telnet,取决于使用setupnetwork命令所选的设置)会自动终止:lom>logoutConnectionclosedbyforeignhost.
%39第4章系统控制器消息日志对于各种系统事件,如打开电源、引导系统、关闭电源、更改可热插拔的装置、环境警告等,SC可以生成具有时戳的消息.
最初,消息存储在SC板内存的缓冲区内,此缓冲器可循环存储128条消息(注意一条消息可跨越多行).
此外,SC还会在运行Solaris软件时将这些消息发送给Solaris主机,并由系统日志守护进程(syslogd)处理.
Solaris软件正在运行时,SC会在生成消息的同时将它们发送出去.
引导Solaris操作系统或重置SC时,系统会检索尚未从SC中复制的消息.
另外,也可以使用lom(1m)实用程序在Solaris提示符处显示消息(请参阅第5章).
一般情况下,这些消息存储在Solaris主机的/var/adm/messages文件中,唯一的限制因素是可用的磁盘空间.
存储在SC消息缓冲区内的消息很容易丢失.
如果发生以下情况,消息将会丢失:两个电源同时断电而导致关闭SC的电源可运行的电源少于两个拆除IB_SSC重置SC重新引导Solaris操作系统时,存储在系统磁盘上的消息仍可使用.
在lom>提示符下,用户可用seteventreporting命令来控制在共享Solaris/SC控制台端口上的消息显示(请参阅《SunFireEntry-LevelMidrangeSystemControllerCommandReferenceManual》).
该命令确定系统控制器在生成消息时是否立即在lom>提示符下打印消息,以及是否将消息传送给Solaris日志系统,以便将其写入/var/adm/messages文件.
40SunFire入门级中型系统管理指南2006年4月注–在装有增强内存SC(也称SCV2)的系统中,可另外使用112KB的SC内存区域来存储固件消息.
此内存是非易失性的;当关闭SC的电源时,其存储的消息不会丢失.
原来的LOM历史记录缓冲区是动态的,在电源关闭时会丢失信息.
在lom>提示符下使用showlogs-p命令或showerrorbuffer-p命令可显示在SCV2持久性历史记录日志中存储的消息.
有关说明,请参阅《SunFireEntry-LevelMidrangeSystemControllerCommandReferenceManual》中的相应章节.
图4-1显示了这两种消息缓冲区.
图4-1系统控制器日志主系统硬件主CPUSolaris消息删除启动并运行系统时可访问磁盘中的/var/adm/messages文件系统控制器LOM写入消息LOM端口无论系统处于打开或待机模式(即系统控制器未停止运行或未断电),均可使用LOM命令访问历史记录日志.
删除持久性LOM历史记录日志(112KB).
仅在具有5.
17.
0固件的SCV2上可用.
循环缓冲区(可存储128条消息)中的LOM历史记录日志最后输入的消息可供使用(先进先出)41第5章从SolarisOS中使用LightsOutManagement和系统控制器本章介绍如何在Solaris中通过可用的LightsOutManagement(LOM)特定命令来监视和管理SunFire入门级中型系统.
要使用这些命令,您必须从SolarisSupplemental光盘中安装LightsOutManagement2.
0软件包(SUNWlomr、SUNWlomu和SUNWlomm).
有关如何安装LOM软件包的说明,请参见第20页的"安装LightsOutManagement软件包".
注–可以从SunSolve的修补程序110208中获得这些软件包的最新修补程序.
Sun强烈建议您从SunSolve获取最新版本的修补程序110208,并将其安装在SunFire入门级中型系统上,从而使用最新的LOM实用程序更新.
本章包括下列主题:第42页的"在Solaris操作系统中监视系统"第50页的"在Solaris中执行的其他LOM任务"42SunFire入门级中型系统管理指南2006年4月LOM命令语法lom[-c][-l][-f][-v][-t][-a][-G][-X]lom-e,[x]lom-Aon|offlom-Eon|off其中:-c显示LOM配置.
-l显示故障LED指示灯和报警LED指示灯的状态.
-e显示事件日志.
-f显示风扇状态.
另外,此信息还显示在Solarisprtdiag-v命令的输出中.
-v显示电压传感器的状态.
另外,此信息还显示在Solarisprtdiag-v命令的输出中.
-t显示温度信息.
另外,此信息还显示在Solarisprtdiag-v命令的输出中.
-a显示所有组件的状态数据.
-A打开和关闭报警.
-X更改转义序列.
-E打开或关闭控制台事件日志.
-G升级固件.
在Solaris操作系统中监视系统可用两种方法查询LOM设备(SC)或向其发送要执行的命令:在lom>shell提示符下执行LOM命令(请参见第3章).
在UNIX#提示符下执行LOM特定的Solaris命令,如本章所述.
本节介绍的Solaris命令均可通过在UNIX#提示符下运行/usr/sbin/lom实用程序来获得.
本节在介绍这些命令行时还根据需要附带了它们的典型输出.
第5章从SolarisOS中使用LightsOutManagement和系统控制器43查看联机LOM文档要查看LOM实用程序的手册页,请键入:查看LOM配置(lom-c)要查看LOM的当前配置,请键入:检查故障LED指示灯和报警LED指示灯的状态(lom-l)要检查是否已打开(或关闭)系统故障LED指示灯和报警LED指示灯,请键入:报警1和报警2是软件标志.
它们与特定的条件无关,您可通过自己的进程或通过命令行来进行设置(请参见第50页的"打开和关闭报警(lom-A)").
有关报警3(系统报警)及其与监视器定时器关系的信息,请参见第145页的"对报警3进行编程".
#manlom代码示例5-1lom-c命令的输出范例#lom-cLOMconfigurationsettings:serialescapesequence=#.
serialeventreporting=defaultEventreportinglevel=fatal,warning&informationfirmwareversion=5.
17.
0,build5.
0productID=NetraT12代码示例5-2lom-l命令的输出范例#lom-lLOMalarmstates:Alarm1=offAlarm2=offAlarm3=onFaultLED=off#44SunFire入门级中型系统管理指南2006年4月查看事件日志(lom-e)要查看事件日志,请键入:其中,n是您要查看的报告数(最多128条),x则指定您感兴趣的报告级别.
共有四种事件级别:1.
致命事件2.
警告事件3.
信息事件4.
用户事件(不适用于SunFire入门级中型系统)如果您指定一个级别,将会看到该级别以及该级别以上的事件报告.
例如,如果指定级别2,将会看到级别2和级别1的事件报告.
如果指定级别3,将会看到级别3、级别2和级别1的事件报告.
如果未指定级别,将会看到级别3、级别2和级别1的事件报告.
代码示例5-3显示了事件日志的范例.
#lom-en,[x]代码示例5-3LOM事件日志的范例(先报告最早的事件)#lom-e11LOMliteEventLog:FriJul1915:16:00commando-sclom:Boot:ScApp5.
13.
0007,RTOS23FriJul1915:16:06commando-sclom:CachingIDinformationFriJul1915:16:08commando-sclom:ClockSource:75MHzFriJul1915:16:10commando-sclom:/N0/PS0:StatusisOKFriJul1915:16:11commando-sclom:/N0/PS1:StatusisOKFriJul1915:16:11commando-sclom:Chassisisinsinglepartitionmode.
FriJul1915:27:29commando-sclom:LocatorOFFFriJul1915:27:46commando-sclom:Alarm1ONFriJul1915:27:52commando-sclom:Alarm2ONFriJul1915:28:03commando-sclom:Alarm1OFFFriJul1915:28:08commando-sclom:Alarm2OFF第5章从SolarisOS中使用LightsOutManagement和系统控制器45检查风扇(lom-f)要检查风扇的状态,请键入:如果需要更换风扇,请与Sun当地的销售代表联系,并提供所需组件的部件号码.
有关信息,请参见《SunFireV1280/Netra1280ServiceManual》.
另外,此命令的信息输出也包含在Solarisprtdiag-v命令的输出中.
检查内部电压传感器(lom-v)-v选项可以显示SunFire入门级中型系统内部电压传感器的状态.
要检查各条供电干线和内部电压传感器的状态,请键入:代码示例5-4lom-f命令的输出范例#lom-fFans:1OKspeedself-regulating2OKspeedself-regulating3OKspeedself-regulating4OKspeedself-regulating5OKspeedself-regulating6OKspeedself-regulating7OKspeedself-regulating8OKspeedself-regulating9OKspeed100%10OKspeed100%#代码示例5-5lom-v命令的输出范例#lom-vSupplyvoltages:1SSC1v_1.
5vdc0status=ok2SSC1v_3.
3vdc0status=ok3SSC1v_5vdc0status=ok4RP0v_1.
5vdc0status=ok5RP0v_3.
3vdc0status=ok6RP2v_1.
5vdc0status=ok7RP2v_3.
3vdc0status=ok8SB0v_1.
5vdc0status=ok9SB0v_3.
3vdc0status=ok10SB0/P0v_cheetah0status=ok11SB0/P1v_cheetah1status=ok46SunFire入门级中型系统管理指南2006年4月12SB0/P2v_cheetah2status=ok13SB0/P3v_cheetah3status=ok14SB2v_1.
5vdc0status=ok15SB2v_3.
3vdc0status=ok16SB2/P0v_cheetah0status=ok17SB2/P1v_cheetah1status=ok18SB2/P2v_cheetah2status=ok19SB2/P3v_cheetah3status=ok20IB6v_1.
5vdc0status=ok21IB6v_3.
3vdc0status=ok22IB6v_5vdc0status=ok23IB6v_12vdc0status=ok24IB6v_3.
3vdc1status=ok25IB6v_3.
3vdc2status=ok26IB6v_1.
8vdc0status=ok27IB6v_2.
4vdc0status=okSystemstatusflags:1PS0status=okay2PS1status=okay3FT0status=okay4FT0/FAN0status=okay5FT0/FAN1status=okay6FT0/FAN2status=okay7FT0/FAN3status=okay8FT0/FAN4status=okay9FT0/FAN5status=okay10FT0/FAN6status=okay11FT0/FAN7status=okay12RP0status=okay13RP2status=okay14SB0status=ok15SB0/P0status=online16SB0/P0/B0/D0status=okay17SB0/P0/B0/D1status=okay18SB0/P0/B0/D2status=okay19SB0/P0/B0/D3status=okay20SB0/P1status=online21SB0/P1/B0/D0status=okay22SB0/P1/B0/D1status=okay23SB0/P1/B0/D2status=okay24SB0/P1/B0/D3status=okay25SB0/P2status=online26SB0/P2/B0/D0status=okay27SB0/P2/B0/D1status=okay28SB0/P2/B0/D2status=okay29SB0/P2/B0/D3status=okay30SB0/P3status=online代码示例5-5lom-v命令的输出范例(续)第5章从SolarisOS中使用LightsOutManagement和系统控制器47另外,此命令的信息输出也包含在Solarisprtdiag-v命令的输出中.
31SB0/P3/B0/D0status=okay32SB0/P3/B0/D1status=okay33SB0/P3/B0/D2status=okay34SB0/P3/B0/D3status=okay35SB2status=ok36SB2/P0status=online37SB2/P0/B0/D0status=okay38SB2/P0/B0/D1status=okay39SB2/P0/B0/D2status=okay40SB2/P0/B0/D3status=okay41SB2/P1status=online42SB2/P1/B0/D0status=okay43SB2/P1/B0/D1status=okay44SB2/P1/B0/D2status=okay45SB2/P1/B0/D3status=okay46SB2/P2status=online47SB2/P2/B0/D0status=okay48SB2/P2/B0/D1status=okay49SB2/P2/B0/D2status=okay50SB2/P2/B0/D3status=okay51SB2/P3status=online52SB2/P3/B0/D0status=okay53SB2/P3/B0/D1status=okay54SB2/P3/B0/D2status=okay55SB2/P3/B0/D3status=okay56IB6status=ok57IB6/FAN0status=okay58IB6/FAN1status=okay#代码示例5-5lom-v命令的输出范例(续)48SunFire入门级中型系统管理指南2006年4月检查内部温度(lom-t)要检查系统内部温度以及系统警告和关闭的临界温度,请键入:代码示例5-6lom-t命令的输出范例#lom-tSystemTemperatureSensors:1SSC1t_sbbc036degC:warning102degC:shutdown107degC2SSC1t_cbh045degC:warning102degC:shutdown107degC3SSC1t_ambient023degC:warning82degC:shutdown87degC4SSC1t_ambient121degC:warning82degC:shutdown87degC5SSC1t_ambient228degC:warning82degC:shutdown87degC6RP0t_ambient022degC:warning82degC:shutdown87degC7RP0t_ambient122degC:warning53degC:shutdown63degC8RP0t_sdc062degC:warning102degC:shutdown107degC9RP0t_ar047degC:warning102degC:shutdown107degC10RP0t_dx062degC:warning102degC:shutdown107degC11RP0t_dx165degC:warning102degC:shutdown107degC12RP2t_ambient023degC:warning82degC:shutdown87degC13RP2t_ambient122degC:warning53degC:shutdown63degC14RP2t_sdc057degC:warning102degC:shutdown107degC15RP2t_ar042degC:warning102degC:shutdown107degC16RP2t_dx053degC:warning102degC:shutdown107degC17RP2t_dx156degC:warning102degC:shutdown107degC18SB0t_sdc048degC:warning102degC:shutdown107degC19SB0t_ar039degC:warning102degC:shutdown107degC20SB0t_dx049degC:warning102degC:shutdown107degC21SB0t_dx154degC:warning102degC:shutdown107degC22SB0t_dx257degC:warning102degC:shutdown107degC23SB0t_dx353degC:warning102degC:shutdown107degC24SB0t_sbbc053degC:warning102degC:shutdown107degC25SB0t_sbbc140degC:warning102degC:shutdown107degC26SB0/P0Ambient29degC:warning82degC:shutdown87degC27SB0/P0Die57degC:warning92degC:shutdown97degC28SB0/P1Ambient27degC:warning82degC:shutdown87degC29SB0/P1Die51degC:warning92degC:shutdown97degC30SB0/P2Ambient27degC:warning82degC:shutdown87degC31SB0/P2Die53degC:warning92degC:shutdown97degC32SB0/P3Ambient29degC:warning82degC:shutdown87degC33SB0/P3Die50degC:warning92degC:shutdown97degC34SB2t_sdc051degC:warning102degC:shutdown107degC35SB2t_ar040degC:warning102degC:shutdown107degC36SB2t_dx052degC:warning102degC:shutdown107degC37SB2t_dx154degC:warning102degC:shutdown107degC38SB2t_dx261degC:warning102degC:shutdown107degC39SB2t_dx353degC:warning102degC:shutdown107degC40SB2t_sbbc052degC:warning102degC:shutdown107degC第5章从SolarisOS中使用LightsOutManagement和系统控制器49另外,此命令的信息输出也包含在Solarisprtdiag-v命令的输出中.
查看所有组件的状态数据和LOM的配置数据(lom-a)要查看所有LOM的状态和配置数据,请键入:41SB2t_sbbc142degC:warning102degC:shutdown107degC42SB2/P0Ambient27degC:warning82degC:shutdown87degC43SB2/P0Die54degC:warning92degC:shutdown97degC44SB2/P1Ambient26degC:warning82degC:shutdown87degC45SB2/P1Die53degC:warning92degC:shutdown97degC46SB2/P2Ambient27degC:warning82degC:shutdown87degC47SB2/P2Die51degC:warning92degC:shutdown97degC48SB2/P3Ambient27degC:warning82degC:shutdown87degC49SB2/P3Die51degC:warning92degC:shutdown97degC50IB6t_ambient029degC:warning82degC:shutdown87degC51IB6t_ambient129degC:warning82degC:shutdown87degC52IB6t_sdc068degC:warning102degC:shutdown107degC53IB6t_ar077degC:warning102degC:shutdown107degC54IB6t_dx076degC:warning102degC:shutdown107degC55IB6t_dx178degC:warning102degC:shutdown107degC56IB6t_sbbc051degC:warning102degC:shutdown107degC57IB6t_schizo048degC:warning102degC:shutdown107degC58IB6t_schizo153degC:warning102degC:shutdown107degC#lom-a代码示例5-6lom-t命令的输出范例(续)50SunFire入门级中型系统管理指南2006年4月在Solaris中执行的其他LOM任务本节介绍如何:打开和关闭报警指示灯更改LOM转义序列停止LOM向控制台发送报告升级固件打开和关闭报警(lom-A)与LOM关联的报警有两个.
它们与特定条件无关,只是软件标记,您可按自己的方式或通过命令行进行设置.
1.
要通过命令行打开报警,请键入:其中,n是您想设置的报警的编号:1或2.
2.
要关闭报警,请键入:其中,n是您想关闭的报警的编号:1或2.
更改lom>提示符的转义序列(lom-X)字符序列#.
(井号,句点)可以使您从Solaris操作系统切换到lom>提示符下.
要更改缺省的转义序列,请键入:其中,xy是您想使用的字母数字字符.
#lom-Aon,n#lom-Aoff,n#lom-Xxy第5章从SolarisOS中使用LightsOutManagement和系统控制器51注–对于需要通过Shell编译的特殊字符,可能需要加上引号.
如果您在控制台键入转义序列的第一个字符,这个字符在一秒钟后才会显示在屏幕上.
这是因为系统在等待下一个键入的字符是否是转义序列中的下一个字符.
键入所有转义序列字符后,系统将显示lom>提示符.
如果下一个键入的字符不是转义序列的下一个字符,屏幕将显示已键入的转义序列字符.
在LOM提示符下停止LOM向控制台发送报告(lom-Eoff)LOM事件报告可能会对您试图于控制台上发送或接收的信息造成干扰.
要在LOM提示符下停止LOM消息的显示,请关闭连续事件报告.
这相当于《SunFireEntry-LevelMidrangeSystemControllerCommandReferenceManual》中介绍的seteventreporting命令.
1.
要停止LOM向控制台发送报告,请键入:2.
要打开连续事件报告,请键入:升级固件(lom-G文件名)有关详细信息,请参见第11章.
#lom-Eoff#lom-Eon52SunFire入门级中型系统管理指南2006年4月53第6章运行POST每个系统板(CPU/内存板和IB_SSC部件)均装有闪存PROM.
此PROM用于为通电自测(POST)诊断程序提供存储空间.
POST诊断程序可测试以下各项:CPU芯片外部高速缓存内存总线互连I/OASICI/O总线POST提供了多个诊断级别,您可以通过OpenBootPROM变量diag-level来选择这些级别.
另外,使用bootmode命令可以声明系统下次重新引导时所用的POST设置.
系统安装了专用于诊断SC的POST,它可以通过setupsc命令来进行控制.
本章包括下列主题:第54页的"用于配置POST的OpenBootPROM变量"第57页的"使用bootmode命令控制POST"第58页的"控制系统控制器POST"54SunFire入门级中型系统管理指南2006年4月用于配置POST的OpenBootPROM变量可以使用OpenBootPROM来设置用于配置POST运行方式的变量.
《OpenBoot4.
xCommandReferenceManual》中介绍了这些变量.
您可以使用OpenBootprintenv命令来显示当前设置:可以使用OpenBootPROMsetenv命令更改变量的当前设置:例如,您可以使用以下命令配置POST,使其以最快的速度运行:这和在LOM提示符处使用SC命令bootmodeskipdiag有相同的效果.
区别在于OpenBoot命令将持久性地保留这些设置,直到您再次作出更改.
{3}okprintenvdiag-leveldiag-levelinit(init){1}oksetenvdiag-levelquickdiag-level=quick{1}oksetenvdiag-levelinitdiag-level=init{1}oksetenvverbosity-leveloffverbosity-level=off表6-1POST配置参数参数值说明diag-levelinit(缺省值)只运行系统板初始化代码.
不进行任何测试.
这种方式将快速通过POST.
quick使用少数测试模式对所有系统板组件进行少量的测试.
min所有系统板组件的核心功能都会得到测试.
该测试对接受测试的设备进行快速状态检查.
max除内存模块和Ecache模块之外,将对所有系统板组件进行完整的测试,且使用全部测试模式.
对于内存模块和Ecache模块,则对全部位置进行多项模式测试.
此级别不运行规模较大且耗时的算法.
第6章运行POST55mem1以缺省级别运行所有测试并运行更加详尽的DRAM和SRAM测试算法.
mem2与mem1大致相同,只不过多了一项可对DRAM数据操作进行显式比较的DRAM测试.
verbosity-leveloff不显示任何状态消息.
min(缺省值)显示测试名称状态消息和错误消息.
max显示子测试跟踪消息.
error-leveloff不显示错误消息.
min显示失败的测试名称.
max(缺省值)显示所有相关的错误状态.
interleave-scopewithin-board(缺省值)系统板上的内存组将进行交叉存储.
across-boards系统中所有系统板内存组上的内存都将进行交叉存储.
interleave-modeoptimal(缺省值)内存将进行不同大小的交叉存储,以达到最佳性能.
fixed内存将进行固定大小的交叉存储.
off不进行内存交叉存储.
reboot-on-errorfalse(缺省值)出错时暂停系统.
true出错时重新引导系统.
use-nvramrc此参数的作用与OpenBootPROM下的nvramrc参数相同.
此参数使用存储在nvramrc中的别名.
true如果将此参数设为true,则OpenBootPROM将执行存储在nvramrc中的脚本.
false(缺省值)如果将此参数设为false,则OpenBootPROM将不评估存储在nvramrc中的脚本.
auto-boot控制Solaris操作系统的引导.
true(缺省值)如果将此参数设为true,则在运行POST后系统将自动引导Solaris操作系统.
false如果将此参数设为false,则在运行POST后,系统会显示OpenBootPROMok提示符,您必须在此提示符下键入boot命令才能引导Solaris操作系统.
error-reset-recovery控制系统在发生外部启动重置(XIR)和红色模式陷阱之后的行为.
表6-1POST配置参数(续)参数值说明56SunFire入门级中型系统管理指南2006年4月POST的缺省输出类似于代码示例6-1.
sync(缺省值)OpenBootPROM调用sync.
此时会生成一个核心文件.
如果调用返回,则OpenBootPROM将执行重新引导.
noneOpenBootPROM会打印一条消息来说明该触发重置触发了错误重置操作,并将控制权传递给OpenBootPROMok提示符.
描述重置陷阱类型的消息因平台而异.
bootOpenBootPROM固件将重新引导该系统,但不生成核心文件.
系统可用diag-device或boot-device的OpenBootPROM设置来执行重新引导,具体取决于OpenBootPROM配置变量diag-switch的值.
如果diag-switch已设置为true,则系统将缺省使用diag-device参数中指定的设备来执行引导.
如果diag-switch已设置为false,则系统将缺省使用boot-device参数中指定的设备来执行引导.
代码示例6-1使用max设置时的POST输出TestingCPUBoards.
.
.
LoadingthetesttablefromboardSB0PROM0.
.
.
{/N0/SB0/P0}RunningCPUPORandSetClocks{/N0/SB0/P1}RunningCPUPORandSetClocks{/N0/SB0/P2}RunningCPUPORandSetClocks{/N0/SB0/P3}RunningCPUPORandSetClocks{/N0/SB0/P0}@(#)lpost5.
13.
00072002/07/1812:45{/N0/SB0/P2}@(#)lpost5.
13.
00072002/07/1812:45{/N0/SB0/P1}@(#)lpost5.
13.
00072002/07/1812:45{/N0/SB0/P0}Copyright2001SunMicrosystems,Inc.
Allrightsreserved.
{/N0/SB0/P0}Subtest:SettingFireplaneConfigRegisters{/N0/SB0/P0}Subtest:DisplayCPUVersion,frequency{/N0/SB0/P0}Versionregister=003e0015.
21000507{/N0/SB0/P0}Cpu/Systemratio=6,cpuactualfrequency=900{/N0/SB0/P1}Copyright2001SunMicrosystems,Inc.
Allrightsreserved.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
pcibootbus-controllerpciProbing/ssm@0,0/pci@18,700000Device1NothingthereProbing/ssm@0,0/pci@18,700000Device2NothingthereProbing/ssm@0,0/pci@18,700000Device3idediskcdromProbing/ssm@0,0/pci@18,600000Device1NothingthereProbing/ssm@0,0/pci@18,600000Device2scsidisktapescsidisktapepcipci表6-1POST配置参数(续)参数值说明第6章运行POST57使用bootmode命令控制POSTSCbootmode命令允许您专为系统下次重新引导时指定所用的引导配置.
这样就不必将系统切换到OpenBootPROM下作这些更改,例如更改diag-level变量.
例如,使用以下命令强迫系统在下次重新引导之前运行最高级别的POST测试:要强迫系统在下次重新引导之前运行最低级别的POST测试,请使用:如果系统未在发出bootmode命令之后的十分钟内重新引导,则bootmode设置将返回到normal状态,并应用先前设置的diag-level值和verbosity-level值.
有关这些命令的详细信息,请参阅《SunFireEntry-LevelMidrangeSystemControllerCommandReferenceManual》.
Probing/ssm@0,0/pci@19,700000Device1NothingthereProbing/ssm@0,0/pci@19,700000Device2NothingthereProbing/ssm@0,0/pci@19,700000Device3NothingthereProbing/ssm@0,0/pci@19,600000Device1networkProbing/ssm@0,0/pci@19,600000Device2networkSunFireV1280OpenFirmwareversion5.
13.
0007(07/18/0212:45)Copyright2001SunMicrosystems,Inc.
Allrightsreserved.
SmartFirmware,Copyright(C)1996-2001.
Allrightsreserved.
16384MBmemoryinstalled,Serial#9537054.
Ethernetaddress8:0:xx:xx:xx:xx,HostID:80xxxxxx.
NOTICE:obp_main:Extendeddiagnosticsarenowswitchedon.
{0}oklom>shutdownlom>bootmodediaglom>poweronlom>shutdownlom>bootmodeskipdiaglom>poweron代码示例6-1使用max设置时的POST输出(续)58SunFire入门级中型系统管理指南2006年4月控制系统控制器POSTSC的通电自测(POST)程序通过LOMsetupsc命令进行配置.
此命令可将SC的POST级别设为off、min或max.
有关此命令的详细信息,请参阅《SunFireEntry-LevelMidrangeSystemControllerCommandReferenceManual》.
SCPOST输出仅出现于SC串行连接.
将SCPOST诊断级别缺省值设为min:将SCPOSTdiag-level设置为min时,如果您重置SC,则串行端口上会产生以下输出:代码示例6-2将SCPOST诊断级别设为minlom>setupscSystemControllerConfigurationSCPOSTdiagLevel[off]:minHostWatchdog[enabled]:LogResetData[true]:VerboseResetData[true]:RockerSwitch[enabled]:SecureMode[off]:PROCRTUsinstalled:8PROCHeadroomQuantity(0todisable,4MAX)[0]:Toleratecorrectablememoryerrors[false]:lom>代码示例6-3将诊断级别设为min时的SCPOST输出@(#)SYSTEMCONTROLLER(SC)POST212001/12/1117:11PSR=0x044010e5PCR=0x04004000SelfTestrunningatDiagLevel:0x20SCBootPROMTestBootPROMCheckSumTestIUTestIUinstructionsetTest第6章运行POST59LittleendianaccessTestFPUTestFPUinstructionsetTestSparcReferenceMMUTestSRMMUTLBRAMTestSRMMUTLBReadmissTestSRMMUpageprobeTestSRMMUsegmentprobeTestSRMMUregionprobeTestSRMMUcontextprobeTest.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
LocalI2CAT24C64TestEEPROMDeviceTestperformingeepromsequentialreadLocalI2CPCF8591TestVOLT_ADDeviceTestchannel[00000001]Voltage(0x00000099):1.
49channel[00000002]Voltage(0x0000009D):3.
37channel[00000003]Voltage(0x0000009A):5.
1channel[00000004]Voltage(0x00000000):0.
0LocalI2CLM75TestTEMP0(IIep)DeviceTestTemparature:24.
50Degree(C)LocalI2CLM75TestTEMP1(Rio)DeviceTestTemparature:23.
50Degree(C)LocalI2CLM75TestTEMP2(CBH)DeviceTestTemparature:32.
0Degree(C)LocalI2CPCF8574TestScCSRDeviceTestConsoleBusHubTestCBHRegisterAccessTestPOSTComplete.
代码示例6-3将诊断级别设为min时的SCPOST输出(续)60SunFire入门级中型系统管理指南2006年4月61'第7章自动诊断和恢复本章介绍随SunFire入门级中型系统的固件一起提供的错误诊断和域恢复功能.
本章包括下列主题:第62页的"自动诊断和恢复概述"第64页的"自动恢复挂起系统"第65页的"诊断事件"第65页的"诊断和恢复控制"第67页的"获取自动诊断和恢复信息"62SunFire入门级中型系统管理指南2006年4月自动诊断和恢复概述缺省情况下,SunFire中型系统上启用诊断和恢复功能.
本节概述这些功能的工作方式.
根据硬件错误出现的类型和已设置的诊断控制,系统控制器将执行图7-1中所示的特定诊断和恢复步骤.
固件包含自动诊断(AD)引擎,通过该引擎,可以对影响系统可用性的硬件错误进行检测与诊断.
注–尽管入门级中型系统不支持其他中型系统所支持的多个域,但按约定,诊断输出会提供和域A状态相同的状态.
图7-1自动诊断和恢复过程系统正在运行系统控制器检测到硬件错误并暂停操作系统(OS).
自动诊断自动恢复OS重新启动第7章自动诊断和恢复63下面简要说明图7-1中所示的过程:1.
SC检测硬件错误并暂停操作系统.
2.
自动诊断.
AD引擎分析硬件错误并确定与硬件错误相关的现场可更换部件(FRU).
AD引擎根据硬件错误及相关组件提供下列一种诊断结果:标识导致错误的单个FRU.
确定导致错误的多个FRU.
请注意,并非所有列出的组件都可能出现故障.
硬件错误可能与标识组件中的一小部分有关.
指示无法确定导致错误的FRU.
这种情况被视为"unresolved"(未解决),需要服务人员进一步分析.
AD引擎记录受影响组件的诊断信息,并将这些信息作为组件运行状态(CHS)的一部分来维护.
AD引擎以控制台事件消息的形式报告诊断信息.
代码示例7-1显示了出现在控制台上的自动诊断事件消息.
在本示例中,硬件错误由单个FRU所致.
有关AD消息内容的详细信息,请参见第67页的"查看自动诊断事件消息".
注–如果看到这些自动诊断消息,请与服务提供商联系.
服务提供商将查看自动诊断信息并采取相应的维修措施.
showlogs、showboards、showcomponent和showerrorbuffer命令的输出(有关这些命令显示的与诊断相关的详细信息,请参见第67页的"获取自动诊断和恢复信息").
这些命令的输出补充了事件消息中提供的诊断信息,可用于进一步排除故障.
3.
自动恢复.
自动恢复期间,POST将会查看由AD引擎更新的FRU的组件运行状态.
POST使用此信息并通过在域中取消配置(禁用)那些被确定为导致硬件错误的任何FRU,从而试图隔离故障.
即使POST无法隔离故障,作为域恢复的一部分,系统控制器也会自动重新启动域.
注–要利用自动恢复功能,请确保已将OpenbootPROM变量hang-policy设置为reset.
代码示例7-1在控制台上显示的自动诊断事件消息实例[AD]Event:E2900.
ASIC.
AR.
ADR_PERR.
10473006CSN:DomainID:AADInfo:1.
SCAPP.
17.
0Time:FriDec1209:30:20PST2003FRU-List-Count:2;FRU-PN:5405564;FRU-SN:A08712;FRU-LOC:/N0/IB6FRU-PN:5404974;FRU-SN:000274;FRU-LOC:/N0/RP2Recommended-Action:Serviceactionrequired64SunFire入门级中型系统管理指南2006年4月自动恢复挂起系统系统控制器可自动监视在出现以下任一情况时系统是否会挂起:在指定的超时间隔内操作系统心跳停止.
缺省的超时值为3分钟.
但是,您可以通过在域/etc/systems文件中设置watchdog_timeout_seconds参数来覆盖此值.
如果您将此值设置为小于3分钟,则系统控制器就会将3分钟(缺省值)作为超时期间.
有关此系统参数的详细信息,请参见Solaris操作系统版本的system(4)手册页.
系统未响应中断.
当启用hostwatchdog(如setupsc命令中所述)时,系统控制器可自动执行外部启动重置(XIR)并重新引导挂起的操作系统.
如果已将OpenBootPROMnvram变量error-reset-recovery设置为sync,则在执行XIR之后,系统还会生成一个核心文件,而且可用它来对挂起的操作系统进行故障排除.
代码示例7-2显示了在操作系统心跳停止时所显示的控制台消息.
代码示例7-3显示了在操作系统未响应中断请求时所显示的控制台消息.
代码示例7-2在操作系统心跳停止后自动恢复域时出现的消息输出实例TueDec0912:24:47commandolom:Domainwatchdogtimerexpired.
TueDec0912:24:48commandolom:Usingdefaulthang-policy(RESET).
TueDec0912:24:48commandolom:Resetting(XIR)domain.
代码示例7-3在操作系统未响应中断请求后自动恢复域时出现的控制台输出实例TueDec0912:37:38commandolom:Domainisnotrespondingtointerrupts.
TueDec0912:37:38commandolom:Usingdefaulthang-policy(RESET).
TueDec0912:37:38commandolom:Resetting(XIR)domain第7章自动诊断和恢复65诊断事件某些非致命的硬件错误可由Solaris操作系统标识并报告给系统控制器.
系统控制器提供以下功能:作为组件运行状况的一部分,为受影响的资源记录并维护此信息.
通过在控制台上显示事件消息来报告此信息.
POST在下一次运行时会检查受影响资源的运行状况,并且如果可能,会从系统中取消相应资源的配置.
代码示例7-4显示非致命性域错误的事件消息.
当看到此类事件消息时,请与您的服务提供商联系,以便采取相应的维修措施.
第67页的"查看自动诊断事件消息"中对提供的事件消息信息进行了说明.
您可以使用showboards和showcomponent命令获取有关POST解除配置的组件的更多信息,如第68页的"查看组件状态"中所述.
诊断和恢复控制本节介绍影响恢复特性的各种控制和参数.
诊断参数表7-1介绍了控制诊断和操作系统恢复过程的各种参数设置.
诊断和操作系统恢复参数的缺省值是建议使用的设置.
注–如果您不使用缺省设置,则恢复特性的运行情况不会如第62页的"自动诊断和恢复概述"中所述.
代码示例7-4域诊断事件消息-非致命性的域硬件错误[DOM]Event:SFV1280.
L2SRAM.
SERD.
0.
60.
10040000000128.
7fd78d140CSN:DomainID:AADInfo:1.
SF-SOLARIS-DE.
5_8_Generic_116188-01Time:WedNov2612:06:14PST2003FRU-List-Count:1;FRU-PN:3704129;FRU-SN:100ACD;FRU-LOC:/N0/SB0/P0/E0Recommended-Action:Serviceactionrequired66SunFire入门级中型系统管理指南2006年4月表7-1诊断和操作系统恢复参数参数使用的命令缺省值说明HostWatchdogsetupsc命令enabled检测到硬件错误时自动重新启动域.
当OBP.
auto-boot参数设置为true时,还会引导Solaris操作系统.
LogResetDatasetupsc命令true如果启用,则系统挂起期间在重置系统之前,系统控制器会将每个CPU的当前状态数据发送到控制台(如果已启用HostWatchdog).
这样,如果记录控制台数据,则系统状态数据会被保留.
其输出格式与手动转储挂起的系统的CPU状态数据时(即,如果禁用了HostWatchdog)showresetstate命令使用的格式相同.
VerboseResetDatasetupsc命令true控制系统控制器向控制台发送的信息量.
如果启用了此选项,其生成的结果与使用showresetstate命令生成的结果相同.
Toleratecorrectablememoryerrorssetupsc命令false如果设置为true,则在引导Solaris操作系统时允许内存出现可纠正的ECC错误.
Solaris10操作系统融合了可对这类内存模块中有故障的部分进行自动隔离的特性,因此无需完全禁用这些模块,从而增加了系统的可用性.
如果设置为false,则出现可纠正ECC错误的内存模块会被POST禁用,而且不能加入到Solaris域中.
reboot-on-errorOBPsetenvtrue检测到硬件错误时自动重新启动域.
当OBP.
auto-boot参数设置为true时,还会引导Solaris操作系统.
auto-bootOBPsetenvtrue在运行POST后引导Solaris操作系统.
error-reset-recoveryOBPsetenvsync在执行XIR后自动重新引导系统,并生成可用于对挂起系统进行故障排除的核心文件.
不过请注意,在交换区必须分配足够的磁盘空间以保存该核心文件.
第7章自动诊断和恢复67获取自动诊断和恢复信息您可利用本节介绍的各种方法来监控硬件错误,并获取与硬件错误相关的组件的其他信息.
查看自动诊断事件消息自动诊断[AD]和域[DOM]事件消息显示在控制台以及以下部分中:/var/adm/messages文件,假设您已正确地设置了该事件报告,如第4章中所述.
showlogs命令输出,它显示了记录在控制台上的事件消息.
在装有增强内存系统控制器(SCV2)的系统中,日志消息保存在持久性缓冲区中.
您可以使用showlogs-p-f过滤器命令,根据消息类型(比如故障事件消息)选择性地查看某些类型的日志消息.
有关详细信息,请参见《SunFireEntry-LevelMidrangeSystemControllerCommandReferenceManual》中的showlogs命令说明.
[AD]或[DOM]事件消息(请参见代码示例7-1、代码示例7-4、代码示例7-5和代码示例7-6)包含以下信息:[AD]或[DOM]-位于消息的开始处.
AD指明ScApp或POST自动诊断引擎生成事件消息.
DOM指明受影响域上的Solaris操作系统生成了自动诊断事件消息.
Event-字母数字文本字符串,用于标识服务提供商使用的平台和特定于事件的信息.
CSN-底盘序列号,用于标识SunFire中型系统.
DomainID-受硬件错误影响的域.
入门级中型系统始终为域A.
ADInfo-自动诊断消息的版本、诊断引擎的名称(SCAPP或SF-SOLARIS_DE)和自动诊断引擎的版本.
对于域诊断事件,诊断引擎为Solaris操作系统(SF-SOLARIS-DE),并且诊断引擎的版本为当前使用的Solaris操作系统版本.
Time-自动诊断发生的星期、月份、日期、时间(小时、分钟和秒)、时区和年份.
FRU-List-Count-与错误有关的组件(FRU)数量以及以下FRU数据:如果错误只与一个组件有关,则显示该组件的FRU部件号码、序列号和位置,如代码示例7-1所示.
如果错误与多个组件有关,则报告各个组件的FRU部件号码、序列号和位置,如代码示例7-5所示.
在某些情况下,请注意并非所有列出的FRU均存在故障.
故障可能只存在于列出的部分组件上.
如果SCAPP诊断引擎无法找到与错误有关的特定组件,则会显示术语UNRESOLVED,如代码示例7-6所示.
68SunFire入门级中型系统管理指南2006年4月Recommended-Action:Serviceactionrequired-此消息用于通知管理员与服务提供商联系,以便进一步获得维修服务.
此外,它还指明自动诊断消息的结尾.
查看组件状态您可以查看下列项目,获得那些在自动诊断期间被取消配置或由于其他原因被禁用的组件的其他信息:执行了自动诊断之后的showboards命令输出代码示例7-6显示了系统中所有组件的位置分配和状态.
组件的Status栏中提供了与诊断相关的信息.
具有Failed或Disabled状态的组件是从系统中取消配置的组件.
Failed状态表示板未通过测试,不可使用.
Disabled状态表示板因被setls命令禁用或未通过POST而从系统中取消配置.
Degraded状态表示板上的某些组件发生故障或被禁用,但板上仍有可用部件.
具有Degraded状态的组件仍配置在系统中.
通过查看showcomponent命令的输出,您可以获取有关Failed、Disabled或Degraded组件的其他信息.
代码示例7-5自动诊断消息实例TueDec0214:35:56commandolom:ErrorMonitor:DomainAhasaSYSTEMERROR.
.
.
TueDec0214:35:59commandolom:[AD]Event:E2900CSN:DomainID:AADInfo:1.
SCAPP.
17.
0Time:TueDec0214:35:57PST2003FRU-List-Count:0;FRU-PN:;FRU-SN:;FRU-LOC:UNRESOLVEDRecommended-Action:ServiceactionrequiredTueDec0214:35:59commandolom:AfatalconditionisdetectedonDomainA.
Initiatingautomaticrestorationforthisdomain代码示例7-6showboards命令输出-状态为Disabled和Degraded的组件SlotPwrComponentTypeStateStatusSSC1OnSystemControllerV2MainPassed/N0/SCC-SystemConfigCardAssignedOK/N0/BP-BaseplaneAssignedPassed/N0/SIB-IndicatorBoardAssignedPassed/N0/SPDB-SystemPowerDistributionBd.
AssignedPassed/N0/PS0OnA166PowerSupply-OK/N0/PS1OnA166PowerSupply-OK/N0/PS2OnA166PowerSupply-OK第7章自动诊断和恢复69执行了自动诊断之后的showcomponent命令输出代码示例7-7的Status栏显示了组件的状态.
状态为enabled或disabled.
系统中已取消配置状态为disabled的组件.
POST状态chs(组件运行状况的缩写)可标志那些需要服务提供商进一步分析的组件.
注–使用setls命令无法启用POST状态为chs的禁用组件.
有关帮助信息,请与服务提供商联系.
某些情况下,属于与硬件错误相关的"父"组件的子组件也会如父组件一样,显示禁用状态.
您无法重新启用与硬件错误相关的父组件的子组件.
要确定与错误相关的父组件,请查看自动诊断事件消息.
/N0/PS3OnA166PowerSupply-OK/N0/FT0OnFanTrayAutoSpeedPassed/N0/RP0OnRepeaterBoardAssignedOK/N0/RP2OnRepeaterBoardAssignedOK/N0/SB0OnCPUBoardActivePassed/N0/SB2OnCPUBoardV3AssignedDisabled/N0/SB4OnCPUBoardActiveDegraded/N0/IB6OnPCII/OBoardActivePassed/N0/MB-MediaBayAssignedPassed代码示例7-7showcomponent命令输出-状态为Disabled的组件SChostname:SC>showcomponentComponentStatusPendingPOSTDescription/N0/SB0/P0disabled-chsUltraSPARC-IV,1050MHz,16MECache/N0/SB0/P1disabled-chsUltraSPARC-IV,1050MHz,16MECache/N0/SB0/P2disabled-chsUltraSPARC-IV,1050MHz,16MECache/N0/SB0/P3disabled-chsUltraSPARC-IV,1050MHz,16MECache/N0/SB0/P0/B0/L0disabled-chsempty/N0/SB0/P0/B0/L2disabled-chsempty/N0/SB0/P0/B1/L1disabled-chs2048MDRAM/N0/SB0/P0/B1/L3disabled-chs2048MDRAM.
.
.
/N0/SB0/P3/B0/L0disabled-chsempty/N0/SB0/P3/B0/L2disabled-chsempty/N0/SB0/P3/B1/L1disabled-chs1024MDRAM/N0/SB0/P3/B1/L3disabled-chs1024MDRAM/N0/SB4/P0enabled-passUltraSPARC-IV,1050MHz,16MECache/N0/SB4/P1enabled-passUltraSPARC-IV,1050MHz,16MECache/N0/SB4/P2enabled-passUltraSPARC-IV,1050MHz,16MECache代码示例7-6showboards命令输出-状态为Disabled和Degraded的组件(续)70SunFire入门级中型系统管理指南2006年4月查看其他错误信息对于装有增强内存SC(SCV2)的系统,showerrorbuffer-p命令显示在持久性缓冲区中保存的系统错误内容.
但是,对于没有增强内存SC的系统,showerrorbuffer命令显示动态缓冲区的内容,并显示作为域恢复过程一部分重新引导您的域时可能丢失的错误消息.
无论何种情况,显示的信息都可供服务提供商进行故障排除.
代码示例7-8显示了出现域硬件错误时所显示的输出.
/N0/SB4/P3enabled-passUltraSPARC-IV,1050MHz,16MECache.
.
.
代码示例7-8showerrorbuffer命令输出-硬件错误EX07:lom>showerrorbufferErrorData[0]Date:FriJan3010:23:32EST2004Device:/SSC1/sbbc0/systemepldRegister:FirstError[0x10]:0x0200SB0encounteredthefirsterrorErrorData[1]Date:FriJan3010:23:32EST2004Device:/SB0/bbcGroup0/repeaterepldRegister:FirstError[0x10]:0x0002sdc0encounteredthefirsterrorErrorData[2]Date:FriJan3010:23:32EST2004Device:/SB0/sdc0ErrorID:0x60171010Register:SafariPortError0[0x200]:0x00000002ParSglErr[01:01]:0x1ParitySingleerror代码示例7-7showcomponent命令输出-状态为Disabled的组件(续)71第8章安全性指导本章介绍关于系统安全保护的重要信息,并介绍了安全建议和域最小化操作.
此外,它还提供了关于Solaris操作系统安全的参考文献.
本章包括下列主题:第71页的"系统安全保护"第73页的"选择远程连接类型"第76页的"其他安全注意事项"系统安全保护以下是要考虑的安全事项:确保所有密码符合安全准则.
定期更改密码.
定期审查日志文件,确定是否存在异常情况.
配置系统以限制未授权访问的做法称为强化.
有多个配置步骤可以帮助您强化系统.
这些步骤是系统配置的指导原则:在更新SunFireRTOS和系统控制器应用程序固件之后和配置或安装任何SunFire域之前,都应立即执行安全性修改.
通常情况下,目标是限制访问系统控制器操作系统RTOS.
限制对串行端口的物理访问.
根据配置的变化,可能需要重新引导.
72SunFire入门级中型系统管理指南2006年4月定义控制台密码SC控制台密码的唯一限制是:密码字符必须是ASCII和当前所用终端仿真程序支持的字符.
系统控制器使用MD5算法生成输入密码的散列.
相应地,输入的所有字符都是有意义的.
针对最短16个字符长度的密码,提倡使用密码短语来代替密码.
密码应包含大写字母、小写字母、数字和标点符号的组合.
有关如何设置控制台密码的信息,请参阅第17页的"设置密码".
使用SNMP协议缺省配置简单网络管理协议(SNMP)常用于监控和管理联网的设备和系统.
缺省情况下,SNMP处于禁用状态.
注–使用SunManagementCenter软件需要SNMP.
但是,由于系统控制器不支持安全版本的SNMP协议,因此除非必须使用SunManagementCenter软件,否则请不要启用SNMP.
重新引导SC以应用设置如果控制台消息类似于下面显示的消息,则需要重新引导系统控制器:键入resetsc-y以重新引导SCSC可在Solaris域启动和运行期间重新引导.
重新引导SC后,使用shownetwork命令验证是否应用了所有网络修改.
有关使用SunSecurityToolkit为运行Solaris操作系统的系统创建安全配置的信息,请访问以下网站:http://www.
sun.
com/security/jassRebootingtheSCisrequiredforchangesinnetworksettingstotakeeffect.
第8章安全性指导73选择远程连接类型缺省情况下,SC上的SSH和Telnet服务处于禁用状态.
启用SSH如果系统控制器位于通用网络上,则您可以使用SSH(而不是Telnet)来确保安全地对系统控制器进行远程访问.
SSH对主机与客户机之间的数据流进行加密.
它提供识别主机和用户的身份验证机制,实现已知系统间的安全连接.
由于Telnet协议传输的信息(包括密码)不进行加密,因此Telnet本质上是不安全的.
注–SSH并不会对FTP、HTTP、SYSLOG或SNMPv1协议的安全性有所增强.
这些协议不安全,在通用网络上应谨慎使用.
系统控制器提供有限的SSH功能,只支持SSH版本2(SSHv2)客户机请求.
表8-1列出了各类SSH服务器属性并且说明了如何在该子集中处理这些属性.
这些属性设置不可配置.
.
表8-1SSH服务器属性属性值注释Protocol2仅支持SSHv2Port22监听端口ListenAddress0.
0.
0.
0支持多个IP地址AllowTcpForwardingno不支持端口转发RSAAuthenticationno禁用公共密钥验证PubkeyAuthenticationno禁用公共密钥验证PermitEmptyPasswordsyes由系统控制器控制密码验证MAChmac-sha1,hmac-md5与Solaris9操作系统相同的SSH服务器实现Ciphersaes128-cbc,blowfish-cbc,3des-cbc与Solaris9操作系统相同的SSH服务器实现74SunFire入门级中型系统管理指南2006年4月启用SSH1.
要启用SSH,请键入:系统会提示您输入网络配置和连接参数.
例如:有关setupnetwork命令的详细信息,请参阅《SunFireEntry-LevelMidrangeSystemControllerCommandReferenceManual》中的命令说明.
SSH不支持的功能SunFire入门级中型系统上的SSH服务器不支持下列功能:执行远程命令行scp命令(安全的复制程序)sftp命令(安全文件传输程序)端口转发基于密钥的用户身份验证SSHv1客户机LOM>setupnetworkLOM>setupnetworkNetworkConfigurationIsthesystemcontrolleronanetwork[yes]:UseDHCPorstaticnetworksettings[static]:Hostname[hostname]:IPAddress[xxx.
xxx.
xxx.
xxx]:Netmask[xxx.
xxx.
xxx.
x]:Gateway[xxx.
xxx.
xxx.
xxx]:DNSDomain[xxxx.
xxx.
xxx]:PrimaryDNSServer[xxx.
xxx.
xxx.
xx]:SecondaryDNSServer[xxx.
xxx.
xx.
x]:Connectiontype(ssh,telnet,none)[ssh]:RebootingtheSCisrequiredforchangesintheabovenetworksettingstotakeeffect.
lom>第8章安全性指导75如果您试图使用任何上述命令,都会生成一条错误消息.
例如,如果键入以下命令系统会生成以下信息:在SSH客户机上:在SC控制台上:更改SSH主机密钥对于管理良好的机器,定期获得新的主机密钥是一种非常好的安全做法.
如果怀疑主机密钥可能被泄漏,则可以使用ssh-keygen命令重新生成系统主机密钥.
主机密钥生成后,只能被更换,并且如果不使用setdefaults命令就无法删除.
如果要激活新生成的主机密钥,必须运行restartssh命令或通过重新启动来启动SSH服务器.
有关ssh-keygen和restartssh命令(带实例)的详细信息,请参阅《SunFireEntry-LevelMidrangeSystemControllerCommandReferenceManual》.
注–您也可以使用ssh-keygen命令显示系统控制器上的主机密钥指印.
#sshSCHOSTshowboardsConnectiontoSCHOSTclosedbyremotehost.
[0x89d1e0]sshdSessionServerCreate:noserverregisteredforshowboards[0x89d1e0]sshd:FailedtocreatesshdSession76SunFire入门级中型系统管理指南2006年4月其他安全注意事项本节包括下列主题:允许RTOSShell访问的专用键序域最小化Solaris操作系统安全性允许RTOSShell访问的专用键序当系统控制器引导时,可以通过其串行连接将专用键序发送到系统控制器.
这些键序如果在系统控制器重新引导后的30秒内从串行端口输入,就具有特殊的功能.
显示Sun版权消息的30秒后,这些键序的特殊功能被自动禁用.
功能被禁用后,键序操作就恢复为正常的控制键操作.
由于未经授权访问RTOSshell可能会破坏系统控制器的安全,因此必须控制对系统控制器串行端口的访问.
域最小化可帮助您保护SunFire中型系统安全的一种方法是调整软件的安装,使其尽可能最小.
通过限制各个域上安装的软件组件数(称为域最小化),可以减少潜在入侵者能够利用的安全漏洞所带来的风险.
有关最小化的详细讨论及其实例,请参阅联机文章《MinimizingDomainsforSunFireV1280,6800,12K,and15KSystems》(该文章包含两部分):http://www.
sun.
com/security/blueprintsSolaris操作系统安全性有关Solaris操作系统安全保护的信息,请参考以下文献:《SolarisSecurityBestPractices》-联机提供,其网址为:http://www.
sun.
com/security/blueprints《SolarisSecurityToolkit》-联机提供,位于:http://www.
sun.
com/security/jassSolaris9系统管理员文档集中的《Solaris8SystemAdministrationSupplement》或《SystemAdministrationGuide:SecurityServices》77第9章即需即用SunFire入门级中型系统的CPU/内存板上配置了处理器(CPU).
这些板可能是系统原始配置的一部分,也可能是需要单独订购的附加组件.
原始购买价中包含在这些板上使用CPU的权利.
对于使用UltraSPARCIVCPU/内存板的系统(例如:SunFireE2900),其即需即用(COD)选件可以提供额外的处理资源,不过,您需付费才能使用这些资源.
通过COD选项,您可购买未获许可的CODCPU/内存板并将其装入您的系统.
每个CODCPU/内存板包含四个CPU,它们都是可用的处理资源.
但是,您必须购买这些CODCPU的使用权(RTU)许可证才能使用它们.
购买CODRTU许可证后,您会收到许可证密钥,此密钥允许您使用适当数量的COD处理器.
您可使用SunFire入门级中型系统固件附带的COD命令来分配、激活和监视COD资源.
本章包括以下主题:第78页的"COD概述"第80页的"准备使用COD"第81页的"管理CODRTU许可证"第84页的"激活COD资源"第86页的"监控COD资源"78SunFire入门级中型系统管理指南2006年4月COD概述COD选项通过安装在系统中的CODCPU/内存板提供附加CPU资源.
虽然中型系统出厂时配置了最小数目的标准(活动)CPU/内存板,但仍可以混合安装标准及CODCPU/内存板,以将容量扩充至系统允许的最大容量.
系统中至少应有一个活动的CPU.
如果您需要COD选项,并且系统当前并未配置CODCPU/内存板,那么请与Sun销售代表或授权的Sun分销商联系,购买CODCPU/内存板.
销售人员将与服务提供商一起为您的系统安装CODCPU/内存板.
以下几节介绍了COD选项的主要要素:COD许可证注册过程CODRTU许可证分配即时访问CPU用作热备用的即时访问CPU资源监视COD许可证注册过程您必须具有CODRTU许可证才能启用CODCPU资源.
COD许可证注册包括下列任务:1.
为要启用的COD资源获得CODRTU许可证书和CODRTU许可证密钥您可以随时从Sun销售代表或分销商处购买CODRTU许可证,然后从Sun授权许可中心获取(所购买的COD资源的)许可证密钥.
2.
在COD许可证数据库中输入CODRTU许可证密钥COD许可证数据库用于存储您启用的COD资源的许可证密钥.
通过使用addcodlicense命令,将此许可证信息记录到COD许可证数据库内.
作为浮动许可证,CODRTU许可证可用于系统中安装的任何CODCPU资源.
有关完成许可证注册任务的详细信息,请参见第81页的"获得CODRTU许可证密钥并将其添加到COD许可证数据库".
第9章即需即用79CODRTU许可证分配通过COD选项,可以将系统配置为具有特定数量的可用CODCPU,具体数量取决于您购买的CODCPU/内存板和CODRTU许可证的数量.
您获取的各个CODRTU许可证将作为一个可用许可证池来处理.
当您激活包含CODCPU/内存板的域,或当CODCPU/内存板通过动态重新配置(DR)操作连接到域时,将会自动发生以下情况:系统检查当前安装的CODRTU许可证.
系统(从许可证池中)获得COD板上每个CPU的CODRTU许可证.
为CPU分配CODRTU许可证时采用"先到先得"的原则.
但是,您可以使用setupsc命令分配一定数量的RTU许可证.
有关详细信息,请参见第84页的"启用或禁用即时访问CPU并保留RTU许可证".
如果CODRTU许可证的数量不足,无法为某个CODCPU分配许可证,则该CODCPU会被视为"未经许可".
此CODCPU还会被指定为"COD禁用"状态.
如果CODCPU/内存板没有足够的CODRTU许可证可用于其CODCPU,则系统将在poweron运行期间中出现CODCPU/内存板故障.
有关附加的详细信息和示例,请参见第88页的"禁用COD的CPU".
当您通过动态重配置操作过程删除某一CODCPU/内存板或正常关闭某一CODCPU/内存板时,这些板上CPU所用的CODRTU许可证会被释放并添加到可用许可证池中.
您可以使用showcodusage命令查看COD的使用情况和CODRTU许可证的状态.
有关提供COD信息的showcodusage命令和其他命令的详细信息,请参见第86页的"监控COD资源".
即时访问CPU如果您需要在尚未购买CODRTU许可证之前使用CODCPU资源,那么您可以暂时启用一定数量的资源,这些资源称为即时访问CPU(也称为净资源).
只要系统中装有未获许可的CODCPU,就可使用即时访问CPU.
SunFire入门级中型系统提供的即时访问资源最多为四个CPU.
缺省情况下,SunFire中型系统上禁用即时访问CPU.
如果您要使用这些资源,则可使用setupsc命令将其激活.
一些警告消息会显示在控制台上,用于提醒您所用的即时访问CPU(冗余)数量已超过了可用的COD许可证数量.
一旦您获得了用于这些即时访问CPU的CODRTU许可证密钥并将其添入COD许可证数据库,系统便会停止显示这些警告消息.
有关激活即时访问CPU的详细信息,请参见第84页的"启用或禁用即时访问CPU并保留RTU许可证".
80SunFire入门级中型系统管理指南2006年4月用作热备用的即时访问CPU您可以临时启用可用的即时访问CPU,用它替换出现故障的非CODCPU.
在这种情况下,即时访问CPU被视为热备用(热备用CPU可立即用于替换出现故障的非CODCPU).
但是,出现故障的非CODCPU被换回后,必须停用即时访问CPU(请参见第84页的"启用或禁用即时访问CPU并保留RTU许可证").
如果要继续使用,请与您的Sun销售代表或分销商联系,为所用的即时访问CPU购买CODRTU许可证.
资源监视有关COD事件的信息,如激活即时访问CPU(净资源)或许可证违规等,均会记录在控制台日志消息中,另外还会出现在showlogs命令的输出中.
其他命令(如showcodusage命令)提供有关COD组件和COD配置的信息.
有关获得COD信息及状态的详细信息,请参见第86页的"监控COD资源".
准备使用COD在SunFire入门级中型系统中使用COD之前,必须首先完成某些必要的前提条件.
这些任务包括:在系统控制器(SC)和系统板上安装相同版本的固件(5.
18.
0或更高版本).
有关升级固件的详细信息,请参见第109页的"固件升级过程".
注–版本5.
18.
0以前的SunFire入门级中型系统固件不能识别CODCPU/内存板.
请与Sun销售代表或分销商联系,并执行以下操作:签署SunFire入门级中型系统的标准购买协议合同及COD合同附录.
购买CODCPU/内存板并进行安装.
按照第81页的"获得CODRTU许可证密钥并将其添加到COD许可证数据库"中所述,执行CODRTU许可证注册过程.
第9章即需即用81管理CODRTU许可证CODRTU许可证管理包括获取CODRTU许可证密钥并将其添加到COD许可证数据库.
如有需要,您也可以从许可证数据库中删除CODRTU许可证.
请注意,COD许可证密钥信息总是与某一特定系统关联.
执行以下任一操作都可能导致CODRTU许可证无效:将IB_SSC板从一个系统移至另一个系统.
使用另一个SCC卡(即具有不同主机ID的SCC卡)更换现有的SCC卡.
原始系统的所有CODRTU许可证密钥都驻留在第二个系统中,但许可证密钥仍与原始系统保持关联.
这些许可证密钥将被视为无效.
为了防止出现无效的CODRTU许可证密钥,请在删除IB_SSC之前,在第一个系统上运行setdefaults命令(以便设置缺省系统配置值).
如果没有在第一个系统上运行setdefaults命令,则可以在插入IB_SSC板后在第二个系统上运行该命令.
获得CODRTU许可证密钥并将其添加到COD许可证数据库1.
与Sun销售代表或授权的Sun分销商联系,为要启用的每个CODCPU购买CODRTU许可证.
对于您购买的每一个CPU许可证,Sun均会向您发送一个CODRTU许可证书.
许可证书上的CODRTU许可证标签中包含一个使用权序列号,此序列号用于获取CODRTU许可证密钥.
2.
与Sun授权许可中心联系并提供以下信息,以获取CODRTU许可证密钥:CODRTU许可证书的许可证标签上的CODRTU序列号系统的机箱HostID,用于识别系统要获得您系统的底盘HostID,请运行showsc命令.
有关联系Sun许可证中心的说明,请查阅您收到的CODRTU许可证书,或浏览Sun许可授权中心网站:http://www.
sun.
com/licensingSun授权许可中心会向您发送一封电子邮件,其中包含您所购买的COD资源的RTU许可证密钥.
82SunFire入门级中型系统管理指南2006年4月3.
使用addcodlicense命令,将许可证密钥添加到COD许可证数据库中.
在SC的控制台上,键入:其中:许可证签名是Sun许可授权中心分配的完整CODRTU许可证密钥.
您可以复制从Sun授权许可中心收到的许可证密钥字符串.
4.
运行showcodlicense-r命令,验证指定的许可证密钥是否已添加到COD许可证数据库中(请参见第83页的"查看COD许可证信息").
您所添加的CODRTU许可证密钥应列在showcodlicense命令的输出中.
从COD许可证数据库中删除COD许可证密钥1.
在SC的控制台上键入:其中:许可证签名是要从COD许可证数据库中删除的完整CODRTU许可证密钥.
系统将验证删除许可证是否会引起CODRTU违反许可证的问题;如果COD许可证的数量少于当前所用COD资源的数量,则会发生这种情况.
如果删除将引起CODRTU违反许可证的问题,则系统控制器将不会删除许可证密钥.
注–通过在deletecodlicense命令中指定-f选项,您可以强制删除许可证密钥.
但是请注意,删除许可证密钥可能会引起违反许可证的问题,或者导致保留RTU许可证的超限情况.
当保留的RTU域超过安装在系统中的RTU许可证时,就会发生RTU许可证的超限情况.
有关详细信息,请参见《SunFireEntry-LevelMidrangeSystemControllerCommandReferenceManual》中的deletecodlicense命令说明.
2.
按照下面所述的过程,运行showcodlicense-r命令,验证是否已从COD许可证数据库中删除许可证密钥.
删除的许可证密钥不应出现在showcodlicense命令的输出中.
lom>addcodlicense许可证签名lom>deletecodlicense许可证签名第9章即需即用83查看COD许可证信息在SC的控制台上,执行以下一种操作可显示COD许可证信息:要以解释格式查看许可证数据,请键入:例如:表9-1说明了showcodlicense命令输出结果中的COD许可证信息.
要以原始许可证密钥格式查看许可证数据,请键入:此时将显示COD资源的许可证密钥符号.
例如:注–上面列出的CODRTU许可证密钥只是示例,并非有效许可证密钥.
有关showcodlicense命令的详细信息,请参见《SunFireEntry-LevelMidrangeSystemControllerCommandReferenceManual》中的命令说明.
lom>showcodlicenselom>showcodlicenseDescriptionVerExpirationCountStatusPROC01NONE4GOOD表9-1COD许可证信息项说明Description资源类型(处理器).
Ver许可证的版本号.
Expiration无.
不受支持(无到期日期).
Count授予给定资源的RTU许可证数量.
Status以下一种状态:GOOD-表示资源许可证有效.
EXPIRED-表示资源许可证已失效.
lom>showcodlicense-rlom>showcodlicense-r01:83198b89:86017912:0201000000:4:00000000:VW03IcpXYAIO8DYqaF/wSQ84SunFire入门级中型系统管理指南2006年4月激活COD资源要激活即时访问CPU并为特定域分配CODRTU许可证,请使用setupsc命令.
有关setupsc命令选项的详细信息,请参见《SunFireEntry-LevelMidrangeSystemControllerCommandReferenceManual》中的命令说明.
启用或禁用即时访问CPU并保留RTU许可证1.
在SC的控制台上,键入以下命令:系统会提示您输入COD参数(冗余CPU数量和RTU信息).
例如:对于显示的提示信息,请注意以下方面:即时访问CPU(净资源)数量圆括号内的文字表示即时访问CPU(净资源)允许的最大数量.
方括号内的值表示当前配置的即时访问CPU数量.
要禁用即时访问CPU(净资源)功能,请键入0.
只有在所有即时访问CPU均不在使用中时,才能停用净资源数量.
lom>setupsclom>setupscSystemControllerConfigurationSCPOSTdiagLevel[off]:HostWatchdog[enabled]:RockerSwitch[enabled]:SecureMode[off]:PROCRTUsinstalled:4PROCHeadroomQuantity(0todisable,4MAX)[0]:2Toleratecorrectablememoryerrors[false]:第9章即需即用852.
使用showsc命令验证COD资源的配置:例如:lom>showsclom>showscSC:SSC1SystemControllerV2Clockfailoverdisabled.
SCdate:MonMay0310:22:33EDT2004SCuptime:3days18hours4minutes4secondsScAppversion:5.
18.
0RTOSversion:38SolarisHostStatus:Active-SolarisChassisHostID:83198b89PROCRTUsinstalled:4PROCHeadroomQuantity:286SunFire入门级中型系统管理指南2006年4月监控COD资源本节介绍跟踪COD资源使用情况及获取COD信息的各种方法.
CODCPU/内存板可以通过使用showboards命令来确定系统中哪些CPU/内存板是COD板.
标识CODCPU/内存板在SC的控制台上,键入以下命令:CODCPU/内存板会被标识为CODCPU板.
例如:lom>showboardslom>showboardsSlotPwrComponentTypeStateStatusSSC1OnSystemControllerV2MainPassed/N0/SCC-SystemConfigCardAssignedOK/N0/BP-BaseplaneAssignedPassed/N0/SIB-IndicatorBoardAssignedPassed/N0/SPDB-SystemPowerDistributionBd.
AssignedPassed/N0/PS0OnA166PowerSupply-OK/N0/PS1OnA166PowerSupply-OK/N0/PS2OnA166PowerSupply-OK/N0/PS3OnA166PowerSupply-OK/N0/FT0OnFanTrayAutoSpeedPassed/N0/RP0OnRepeaterBoardAssignedOK/N0/RP2OnRepeaterBoardAssignedOK/N0/SB0OnCODCPUBoardActiveDegraded/N0/SB2OnCODCPUBoardV3AssignedDisabled/N0/SB4OnCODCPUBoardAssignedDisabled/N0/IB6OnPCII/OBoardActivePassed/N0/MB-MediaBayAssignedPassed第9章即需即用87COD资源使用情况要获取COD资源在系统中使用情况的信息,请使用showcodusage命令.
查看COD使用情况在SC的控制台上,键入以下命令:输出信息中将包括CPU的状态.
例如:表9-2说明了所显示的COD资源信息.
lom>showcodusage-vlom>showcodusage-vDomain/ResourceInUseInstalledReservedStatusA-PROC440SB0-PROC44/N0/SB0/P0Licensed/N0/SB0/P1Licensed/N0/SB0/P2Licensed/N0/SB0/P3LicensedUnused-PROC000表9-2showcodusage信息项说明Domain/ResourceCOD资源(处理器).
未用的处理器是尚未分配的CODCPU.
InUse当前正在使用的CODCPU数量.
Installed已安装的CODCPU数量.
Reserved已分配的CODRTU许可证数量.
Status以下一种CPU状态:Licensed-CODCPU拥有CODRTU许可证.
Unused-CODCPU不在使用中.
Unlicensed-CODCPU没有获得CODRTU许可证并且不在使用中.
88SunFire入门级中型系统管理指南2006年4月禁用COD的CPU当您激活使用CODCPU/内存板的域时,系统控制器会禁用那些未获得CODRTU许可证的CODCPU.
您可以通过查看以下几项来确定哪些CODCPU已被禁用:用于poweron操作的控制台登录未获得CODRTU许可证的CODCPU均会被标识为Cod-dis(Cod-disabled的缩写).
如果COD/内存板上的所有CODCPU均被禁用,则在进行poweron操作时还将发生CODCPU/内存板故障,如代码示例9-1所示.
showcomponent命令输出代码示例9-2显示了为系统中每一组件显示的状态信息的类型.
如果CODRTU许可证无法分配给CODCPU,则CODCPU的状态会列为Cod-dis(Cod-disabled的缩写).
代码示例9-1包含禁用CODCPU信息的控制台日志输出lom>poweron{/N0/SB0/P0}Passed{/N0/SB0/P1}Passed{/N0/SB0/P2}Passed{/N0/SB0/P3}Passed{/N0/SB0/P0}Cod-dis{/N0/SB0/P1}Cod-dis{/N0/SB0/P2}Cod-dis{/N0/SB0/P3}Cod-dis.
.
.
EnteringOBP.
.
.
Jun2719:04:38schostnameDomain-A.
SC:Excludedunusable,unlicensed,failedordisabledboard:/N0/SB0代码示例9-2showcomponent命令输出-禁用的CODCPUlom>showcomponentComponentStatusPendingPOSTDescription.
.
.
/N0/SB2/P0Cod-dis-untestUltraSPARC-IV,1050MHz,16MECache/N0/SB2/P1Cod-dis-untestUltraSPARC-IV,1050MHz,16MECache/N0/SB2/P2Cod-dis-untestUltraSPARC-IV,1050MHz,16MECache第9章即需即用89其他COD信息表9-3总结了您可以通过其他系统控制器命令获得的COD配置和事件信息.
有关这些命令的详细信息,请参见《SunFireEntry-LevelMidrangeSystemControllerCommandReferenceManual》中相应的说明.
/N0/SB2/P3Cod-dis-untestUltraSPARC-IV,1050MHz,16MECache/N0/SB2/P0/B0/L0Cod-dis-untest2048MDRAM/N0/SB2/P0/B0/L2Cod-dis-untest2048MDRAM/N0/SB2/P0/B1/L1Cod-dis-untest2048MDRAM/N0/SB2/P0/B1/L3Cod-dis-untest2048MDRAM/N0/SB2/P1/B0/L0Cod-dis-untest2048MDRAM/N0/SB2/P1/B0/L2Cod-dis-untest2048MDRAM/N0/SB2/P1/B1/L1Cod-dis-untest2048MDRAM/N0/SB2/P1/B1/L3Cod-dis-untest2048MDRAM/N0/SB2/P2/B0/L0Cod-dis-untest2048MDRAM.
.
.
表9-3获取COD配置和事件信息命令说明showlogs显示控制台中记录的有关COD事件(例如:许可证违规或激活即时访问CPU)的信息.
showsc显示当前COD资源的配置和相关信息:正在使用的即时访问CPU(净资源)数量底盘HostID代码示例9-2showcomponent命令输出-禁用的CODCPU(续)90SunFire入门级中型系统管理指南2006年4月91第10章维护和故障排除本章介绍适用于系统管理员的维护和故障排除信息,本章包括下列主题:第92页的"设备映射"第97页的"系统故障"第101页的"恢复挂起的系统"第104页的"温度"第106页的"电源"第107页的"显示诊断信息"第107页的"协助Sun服务人员查明故障原因"92SunFire入门级中型系统管理指南2006年4月设备映射设备的物理地址是设备独一无二的物理特性.
物理地址的示例包括总线地址和插槽编号.
插槽编号指示设备的安装位置.
您可以使用节点标识-代理ID(AID)-来表示物理设备.
十进制AID的范围介于0到31之间(十六进制为0到1f).
在以ssm@0,0开头的设备路径中,第一个数字0表示节点ID.
CPU/内存映射十进制CPU/内存板和内存代理ID(AID)的范围介于0到23之间(十六进制为0到17).
本系统最多可以安装三块CPU/内存板.
取决于您的配置,每块CPU/内存板可以安装四个CPU.
每块CPU/内存板最多可有四组内存.
每组内存都由一个内存管理单元(MMU)控制,也就是CPU所控制.
以下代码示例显示了CPU的设备树条目及其相关的内存:其中:在b,0中b为CPU代理标识符(AID)0是CPU寄存器在b,400000中b为内存代理标识符(AID)400000是内存控制器的寄存器每块CPU/内存板最多可以安装四块CPU(表10-1):具有代理ID0-3的CPU位于名为SB0的板上/ssm@0,0/SUNW/UltraSPARC-III@b,0/ssm@0,0/SUNW/memory-controller@b,400000第10章维护和故障排除93具有代理ID8-11的CPU位于名为SB2的板上,等等.
IB_SSC部件映射表10-2列出了I/O部件的类型、每个I/O部件所具有的插槽数以及支持这些I/O部件类型的系统.
表10-3列出了每个系统的I/O部件数及I/O部件名称.
每个I/O部件包含两个I/O控制器:I/O控制器0I/O控制器1将I/O设备树条目映射至系统中的物理组件时,必须考虑设备树中至多五个节点:节点标识符(ID)I/O控制器代理I/O(AID)总线偏移量PCI插槽设备实例表10-1CPU和内存代理ID分配CPU/内存板名称每块CPU/内存板上的代理IDCPU0CPU1CPU2CPU3SB00(0)1(1)2(2)3(3)SB28(8)9(9)10(a)11(b)SB416(10)17(11)18(12)19(13)代理ID列中的第一个数字为十进制.
圆括号中的数字或字母为十六进制.
表10-2I/O部件类型与插槽数I/O部件类型每个I/O部件的插槽数量PCI6表10-3每个系统的I/O部件数和名称I/O部件数量I/O部件名称1IB694SunFire入门级中型系统管理指南2006年4月表10-4列出了每个I/O部件中两个I/O控制器的AID.
I/O控制器具有两条总线:A和B.
总线A为66MHz,由偏移量600000表示.
总线B为33MHz,由偏移量700000表示.
I/O部件中的板插槽由设备编号表示.
本节介绍PCII/O部件的插槽分配,并提供了设备路径的示例.
以下代码示例给出SCSI磁盘的设备树条目明细:注–设备路径中的数字为十六进制.
其中:在19,700000中19为I/O控制器代理标识符(AID)700000为总线偏移量在pci@3中3为设备号isptwo是SCSI主机适配器在sd@5,0中5为目标磁盘的SCSI号0为目标磁盘的逻辑单元号(LUN)本节介绍PCII/O部件的插槽分配,并提供了设备路径的示例.
表10-4I/O控制器代理ID分配插槽编号I/O部件名称偶I/O控制器AID奇I/O控制器AID6IB624(18)25(19)该列中第一个数字为十进制.
圆括号中的数字(或数字与字母组合)为十六进制.
/ssm@0,0/pci@19,700000/pci@3/SUNW,isptwo@4/sd@5,0第10章维护和故障排除95表10-5以十六进制的形式列出了插槽编号、I/O部件名称、各个I/O部件的设备路径、I/O控制器编号及总线等信息.
其中:w=板载LSI1010RSCSI控制器x=板载CMD646U2EIDE控制器y=板载Gigaswift以太网控制器0z=板载Gigaswift以太网控制器1另外,*表示取决于安装在插槽中的PCI卡类型.
注意以下事项:600000是总线偏移量,表示总线A,该总线以66MHz运行.
700000是总线偏移量,表示总线B,该总线以33MHz运行.
*@3是设备编号.
在本实例中,@3表示它是总线上的第三个设备.
表10-5IB_SSC部件PCI设备映射I/O部件名称设备路径物理插槽编号I.
/O控制器号总线IB6/ssm@0,0/pci@18,700000/*@100B/ssm@0,0/pci@18,700000/*@210B/ssm@0,0/pci@18,700000/*@3x0B/ssm@0,0/pci@18,600000/*@150A/ssm@0,0/pci@18,600000/*@2w0A/ssm@0,0/pci@19,700000/*@121B/ssm@0,0/pci@19,700000/*@231B/ssm@0,0/pci@19,700000/*@341B/ssm@0,0/pci@19,600000/*@1y1A/ssm@0,0/pci@19,600000/*@2z1A96SunFire入门级中型系统管理指南2006年4月图10-1SunFire入门级中型系统IB_SSCPCI物理插槽分配(针对IB6)其中,*表示取决于安装在插槽中的PCI卡类型.
例如:双向差分UltraSCSI卡(375-0006)安装在插槽4中FC-AL卡(375-3019)安装在插槽3中FC-AL卡(375-3019)安装在插槽2中上述项目将会生成下面的设备路径:/ssm@0,0/pci@19,700000/scsi@3,1/ssm@0,0/pci@19,700000/scsi@3,1(scsi-2)/ssm@0,0/pci@19,700000/scsi@3,1/tape(byte)/ssm@0,0/pci@19,700000/scsi@3,1/disk(block)/ssm@0,0/pci@19,700000/scsi@3(scsi-2)/ssm@0,0/pci@19,700000/scsi@3/tape(byte)/ssm@0,0/pci@19,700000/scsi@3/disk(block)/ssm@0,0/pci@19,700000/SUNW,qlc@2(scsi-fcp)/ssm@0,0/pci@19,700000/SUNW,qlc@2/fp@0,0(fp)/ssm@0,0/pci@19,700000/SUNW,qlc@2/fp@0,0/disk(block)/ssm@0,0/pci@19,700000/SUNW,qlc@1(scsi-fcp)/ssm@0,0/pci@19,700000/SUNW,qlc@1/fp@0,0(fp)/ssm@0,0/pci@19,700000/SUNW,qlc@1/fp@0,0/disk(block)/ssm@0,0/pci@18,600000/*@1/ssm@0,0/pci@19,700000/*@3/ssm@0,0/pci@19,700000/*@2/ssm@0,0/pci@19,700000/*@1/ssm@0,0/pci@18,700000/*@2/ssm@0,0/pci@18,700000/*@1插槽012345第10章维护和故障排除97系统故障系统故障是指任何影响系统正常操作的情况.
如果系统出现故障,则故障LED指示灯()将亮起.
图10-2显示了系统指示灯.
图10-2系统指示灯表10-6列出了指示灯的状态.
您必须立即采取适当的措施来消除系统故障.
表10-6系统故障指示灯状况FRU名称检测到故障时故障指示灯会亮起*出现FRU故障时系统故障指示灯会亮起*出现FRU故障时"顶部进入"指示灯会亮起1注释系统板是是是包括处理器、Ecache模块和DIMM2级中继器是是是IB_SSC是是是系统控制器否是是IB_SSC故障LED指示灯亮起风扇是是是IB风扇故障LED指示灯亮起电源设备是(按硬件)是否所有的电源设备指示灯均由电源设备硬件点亮.
此外,还有一个故障预警指示灯.
由于没有指示灯控制,因此电源设备EEPROM错误不会导致降级状态.
配电板否是是只能降级.
底板否是是只能降级.
SERVICEREQUIREDSYSTEMALARMPOWERSOURCE定位器系统故障系统电源On/Standby开关要求顶部进入UNIX正在运行报警1和报警2电源A和电源B98SunFire入门级中型系统管理指南2006年4月客户可更换单元下面几节按系统介绍了现场可更换单元.
SunFireE2900系统您可以处理下列FRU上的故障:硬盘-可热交换PSU(PS0/PS1/PS2/PS3)-可热交换CPU/内存板(SB0/SB2/SB4)-如果认为发生故障可列入黑名单中继器板(RP0/RP2)-如果认为发生故障可列入黑名单如果其他FRU出现故障,或需要物理更换上面列入黑名单的FRU,则应致电Sun服务中心.
SunFireV1280系统您可以处理下列FRU上的故障:硬盘-可热交换PSU(PS0/PS1/PS2/PS3)-可热交换CPU/内存板(SB0/SB2/SB4)-如果认为发生故障可列入黑名单中继器板(RP0/RP2)-如果认为发生故障可列入黑名单如果其他FRU出现故障,或需要物理更换上面列入黑名单的FRU,则应致电Sun服务中心.
系统指示灯板否是是只能降级.
系统配置卡否是否风扇托盘是是否主风扇是是否介质支架否是是磁盘是是否*此列包括只出现FRU降级的故障.
1如果亮起,则表明是从平台顶部访问出现故障的FRU.
注意,在通过导轨滑出平台之前,务必为机箱安装防翻支脚.
表10-6系统故障指示灯状况(续)FRU名称检测到故障时故障指示灯会亮起*出现FRU故障时系统故障指示灯会亮起*出现FRU故障时"顶部进入"指示灯会亮起1注释第10章维护和故障排除99Netra1280和Netra1290系统您可以处理下列FRU上的故障:硬盘-可热交换PSU(PS0/PS1/PS2/PS3)-可热交换注–只有受过专门培训的人员或Sun服务中心才可打开那些限制进入的场所,以热交换PSU或硬盘驱动器.
CPU/内存板(SB0/SB2/SB4)-如果认为发生故障可列入黑名单中继器板(RP0/RP2)-如果认为发生故障可列入黑名单如果其他FRU出现故障,或需要物理更换上面列入黑名单的FRU,则应致电Sun服务中心.
手动列入黑名单(等待维修期间)SC支持列入黑名单功能.
通过此功能,您可以禁用板上的组件(表10-7).
黑名单列出了一些不会被测试也不被配置到Solaris操作系统中的系统板组件.
黑名单存储在非易失内存中.
表10-7黑名单组件名称系统组件组件子系统组件名称CPU系统插槽/端口/物理内存组/逻辑内存组CPU/内存板(插槽)SB0,SB2,SB4I/O部件上的端口P0,P1,P2,P3CPU/内存板上的物理内存组B0,B1CPU/内存板上的逻辑内存组L0,L1,L2,L3I/O部件系统插槽/端口/总线或插槽/卡I/O部件IB6I/O部件上的端口P0,P1I/O部件上的总线B0,B1I/O部件中的I/O卡C0,C1,C2,C3,C4,C5中继器系统中继器板RP0,RP2100SunFire入门级中型系统管理指南2006年4月如果您认为一些组件或设备可能出现间断性故障或已损坏,请将它们列入黑名单.
然后,排除它们的故障.
您可使用以下两个系统控制器命令来执行黑名单操作:setlsshowcomponent注–enablecomponent和disablecomponent命令已由setls命令取代.
这些命令以前用于管理组件资源.
虽然enablecomponent和disablecomponent命令仍然可用,但还是建议您使用setls命令控制系统内外的组件配置.
setls命令仅更新黑名单.
它不能直接影响当前配置的系统板的状态.
更新的黑名单会在您执行以下操作后生效:重新引导系统.
使用动态重新配置功能将包含黑名单所列组件的板配置到系统外,然后重新配置回系统.
要对中继器板(RP0/RP2)运行setls命令,首先必须使用poweroff命令关闭系统并使系统进入待机模式.
对中继器板(RP0/RP2)运行setls命令之后,SC将自动重置以应用新设置.
如果插入新的中继器板,则需运行resetsc命令以手动重置SC.
有关此命令的详细信息,请参见《SunFireEntry-LevelMidrangeSystemControllerCommandReferenceManual》.
有关CPU/内存板的特别注意事项在POST期间,如果CPU/内存板未能通过互连测试(很少发生),屏幕将显示类似以下消息的POST输出:Jul1515:58:12nonamelom:SB0/ar0BitinerrorP3_ADDR[2]Jul1515:58:12nonamelom:SB0/ar0BitinerrorP3_ADDR[1]Jul1515:58:12nonamelom:SB0/ar0BitinerrorP3_ADDR[0]Jul1515:58:12nonamelom:ARInterconnecttest:SystemboardSB0/ar0addressrepeaterconnectionstosystemboardRP2/ar0failedJul1515:58:13nonamelom:SB0/ar0BitinerrorP3_INCOMING[0]Jul1515:58:17nonamelom:SB0/ar0BitinerrorP3_PREREQ[0]Jul1515:58:17nonamelom:SB0/ar0BitinerrorP3_ADDR[18]Jul1515:58:17nonamelom:SB0/ar0BitinerrorP3_ADDR[17]第10章维护和故障排除101CPU/内存板未能通过互连测试时,您可能无法使用poweron命令完全打开系统的电源.
出现此情况时,系统会返回到lom>提示符下.
作为临时性的措施,您可以在服务人员到达之前,在SClom>提示符下键入以下命令序列,将出现故障的CPU/内存板与系统隔离:然后输入poweron命令即可.
恢复挂起的系统如果您无法登录到Solaris操作系统,并且在LOMshell中键入break命令后,仍不能强制系统回到OpenBootPROMok提示符下,则说明系统已被挂起.
某些情况下,主机监视器会在检测到Solaris操作系统挂起时自动重置系统.
如果没有禁用主机监视器(使用setupsc命令),则主机监视器会自动重置系统.
另外,您还可以在lom>提示符下运行reset命令(缺省选项为-x,此选项用于将外部启动重置(XIR)命令发送到处理器).
reset命令将终止Solaris操作系统的运行.
注意–终止Solaris操作系统时,内存中的数据可能不会刷新到磁盘中.
因此,此操作可能会丢失或损坏应用文件系统的数据.
终止Solaris操作系统之前,系统会要求您确认此操作.
lom>disablecomponentSBx.
.
lom>poweroff.
.
lom>resetsc-y102SunFire入门级中型系统管理指南2006年4月手动恢复挂起的系统1.
完成第107页的"协助Sun服务人员查明故障原因"中的步骤.
2.
访问LOMshell.
请参见第3章.
3.
键入reset命令,强制系统返回到OpenBootPROM提示符下.
reset命令会将外部启动重置(XIR)命令发送给系统并收集用于调试硬件的数据.
注–如果已经使用setsecure命令将系统置入安全模式,系统将会显示错误信息.
系统在安全模式下时,无法运行reset或break命令.
有关详细信息,请参见《SunFireEntry-LevelMidrangeSystemControllerCommandReferenceManual》.
4.
此步骤取决于OpenBootPROMerror-reset-recovery配置变量的设置.
如果error-reset-recovery配置变量设为none,系统将立即返回到OpenBootPROM提示符下.
取得控制权后,OpenBootPROM会根据OpenBootPROMerror-reset-recovery配置变量的设置来执行相应的步骤.
您可以在ok提示符下键入任何OpenBootPROM命令,包括用于重新引导Solaris操作系统的boot命令.
此外,您还可以使用sync命令强制生成核心文件.
通过此变量配置的操作可能意味着系统将不能返回到ok提示符下.
如果error-reset-recovery配置变量没有设为none,OpenBootPROM将自动执行恢复操作.
如果error-reset-recovery配置变量设为sync(缺省值),系统将生成一个Solaris操作系统核心文件并进行重新引导.
如果OpenBootPROMerror-reset-recovery配置变量设为boot,将会重新引导系统.
5.
如果上述操作不能重新引导系统,请使用poweroff和poweron命令关闭并重新打开系统的电源.
要关闭系统的电源,请键入以下命令:要打开系统的电源,请键入以下命令:lom>resetlom>powerofflom>poweron第10章维护和故障排除103移动系统身份信息您可能认为恢复服务的最简单方法是完全更换系统.
为了将系统身份信息和关键设置从一个系统快速移到另一个更换系统上,您可以从出现故障的系统的系统配置卡读取器(SCCR)中拆除系统配置卡(SCC),然后插入更换系统的SCCR中.
系统配置卡(SCC)中存储的信息包括:MAC地址系统控制器10/100以太网端口板载千兆位以太网端口NET0板载千兆位以太网端口NET1主机IDLOM关键配置LOM密码转义序列SC网络设置(IP地址/DHCP/网关等)eventreporting级别启用/禁用主机监视器启用/禁用On/Standby启用/禁用安全模式OpenBootPROM关键配置auto-bootboot-devicediag-deviceuse-nvramrclocal-mac-address104SunFire入门级中型系统管理指南2006年4月温度一个或多个组件的温度过高时,可能会导致出现问题.
使用showenvironment命令可以列出组件的当前状态.
表10-8使用showenvironment命令检查温度情况lom>showenviromentSlotDeviceSensorValueUnitsAgeStatusSSC1SBBC0Temp.
034DegreesC1secOKSSC1CBH0Temp.
041DegreesC1secOKSSC1Board0Temp.
022DegreesC1secOKSSC1Board0Temp.
122DegreesC1secOKSSC1Board0Temp.
228DegreesC1secOKSSC1Board01.
5VDC01.
49VoltsDC1secOKSSC1Board03.
3VDC03.
35VoltsDC1secOKSSC1Board05VDC04.
98VoltsDC1secOK/N0/PS0Input0Volt.
0--1secOK/N0/PS048VDC0Volt.
048.
00VoltsDC1secOK/N0/PS1Input0Volt.
0--5secOK/N0/PS148VDC0Volt.
048.
00VoltsDC5secOK/N0/FT0Fan0Cooling0Auto5secOK/N0/FT0Fan1Cooling0Auto5secOK/N0/FT0Fan2Cooling0Auto5secOK/N0/FT0Fan3Cooling0Auto5secOK/N0/FT0Fan4Cooling0Auto5secOK/N0/FT0Fan5Cooling0Auto5secOK/N0/FT0Fan6Cooling0Auto5secOK/N0/FT0Fan7Cooling0Auto5secOK/N0/RP0Board01.
5VDC01.
49VoltsDC5secOK/N0/RP0Board03.
3VDC03.
37VoltsDC5secOK/N0/RP0Board0Temp.
020DegreesC5secOK/N0/RP0Board0Temp.
119DegreesC5secOK/N0/RP0SDC0Temp.
055DegreesC5secOK/N0/RP0AR0Temp.
045DegreesC5secOK/N0/RP0DX0Temp.
057DegreesC5secOK/N0/RP0DX1Temp.
059DegreesC5secOK/N0/RP2Board01.
5VDC01.
48VoltsDC5secOK/N0/RP2Board03.
3VDC03.
37VoltsDC5secOK/N0/RP2Board0Temp.
022DegreesC5secOK/N0/RP2Board0Temp.
122DegreesC5secOK/N0/RP2SDC0Temp.
053DegreesC5secOK/N0/RP2AR0Temp.
043DegreesC5secOK第10章维护和故障排除105/N0/RP2DX0Temp.
049DegreesC5secOK/N0/RP2DX1Temp.
052DegreesC5secOK/N0/SB0Board01.
5VDC01.
51VoltsDC5secOK/N0/SB0Board03.
3VDC03.
29VoltsDC5secOK/N0/SB0SDC0Temp.
046DegreesC5secOK/N0/SB0AR0Temp.
039DegreesC5secOK/N0/SB0DX0Temp.
045DegreesC5secOK/N0/SB0DX1Temp.
049DegreesC5secOK/N0/SB0DX2Temp.
053DegreesC5secOK/N0/SB0DX3Temp.
048DegreesC5secOK/N0/SB0SBBC0Temp.
049DegreesC5secOK/N0/SB0Board1Temp.
024DegreesC5secOK/N0/SB0Board1Temp.
124DegreesC6secOK/N0/SB0CPU0Temp.
047DegreesC6secOK/N0/SB0CPU01.
8VDC01.
72VoltsDC6secOK/N0/SB0CPU1Temp.
047DegreesC6secOK/N0/SB0CPU11.
8VDC11.
72VoltsDC6secOK/N0/SB0SBBC1Temp.
037DegreesC6secOK/N0/SB0Board1Temp.
224DegreesC6secOK/N0/SB0Board1Temp.
324DegreesC6secOK/N0/SB0CPU2Temp.
049DegreesC6secOK/N0/SB0CPU21.
8VDC01.
71VoltsDC6secOK/N0/SB0CPU3Temp.
046DegreesC6secOK/N0/SB0CPU31.
8VDC11.
72VoltsDC7secOK/N0/SB2Board01.
5VDC01.
51VoltsDC6secOK/N0/SB2Board03.
3VDC03.
29VoltsDC6secOK/N0/SB2SDC0Temp.
055DegreesC6secOK/N0/SB2AR0Temp.
037DegreesC6secOK/N0/SB2DX0Temp.
047DegreesC6secOK/N0/SB2DX1Temp.
050DegreesC6secOK/N0/SB2DX2Temp.
053DegreesC6secOK/N0/SB2DX3Temp.
047DegreesC6secOK/N0/SB2SBBC0Temp.
048DegreesC6secOK/N0/SB2Board1Temp.
023DegreesC7secOK/N0/SB2Board1Temp.
124DegreesC7secOK/N0/SB2CPU0Temp.
045DegreesC7secOK/N0/SB2CPU01.
8VDC01.
72VoltsDC7secOK/N0/SB2CPU1Temp.
046DegreesC7secOK/N0/SB2CPU11.
8VDC11.
73VoltsDC7secOK/N0/SB2SBBC1Temp.
037DegreesC7secOK/N0/SB2Board1Temp.
224DegreesC7secOK/N0/SB2Board1Temp.
325DegreesC7secOK/N0/SB2CPU2Temp.
047DegreesC7secOK/N0/SB2CPU21.
8VDC01.
71VoltsDC7secOK/N0/SB2CPU3Temp.
045DegreesC7secOK/N0/SB2CPU31.
8VDC11.
71VoltsDC7secOK/N0/IB6Board01.
5VDC01.
50VoltsDC7secOK表10-8使用showenvironment命令检查温度情况(续)106SunFire入门级中型系统管理指南2006年4月电源每个电源单元(PSU)都配有自己的LED指示灯,如下所述:电源/活动指示灯-当PSU正在供电时,此指示灯亮起;当PSU处于待机模式时,此指示灯闪烁故障指示灯-如果PSU检测到故障并停止供电,此指示灯亮起故障预警指示灯-如果PSU检测到潜在的内部故障,并且仍在供电(只有PSU风扇速度降低才会造成这种情况),此指示灯亮起另外还有两个分别标记为SourceA(电源A)和SourceB(电源B)的系统LED指示灯.
这两个LED指示灯显示了系统的供电状态.
系统共有四条物理供电线路,并将它们分为A和B两种.
供电线路A向PS0和PS1供电,供电线路B向PS2和PS3供电.
如果PS0或PS1接收到输入电源,那么SourceA指示灯将会亮起.
如果PS2或PS3接收到输入电源,那么SourceB指示灯将会亮起.
如果没有电源设备接收到输入电源,这些指示灯将会熄灭.
这些指示灯的监视频率设为每10秒钟至少一次.
/N0/IB6Board03.
3VDC03.
35VoltsDC7secOK/N0/IB6Board05VDC04.
95VoltsDC7secOK/N0/IB6Board012VDC011.
95VoltsDC7secOK/N0/IB6Board0Temp.
029DegreesC7secOK/N0/IB6Board0Temp.
128DegreesC7secOK/N0/IB6Board03.
3VDC13.
30VoltsDC7secOK/N0/IB6Board03.
3VDC23.
28VoltsDC7secOK/N0/IB6Board01.
8VDC01.
81VoltsDC7secOK/N0/IB6Board02.
5VDC02.
51VoltsDC7secOK/N0/IB6Fan0Cooling0High7secOK/N0/IB6Fan1Cooling0High7secOK/N0/IB6SDC0Temp.
063DegreesC7secOK/N0/IB6AR0Temp.
077DegreesC7secOK/N0/IB6DX0Temp.
069DegreesC7secOK/N0/IB6DX1Temp.
073DegreesC8secOK/N0/IB6SBBC0Temp.
051DegreesC8secOK/N0/IB6IOASIC0Temp.
046DegreesC8secOK/N0/IB6IOASIC1Temp.
152DegreesC8secOK表10-8使用showenvironment命令检查温度情况(续)第10章维护和故障排除107显示诊断信息有关显示诊断信息的详情,请参见Solaris操作系统版本附带的《Sun硬件平台指南》.
协助Sun服务人员查明故障原因请向Sun服务人员提供以下信息,以便查明故障原因:产生故障时写入系统控制台的输出内容的详细副本.
同时,还应包括用户操作产生的所有打印输出.
如果该副本未显示特定的用户操作,请另附一份单独的文件,说明产生特定消息的操作.
产生故障时来自/var/adm/messages的系统日志文件副本.
在LOMshell下运行下列系统控制器命令所产生的输出:showsc-v命令showboards-v命令showlogs命令historydateshowresetstateshowenvironment108SunFire入门级中型系统管理指南2006年4月109第11章固件升级过程本章介绍如何升级系统固件.
可用两种方法更新SunFire入门级中型系统中的固件:在SCLOM提示符下运行flashupdate命令.
在Solaris操作系统中运行lom-G命令.
第一种方法要求将SC10/100以太网端口连接到合适的网络并作相应的配置,使其可以访问那些包含所需新固件映像的外部FTP或HTTP服务器.
本章包括下列主题:第109页的"使用flashupdate命令"第113页的"使用lom-G命令"使用flashupdate命令flashupdate命令要求10/100以太网端口可以访问外部FTP或HTTP服务器.
flashupdate命令可以更新SC及系统板(CPU/内存板和I/O部件)中的闪存PROM.
源闪存映像通常保存在NFS服务器上.
如果您更新的是CPU/内存板,则可以使用一块板的闪存映像来更新另一块板的闪存映像.
flashupdate命令的语法如下:flashupdate[-y|-n]-furlall|systemboards|rtos|scapp|board.
.
.
flashupdate[-y|-n]-csource_boarddestination_board.
.
.
flashupdate[-y|-n]-u110SunFire入门级中型系统管理指南2006年4月其中:-y不显示确认提示.
-n如果需要确认则不执行此命令.
-f将URL指定为闪存映像的来源.
此选项要求通过网络连接至NFS服务器上的闪存映像.
您可使用此选项安装新的固件.
URL是包含闪存映像目录的URL,必须采用以下格式:ftp://[用户ID:密码@]主机名/路径或者http://主机名/路径all将更新所有板(CPU/内存板、I/O部件和系统控制器).
此操作将重新引导SC.
systemboards将更新所有CPU/内存板和I/O部件.
scapp将更新SC应用程序.
此操作将重新引导SC.
rtos将更新SCRTOS.
此操作将重新引导SC.
板对要更新的特定板进行命名(sb0、sb2、sb4或ib6).
-c将某块板指定为闪存映像源.
您可使用此选项来更新那些新(更换)的CPU/内存板.
源板表示系统中现有的、用作闪存映像源的CPU/内存板(sb0、sb2或sb4).
目标板表示要更新的CPU/内存板(sb0、sb2或sb4).
-u使用当前具有最高固件版本的板上的映像自动更新所有的CPU/内存板.
您可使用此选项来更新那些新(更换)的CPU/内存板.
-h显示此命令的帮助信息.
要激活更新的OpenBootPROM,需要关闭并重新打开系统的电源.
注–flashupdate不能检索带安全保护(用户ID/密码)的HTTPURL闪存映像.
尽管文件可能存在,系统仍会返回以下格式的消息:flashupdate:failed,URLdoesnotcontainrequiredfile:flashupdate:文件.
注意–切勿中断flashupdate操作.
如果异常终止flashupdate命令,SC将进入单用模式,并且只能从串行端口进行访问.
第11章固件升级过程111注意–执行flashupdate之前,应使用showboards-pversion命令检查系统内各板的固件版本.
如果所有板上的版本不同,则必须将它们更新为同一版本.
注意–如要更新SC应用程序(scapp)或RTOS,请从运行于串行连接之上的LOMshell中运行flashupdate命令,以便完全监控运行结果.
注意–更新CPU/内存板或I/O部件之前,请确保使用poweron命令打开所有要更新的板的电源.
使用flashupdate命令将SunFireV1280或Netra1280系统的固件版本从5.
13.
x升级到5.
17.
01.
升级SC上的固件:2.
打开所有板的电源:3.
升级系统板上的固件:此步骤会将sb0、sb2、sb4和IB6升级到与系统控制器相同的固件级别.
4.
退出Solaris操作系统.
5.
关闭系统电源.
6.
打开系统电源.
lom>flashupdate-furlrtosscapplom>poweronalllom>flashupdate-furlsb0sb2sb4ib6112SunFire入门级中型系统管理指南2006年4月使用flashupdate命令将运行固件版本5.
17.
x、5.
18.
x或5.
19.
x的SunFireE2900、SunFireV1280或Netra1280系统升级到5.
20.
01.
打开所有板的电源:2.
升级SC上的固件:此步骤会将CPU/内存板、IB6和系统控制器升级到相同的固件级别.
3.
退出Solaris操作系统.
4.
关闭系统电源.
5.
打开系统电源.
使用flashupdate命令将运行固件版本5.
17.
x的SunFireV1280或Netra1280系统降级到5.
13.
x1.
降级SC上的固件:2.
打开所有板的电源:3.
降级系统板上的固件:4.
退出Solaris操作系统.
5.
关闭系统电源.
6.
打开系统电源.
注–5.
13.
x固件不支持UltraSPARCIVCPU/内存板以及5.
17.
x、5.
18.
x、5.
19.
x或5.
20.
0固件中的任何新增功能.
lom>poweronalllom>flashupdate-fURLalllom>flashupdate-fURLscapprtoslom>poweronalllom>flashupdate-fURLsb0sb2sb4ib6第11章固件升级过程113使用flashupdate命令将运行固件版本5.
18.
x、5.
19.
x或5.
20.
0的SunFireE2900、SunFireV1280或Netra1280系统降级到5.
17.
x1.
打开所有板的电源:2.
降级SC上的固件:此步骤会将CPU/内存板、IB6和系统控制器降级到相同的固件级别.
3.
退出Solaris操作系统.
4.
关闭系统电源.
5.
打开系统电源.
注–Netra1290服务器要求使用的固件版本最低为5.
20.
0.
中型固件的早期版本不支持Netra1290的基本功能.
使用lom–G命令共有四种映像类型可能需要使用这种方式传输,这四种映像类型的名称格式如下:lw8pci.
flash(包含I/O板本地POST)lw8cpu.
flash(包含CPU/内存板本地POST和OBP)sgrtos.
flash(包含LOM/SC实时操作系统)sgsc.
flash(包含LOM/SC固件)您必须将这些类型的映像放在适当的目录下,如/var/tmp目录,并在lom-G命令之后输入您要下载的文件的名称.
根据文件包含的标题信息,固件便可知道所升级的映像类型.
www.
sunsolve.
sun.
com网站以修补程序的形式提供了这些映像.
您可以从该网站下载这些映像,也可以向Sun服务代表订购.
lom>poweronalllom>flashupdate-fURLall114SunFire入门级中型系统管理指南2006年4月修补程序附带的README文件中包含有关安装这些新固件映像的详细说明.
请注意,您必须完全遵循说明进行操作,否则可能导致系统无法引导.
注意–切勿中断lom-G操作.
如果异常终止lom-G命令,SC将进入单用模式,并且只能从串行端口进行访问.
注意–执行lom-G之前,应使用showboards-pversion命令检查系统内各板的固件版本.
如果所有板上的版本不同,则必须将它们更新为同一版本.
注意–从运行于串行连接之上的Solaris控制台中运行lom-G命令,以便可以完全监控运行结果.
注意–更新CPU/内存板或I/O部件之前,请确保使用poweron命令打开所有要更新的板的电源.
示例下载lw8pci.
flash映像:代码示例11-1下载lw8pci.
flash映像#lom-Glw8pci.
flashThisprogramwillreplaceLOMfirmwarewithversion5.
17.
0AreyousureyouwanttocontinueEnter'C'andreturntoContinueoranythingelsetoTerminateCTransferring346kBimagetothesystemcontroller.
Thismaytakeseveralminutes.
Validatingimage.
.
.
346kBIOimagetransferred.
Programming/N0/IB6/FP0Comparingimageandflash#Imageandflasharedifferent,proceedingwithupdate.
Erasing.
.
.
.
.
.
DoneProgramming.
.
.
.
.
.
DoneVerifying.
.
.
.
.
.
DoneFriDec1208:20:42commandolom:/N0/IB6/FP0updatedwithversion5.
17.
012/12/2003.
第11章固件升级过程115下载lw8cpu.
flash映像:Dec1211:20:41commando-alw8:/N0/IB6/FP0updatedwithversion5.
17.
012/12/2003.
Firmwareupdatecomplete.
YoumustrebootSolaristoloadthenewfirmware.
代码示例11-2下载lw8cpu.
flash映像#lom-Glw8cpu.
flashThisprogramwillreplaceLOMfirmwarewithversion5.
17.
0AreyousureyouwanttocontinueEnter'C'andreturntoContinueoranythingelsetoTerminateCTransferring906kBimagetothesystemcontroller.
Thismaytakeseveralminutes.
Validatingimage.
.
.
#906kBCPUimagetransferred.
Programming/N0/SB0/FP0ComparingimageandflashImageandflasharedifferent,proceedingwithupdate.
ErasingDoneProgrammingDoneVerifyingDoneFriDec1208:23:43commandolom:/N0/SB0/FP0updatedwithversion5.
17.
012/12/2003.
Dec1211:23:42commando-alw8:/N0/SB0/FP0updatedwithversion5.
17.
012/12/2003.
Programming/N0/SB0/FP1ComparingimageandflashImageandflasharedifferent,proceedingwithupdate.
ErasingDoneProgrammingDoneVerifyingDoneFriDec1208:24:24commandolom:/N0/SB0/FP1updatedwithversion5.
17.
012/12/2003.
Dec1211:24:23commando-alw8:/N0/SB0/FP1updatedwithversion5.
17.
012/12/2003.
Programming/N0/SB2/FP0ComparingimageandflashImageandflasharedifferent,proceedingwithupdate.
ErasingDoneProgrammingDone代码示例11-1下载lw8pci.
flash映像(续)116SunFire入门级中型系统管理指南2006年4月VerifyingDoneFriDec1208:25:06commandolom:/N0/SB2/FP0updatedwithversion5.
17.
012/12/2003.
Dec1211:25:06commando-alw8:/N0/SB2/FP0updatedwithversion5.
17.
012/12/2003.
Programming/N0/SB2/FP1ComparingimageandflashImageandflasharedifferent,proceedingwithupdate.
ErasingDoneProgrammingDoneVerifyingDoneFriDec1208:25:48commandolom:/N0/SB2/FP1updatedwithversion5.
17.
012/12/2003.
Dec1211:25:48commando-alw8:/N0/SB2/FP1updatedwithversion5.
17.
012/12/2003.
Programming/N0/SB4/FP0ComparingimageandflashImageandflasharedifferent,proceedingwithupdate.
ErasingDoneProgrammingDoneVerifyingDoneFriDec1208:26:31commandolom:/N0/SB4/FP0updatedwithversion5.
17.
012/12/2003.
Dec1211:26:30commando-alw8:/N0/SB4/FP0updatedwithversion5.
17.
012/12/2003.
Programming/N0/SB4/FP1ComparingimageandflashImageandflasharedifferent,proceedingwithupdate.
ErasingDoneProgrammingDoneVerifyingDoneFriDec1208:27:11commandolom:/N0/SB4/FP1updatedwithversion5.
17.
012/12/2003.
Dec1211:27:10commando-alw8:/N0/SB4/FP1updatedwithversion5.
17.
012/12/2003.
Firmwareupdatecomplete.
YoumustrebootSolaristoloadthenewfirmware.
代码示例11-2下载lw8cpu.
flash映像(续)第11章固件升级过程117使用lom-G命令升级SunFireE2900、SunFireV1280或Netra1280系统的固件将固件从5.
13.
x更新到5.
17.
x、5.
18.
x、5.
19.
x或5.
20.
0时,可以使用相同的升级过程.
1.
升级SC上的固件:请确保同时使用选定版本中的两个软件包(sgrtos.
flash和sgsc.
flash)对SC进行升级之后,再继续进行下一步操作.
这两个软件包彼此匹配成对,互相需要.
2.
退回到lom>并重置SC:3.
升级系统板上的固件:4.
退出Solaris操作系统.
5.
关闭系统电源.
6.
打开系统电源.
#lom-Gsgrtos.
flash#lom-Gsgsc.
flashlom>resetsc-y#lom-Glw8cpu.
flash#lom-Glw8pci.
flash118SunFire入门级中型系统管理指南2006年4月使用lom-G命令降级SunFireE2900、SunFireV1280或Netra1280系统的固件将固件从5.
20.
0、5.
19.
x或5.
18.
x降级到5.
17.
x或5.
13.
x时,可以使用相同的降级过程.
注–5.
13.
x固件不支持UltraSPARCIVCPU/内存板以及5.
17.
x、5.
18.
x、5.
19.
x或5.
20.
0固件中的任何新增功能.
Netra1290服务器要求使用的固件版本最低为5.
20.
0.
中型固件的早期版本不支持Netra1290的基本功能.
1.
降级SC上的固件:2.
退回到lom>并重置SC:3.
降级其他板上的固件:4.
退出Solaris操作系统.
5.
关闭系统电源.
6.
打开系统电源.
#lom-Gsgsc.
flash#lom-Gsgrtos.
flashlom>resetsc-y#lom-Glw8cpu.
flash#lom-Glw8pci.
flash119'第12章CPU/内存板更换和动态重新配置(DR)本章介绍如何对SunFire入门级中型系统上的CPU/内存板进行动态重新配置.
本章包括下列主题:第119页的"动态重新配置"第126页的"命令行界面"第134页的"故障排除"动态重新配置动态重新配置(DR)软件是Solaris操作系统的一部分.
通过DR软件,您可以在运行Solaris操作系统的同时动态重新配置系统板以及安全地拆除和安装系统板,而且几乎不会中断正在系统上运行的用户进程.
您可以使用DR来执行以下操作:安装或拆除板时,尽可能缩短系统应用程序的中断时间.
删除可能出现故障的设备,以防此故障造成操作系统崩溃.
显示板的操作状态.
可在系统保持运行的同时启动板的系统测试.
命令行界面Solariscfgadm(1M)命令提供了用于管理DR功能的命令行界面.
120SunFire入门级中型系统管理指南2006年4月DR概念静止在取消配置具有持久性内存(OpenBootPROM或核心内存)的系统板期间,操作系统会暂停一段时间,这就是所谓的操作系统静止.
底板上的所有操作系统和设备活动在此操作的关键阶段均必须停止.
注–静止状态可能会持续数分钟,这取决于工作负载和系统配置.
进入静止状态之前,操作系统必须临时暂停所有的进程、CPU和设备活动.
系统可能需要数分钟才能进入静止状态,这取决于系统的使用情况和当前正在进行的活动.
如果不能进入静止状态,则操作系统会显示原因,这些原因可能包括:某一执行线程未暂停.
实时进程正在运行.
存在操作系统无法暂停的设备.
导致进程未能暂停的情况一般是临时性的.
请仔细分析出现故障的原因.
如果操作系统遇到的问题是临时性的-未能暂停进程-您可以稍后再试.
RPC或TCP超时或连接丢失缺省的超时间隔为两分钟.
管理员可能需要增加这一超时值,以免由DR软件所导致的操作系统静止过程会出现超时,因为此过程花费的时间可能多于两分钟.
系统停止将使系统和相关网络服务在一段时间内均不能使用,这段时间可能超过两分钟.
这些更改既会影响客户机也会影响服务器.
Suspend-Safe和Suspend-Unsafe设备当DR软件暂停操作系统时,所有与操作系统连接的设备驱动程序也必须暂停.
如果某个驱动程序无法暂停(或暂停后又恢复运行),则DR操作失败了.
suspend-safe设备在操作系统处于静止状态时不会访问内存或中断系统.
如果某一驱动程序支持操作系统静止(暂停/恢复运行),则说它是Suspend-Safe驱动程序,即它在暂停期间是安全的.
Suspend-Safe驱动程序还保证在系统成功完成暂停请求后,它所管理的设备仍不会试图访问内存,即使之前在执行暂停请求时此设备处于打开状态.
suspend-unsafe设备是指在操作系统处于静止状态期间,仍允许访问内存或中断系统的设备.
第12章CPU/内存板更换和动态重新配置(DR)121连接点连接点是板及其插槽的总称.
DR可以显示插槽、板和连接点的状态.
板的DR定义还包括与其连接的设备,所以术语插卡是指板及其连接设备的组合.
插槽(也称为"插口")可使插卡与主机计算机之间实现电气隔离,即本软件可以将单个插槽置于低功率模式.
插口可根据插槽的编号来命名,也可以使用匿名(例如:SCSI链).
要获得所有可用逻辑连接点的列表,请运行带-l选项的cfgadm(1M)命令.
连接点有两种格式:物理连接点描述软件驱动程序和插槽的位置.
下面是物理连接点名称的实例:其中逻辑连接点是系统为引用物理连接点而创建的缩写名.
逻辑连接点的格式以下:注-cfgadm命令还会显示I/O部件N0.
IB6,但由于此连接点不是冗余的,因此不允许在其上执行任何DR操作.
DR操作DR操作主要有四种类型:/devices/ssm@0,0:N0.
SBxN0是指节点0(零)SB是指系统板x是指插槽编号.
系统板的插槽编号可以为0、2或4N0.
SBx表12-1DR操作类型类型说明连接插槽为板提供电源并监视其温度.
配置操作系统为板分配功能角色,为板装入设备驱动程序,并使该板上的设备可供Solaris操作系统使用.
取消配置系统以逻辑方式将板与操作系统分离.
环境监视可继续进行,但系统不可以使用该板的设备.
断开连接系统停止监视此板,并关闭插槽的电源.
122SunFire入门级中型系统管理指南2006年4月如果某系统板正在使用中,请先停止使用此板并断开其与系统的连接,然后再关闭其电源.
插入新的或升级的系统板并接通其电源后,请连接此板的连接点,并对其作相应的配置,使其可供操作系统使用.
cfgadm(1M)命令可以通过单个命令来进行连接和配置(或取消配置和断开连接),但是如有必要,也可单独执行每项操作(连接、配置、取消配置或断开连接).
热插拔硬件热插拔设备具有特殊的连接器,这些连接器在接通数据管脚之前即为板或模块提供电源.
系统正在运行时,可以插入和取出具有热插拔连接器的板和设备.
这些设备设有控制电路,以确保它们在插入过程中具有共同的参考基准和电源控制.
板就位后,SC会指示系统向接口供电.
SunFire入门级中型系统中使用的CPU/内存板是热插拔设备.
情况和状况状况是指插口(插槽)或插卡(板)的操作状态.
情况是指连接点的操作状态.
在系统中对板或组件进行DR操作之前,您必须先确定它们的状况和情况.
运行带-la选项的cfgadm(1M)命令可以显示每个组件的类型、状况和情况,以及系统中每个板插槽的状况和情况.
有关组件类型的列表,请参见第124页的"组件类型"一节.
板状况和情况本节介绍CPU/内存板(也称为"系统插槽")的状况和情况.
板插口状况板可以有三种插口状况:empty(空置)、disconnected(已断开连接)或connected(已连接).
当插入板时,插口状况将从empty变为disconnected.
当拆除板时,插口状况将从disconnected变为empty.
注意–无论是物理拆除处于connected状况的板,还是拆除已打开电源但处于disconnected状况的板,均可能造成操作系统崩溃,并导致系统板的持久性损坏.
第12章CPU/内存板更换和动态重新配置(DR)123板插卡状况板可以有两种插卡状况:configured(已配置)或unconfigured(已取消配置).
disconnected板的插卡状况始终为unconfigured.
板情况板可以有四种情况:unknown(未知)、ok(正常)、failed(失败)或unusable(不可用).
表12-2板插口状况名称说明empty板不存在.
disconnected板与系统总线的连接断开.
板在未关闭电源的情况下可处于disconnected状况.
但是从插槽中拆除板之前,该板必须已经关闭电源且处于disconnected状况.
connected已打开板的电源且已将之连接到系统总线上.
只有板处于connected状况时,您才能查看板上的组件.
表12-3板插卡状况名称说明configured板上至少配置了一个组件.
unconfigured已取消配置板上的所有组件.
表12-4板情况名称说明unknown板尚未经过测试.
ok板运行正常.
failed板测试失败.
unusable板插槽不可用.
124SunFire入门级中型系统管理指南2006年4月组件状况和情况本节介绍组件的状况和情况.
组件插口状况组件不能单独连接或断开连接.
因此,它们仅能有一种状况:connected(已连接).
组件插卡状况组件可以有两种插卡状况:configured(已配置)或unconfigured(已取消配置).
组件情况组件可以有三种情况:unknown(未知)、ok(正常)或failed(失败).
组件类型可以使用DR来配置或取消配置几种类型的组件.
表12-5组件插卡状况名称说明configured组件可供Solaris操作系统使用.
unconfigured组件不能供Solaris操作系统使用.
表12-6组件情况名称说明unknown组件尚未经过测试.
ok组件运行正常.
failed组件测试失败.
表12-7组件类型名称说明cpu单个CPUmemory板上的所有内存第12章CPU/内存板更换和动态重新配置(DR)125非持久性内存和持久性内存在删除一块板之前,操作系统必须腾出该板上的内存.
腾出板内存就是将板的非持久性内存刷新到交换区,而将板的持久性内存(即核心内存和OpenBootPROM内存)复制到其他内存板.
要重新定位持久性内存,就必须临时暂停系统中的操作系统或将其停止.
暂停的时间取决于系统配置和运行负载.
将板与持久性内存分离只能在操作系统处于暂停状态时进行;因此,您应知道持久性内存的位置,以免对系统操作造成严重影响.
您可以运行带-v选项的cfgadm(1M)命令来显示持久性内存.
如果板上存在持久性内存,则操作系统必须找到另一有足够容量的内存组件来接收此持久性内存.
如果找不到,则DR操作将失败.
限制内存交错如果系统内存交叉存储在多个CPU/内存板之间,则不能动态重新配置系统板.
重新配置持久性内存在系统外动态重新配置那些包含不可重定位(持久性)内存的CPU/内存板时,要求暂停所有域活动,此过程可能会延迟应用程序的响应时间.
一般情况下,这种情况适用于系统中的某个CPU/内存板.
板上内存由cfgadm-av命令产生的状态显示中的非零持久性内存大小来标识.
只有满足以下其中一个条件时,DR才支持将一块系统板的持久性内存重新配置到另一系统板:目标系统板具有与源系统板相同的内存容量.
目标系统板的内存大于源系统板的内存.
此情况下,可将更多的内存添加到可用内存池中.
126SunFire入门级中型系统管理指南2006年4月命令行界面本节介绍以下操作步骤:第126页的"cfgadm命令"第127页的"显示基本板状态"第127页的"显示详细板状态"第129页的"测试板和部件"第129页的"测试CPU/内存板"第131页的"安装新板"第132页的"热交换CPU/内存板"第133页的"从系统中拆除CPU/内存板"第133页的"临时断开CPU/内存板的连接"注–无需显式启用动态重新配置(DR).
缺省情况下,系统已启用DR.
cfgadm命令您可使用cfgadm(1M)命令对那些可动态重新配置的硬件资源执行配置管理操作.
表12-8列出了DR板状况.
表12-8系统控制器(SC)产生的DR板状况板状况说明Available插槽尚未分配.
Assigned板已分配,但尚未配置使用它的硬件.
板可由机箱端口重新分配和释放.
Active板已激活,正在使用中.
激活的板不能重新分配.
第12章CPU/内存板更换和动态重新配置(DR)127显示基本板状态cfgadm程序可以显示板和插槽的有关信息.
有关此命令的选项,请参见cfgadm(1)手册页.
许多操作都要求您指定系统板的名称.
要获得这些系统板名称,请键入:如果不使用选项,cfgadm命令将显示所有已知连接点的信息,包括板插槽和SCSI总线.
下面显示了该命令的典型输出.
显示详细板状态要获得更详细的状态报告,请使用cfgadm-av命令.
-a选项用于列出连接点,而-v选项用于启用详细描述.
代码示例12-2是由cfgadm-av命令生成的部分显示.
由于此显示中有很多行换行,因此输出看起来有点乱.
(此状态报告对应的系统与代码示例12-1使用的系统相同.
)图12-1提供了每一显示项目的详细信息.
#cfgadm代码示例12-1基本cfgadm命令的输出#cfgadmAp_IdTypeReceptacleOccupantConditionN0.
IB6PCI_I/O_BoaconnectedconfiguredokN0.
SB0CPU_BoardconnectedconfiguredunknownN0.
SB4unknownemptyunconfiguredunknownc0scsi-busconnectedconfiguredunknownc1scsi-busconnectedunconfiguredunknownc2scsi-busconnectedunconfiguredunknownc3scsi-busconnectedconfiguredunknown代码示例12-2cfgadm-av命令的输出#cfgadm-avAp-IdReceptacleOccupantConditionInformationWhenTypeBusyPhys_IdN0.
IB6connectedconfiguredokpowered-on,assignedApr318:04PCI_I/O_Boan/devices/ssm@0,0:N0.
IB6N0.
IB6::pci0connectedconfiguredokdevice/ssm@0,0/pci@19,70000128SunFire入门级中型系统管理指南2006年4月图12-1显示了代码示例12-2中显示内容的详细信息:图12-1cfgadm-av显示内容的详细信息Apr318:04ion/devices/ssm@0,0:N0.
IB6::pci0N0.
IB6::pci1connectedconfiguredokdevice/ssm@0,0/pci@19,600000Apr318:04ion/devices/ssm@0,0:N0.
IB6::pci1N0.
IB6::pci2connectedconfiguredokdevice/ssm@0,0/pci@18,700000Apr318:04ion/devices/ssm@0,0:N0.
IB6::pci2N0.
IB6::pci3connectedconfiguredokdevice/ssm@0,0/pci@18,600000Apr318:04ion/devices/ssm@0,0:N0.
IB6::pci3N0.
SB0connectedconfiguredunknownpowered-on,assignedApr318:04CPU_Boardn/devices/ssm@0,0:N0.
SB0N0.
SB0::cpu0connectedconfiguredokcpuid0,speed750MHz,ecache8MBytesApr318:04cpun/devices/ssm@0,0:N0.
SB0::cpu0N0.
SB0::cpu1connectedconfiguredokcpuid1,speed750MHz,ecache8MBytesApr318:04cpun/devices/ssm@0,0:N0.
SB0::cpu1N0.
SB0::cpu2connectedconfiguredokcpuid2,speed750MHz,ecache8MBytesApr318:04cpun/devices/ssm@0,0:N0.
SB0::cpu2代码示例12-2cfgadm-av命令的输出(续)N0.
IB6connectedconfiguredokpowered-on,assignedApr318:04PCI_I/O_Boan/devices/ssm@0,0:N0.
IB6连接点ID插卡状况情况板/组件信息连接时间板/组件类型繁忙状况物理ID和位置插口状况第12章CPU/内存板更换和动态重新配置(DR)129命令选项表12-9列出了cfgadm-c命令的选项.
表12-10列出了cfgadm-x命令提供的选项.
cfgadm_sbd手册页提供了有关cfgadm-c和cfgadm-x选项的其他信息.
sbd库通过cfgadm结构提供sbd类别的热插拔系统板的功能.
测试板和部件测试CPU/内存板测试CPU/内存板之前,必须先打开其电源然后断开连接.
如果不能满足这些条件,则板测试将会失败.
1.
以超级用户的身份键入Solariscfgadm命令来测试CPU/内存板:表12-9cfgadm-c命令选项cfgadm-c选项功能connect插槽为板提供电源,且系统开始监视板.
如果插槽先前未被分配,则现在进行分配.
disconnect系统停止监视此板,并关闭插槽的电源.
configure操作系统为板分配功能角色,并为板及其连接的设备装入设备驱动程序.
unconfigure系统以逻辑方式将板与操作系统分离,并使相关的设备驱动程序脱机.
环境监视可继续进行,但系统不可以使用该板的设备.
表12-10cfgadm-x命令选项cfgadm-x选项功能poweron打开CPU/内存板的电源.
poweroff关闭CPU/内存板的电源.
#cfgadm-tap-id130SunFire入门级中型系统管理指南2006年4月要更改cfgadm运行的诊断级别,请为cfgadm命令提供以下所示的诊断级别:其中level级别是诊断级别ap-id为下列选项之一:N0.
SB0、N0.
SB2或N0.
SB4.
如果您不提供级别,则会使用诊断级别init.
诊断级别包括:#cfgadm-oplatform=diag=level-tap-id表12-11诊断级别诊断级别说明init只运行系统板初始化代码.
不进行任何测试.
这种方式将快速通过POST.
quick使用少数测试模式对所有系统板组件进行少量的测试.
min所有系统板组件的核心功能都会得到测试.
该测试对接受测试的设备进行快速状态检查.
default使用所有测试模式对除内存和Ecache模块以外的所有系统板组件进行全面测试.
请注意,max和default的定义相同(而且,default不是缺省值).
max使用所有测试模式对除内存和Ecache模块以外的所有系统板组件进行全面测试.
请注意,max和default的定义相同.
mem1以default级别运行所有测试并运行更为详尽的DRAM和SRAM测试算法.
对于内存和Ecache模块,则使用多种模式对所有存储单元进行测试.
此级别不运行规模较大且耗时的算法.
mem2与mem1大致相同,只不过多了一项DRAM测试,这项测试对DRAM数据进行了显式的比较.
第12章CPU/内存板更换和动态重新配置(DR)131安装或更换CPU/内存板注意–物理板更换只能由合格的维修人员执行.
安装新板注意–有关物理拆除和更换CPU/内存板的详细信息,请参见《SunFireE2900SystemServiceManual》或《SunFireV1280/Netra1280ServiceManual》.
请严格遵守所述的过程,否则可能会损坏系统板和其他组件.
注–在更换板时,有时需要填充面板.
如果您不知道如何将板插入系统,请先阅读《SunFireE2900SystemServiceManual》或《SunFireV1280/Netra1280ServiceManual》,然后执行本过程.
1.
戴上接地腕带,并正确接地.
2.
找到空插槽后,从中取出系统板填充面板.
3.
您应在一分钟内将板插入插槽,以防系统过热.
有关板插入操作过程的详细步骤,请参见《SunFireE2900SystemServiceManual》或《SunFireV1280/Netra1280ServiceManual》.
4.
使用cfgadm-cconfigure命令打开该板的电源、测试和配置该板:其中ap-id为下列选项之一:N0.
SB0、N0.
SB2或N0.
SB4.
#cfgadm-cconfigureap-id132SunFire入门级中型系统管理指南2006年4月热交换CPU/内存板注意–有关物理拆除和更换板的详细信息,请参见《SunFireE2900SystemServiceManual》或《SunFireV1280/Netra1280ServiceManual》.
请严格遵守所述的过程,否则可能会损坏系统板和其他组件.
1.
戴上接地腕带,并正确接地.
2.
使用cfgadm命令关闭板的电源.
其中ap-id为下列选项之一:N0.
SB0、N0.
SB2或N0.
SB4.
此命令将从Solaris操作系统及OpenBootPROM中删除相关资源,并关闭板的电源.
3.
确认Power(电源)和HotplugOK(热插拔正常)LED指示灯的状况.
在CPU/内存板冷却期间,绿色PowerLED指示灯会快速闪烁.
只有在绿色PowerLED指示灯熄灭且琥珀色HotplugOKLED指示灯亮起时,才可以从系统中拆除板.
4.
拆除硬件并安装CPU/内存板.
有关详细信息,请参见《SunFireE2900SystemServiceManual》或《SunFireV1280/Netra1280ServiceManual》.
5.
拆除并装好板后,使用Solaris动态重新配置命令cfgadm将板放回Solaris操作系统.
其中ap-id为下列选项之一:N0.
SB0、N0.
SB2或N0.
SB4.
此命令将打开板的电源,测试、连接该板,并将该板的所有资源放回Solaris操作系统.
6.
验证绿色PowerLED指示灯是否亮起.
#cfgadm-cdisconnectap-id#cfgadm-cconfigureap-id第12章CPU/内存板更换和动态重新配置(DR)133从系统中拆除CPU/内存板注–执行本过程之前,请确保您已准备好系统板填充面板,以便替换您要拆除的系统板.
系统板填充面板是一块带有插槽的金属板,它可以促进冷空气的循环,从而加快冷却速度.
1.
使用cfgadm-cdisconnect命令从系统中逻辑断开CPU/内存板并关闭其电源.
其中ap-id为下列选项之一:N0.
SB0、N0.
SB2或N0.
SB4.
注意–有关物理拆除和更换板的详细信息,请参见《SunFireE2900SystemServiceManual》或《SunFireV1280/Netra1280ServiceManual》.
请严格遵守所述的过程,否则可能会损坏系统板和其他组件.
2.
从系统中拆除CPU/内存板.
有关拆除板的详细步骤,请参阅《SunFireE2900SystemServiceManual》或《SunFireV1280/Netra1280ServiceManual》.
3.
在拆除CPU/内存板后一分钟内将系统板填充面板插入相应的插槽,以防系统过热.
临时断开CPU/内存板的连接您可以使用DR软件关闭板的电源并将其保留在原来的位置.
例如,在CPU/内存板出现故障时,但没有合适的替换板或系统板填充面板,您可能需要这样做.
使用cfgadm-cdisconnect命令逻辑断开CPU/内存板并关闭其电源.
其中ap-id为下列选项之一:N0.
SB0、N0.
SB2或N0.
SB4.
#cfgadm-cdisconnectap-id#cfgadm-cdisconnectap-id134SunFire入门级中型系统管理指南2006年4月故障排除本节介绍常见的故障类型:取消配置操作故障配置操作故障下面是cfgadm诊断消息的实例.
(其中不包括语法错误消息.
)有关其他错误消息的详细信息,请参见以下手册页:cfgadm(1M)、cfgadm_sbd(1M)和config_admin(3X).
CPU/内存板取消配置故障取消配置CPU/内存板时,如果系统未处于正确的状况,则取消配置操作将会失败.
在试图取消配置板之前,板上的内存交叉存储于多块板上.
试图取消配置CPU之前,某进程已绑定到该CPU.
试图取消配置某个系统板上的CPU之前,该板上的内存仍处于已配置状态.
板上的内存处于已配置状态(使用中).
请参见第135页的"无法取消配置具有持久性内存的板上的内存".
板上的CPU不能脱机.
请参见第136页的"无法取消配置CPU".
无法取消配置其内存交叉存储于多块板上的板如果您所试图取消配置的系统板内存交叉存储于多块系统板上,则系统将显示以下错误消息:cfgadm:hardwarecomponentisbusy,tryagaincfgadm:operation:Dataerror:error_textcfgadm:operation:Hardwarespecificfailure:error_textcfgadm:operation:Insufficientprivilegescfgadm:operation:Operationrequiresaserviceinterruptioncfgadm:Systemisbusy,tryagainWARNING:Processornumbernumberfailedtooffline.
cfgadm:Hardwarespecificfailure:unconfigureN0.
SB2::memory:Memoryisinterleavedacrossboards:/ssm@0,0/memory-controller@b,400000第12章CPU/内存板更换和动态重新配置(DR)135无法取消配置已绑定某进程的CPU如果您试图取消配置已绑定某进程的CPU,则系统将显示以下错误消息:从CPU取消绑定该进程,然后重试取消配置操作.
无法在取消配置所有内存之前取消配置CPU试图取消配置CPU之前,必须先取消配置系统板上的所有内存.
如果您在未取消配置该板上的所有内存之前试图取消配置CPU,系统将显示以下错误消息:先取消配置该板上的所有内存,然后再取消配置CPU.
无法取消配置具有持久性内存的板上的内存要取消配置具有持久性内存的板上的内存,需将其持久性内存页转移到另一块板上,且后者必须有足够的可用内存,以便容纳这些持久性内存页.
开始取消配置操作之前,此类附加板必须处于可用状态.
无法重新配置内存如果取消配置操作失败,且出现以下的错误消息,则无法取消配置该板上的内存:在另一块板上添加足够的内存,以便容纳这些持久性内存页,然后再次执行取消配置操作.
要确认内存页是否能够转移,请使用cfgadm命令的详情选项,并在列表中查找permanent字样:cfgadm:Hardwarespecificfailure:unconfigureN0.
SB2::cpu3:Failedtooff-line:/ssm@0,0/SUNW,UltraSPARC-IIIcfgadm:Hardwarespecificfailure:unconfigureN0.
SB2::cpu0:Can'tunconfigcpuifmemonline:/ssm@0,0/memory-controllercfgadm:Hardwarespecificfailure:unconfigureN0.
SB0:Noavailablememorytarget:/ssm@0,0/memory-controller@3,400000#cfgadm-av-s"select=type(memory)"136SunFire入门级中型系统管理指南2006年4月没有足够的可用内存如果取消配置失败,且出现以下任何一条消息,则表示如果拆除该板,系统将没有足够的可用内存:减少系统中的内存负载,然后重试.
如果可行,则在另一块板插槽中安装更多内存.
内存需求增加如果取消配置失败并出现以下消息,表示在取消配置操作期间内存需求增加了:减少系统中的内存负载,然后重试.
无法取消配置CPU取消配置CPU是CPU/内存板取消配置过程的一部分.
如果取消配置操作不能使CPU进入脱机状态,则系统将把以下消息记录到控制台上:导致此故障的原因包括:CPU已绑定某进程.
此CPU是CPU集中的最后一个CPU.
此CPU是系统中最后一个联机CPU.
无法断开板的连接取消配置某个板后,可能会出现无法断开该板连接的情况.
cfgadm状态显示会将该板列为不可分离的.
如果该板正在提供重要的硬件服务且此服务不能被重新定位到备用板,则会出现此问题.
cfgadm:Hardwarespecificfailure:unconfigureN0.
SB0:Insufficientmemorycfgadm:Hardwarespecificfailure:unconfigureN0.
SB0:Memoryoperationfailedcfgadm:Hardwarespecificfailure:unconfigureN0.
SB0:MemoryoperationrefusedWARNING:Processornumberfailedtooffline.
第12章CPU/内存板更换和动态重新配置(DR)137CPU/内存板配置故障无法同时配置CPU0和CPU1配置CPU0或CPU1之前,请确保已取消配置另一个CPU.
取消配置CPU0和CPU1之后,即可配置它们.
板上的CPU必须在配置内存之前配置配置内存之前,必须先配置系统板上的所有CPU.
如果您在未配置一个或多个CPU时配置内存,系统将显示以下错误消息:cfgadm:Hardwarespecificfailure:configureN0.
SB2::memory:Can'tconfigmemoryifnotallcpusareonline:/ssm@0,0/memorycontroller138SunFire入门级中型系统管理指南2006年4月139附录A了解监视器定时器应用程序模式本附录介绍有关Netra1280或Netra1290服务器监视器定时器应用程序模式的信息.
应用程序模式允许您:配置监视器定时器-在主机上运行的应用程序可以配置并使用监视器定时器,从而使您可以检测到应用程序中的致命问题并自动进行恢复.
对报警3进行编程-这使您能够在应用程序发生重要问题时生成此报警.
本附录包含以下几个小节.
通过它们,您可以了解如何配置并使用监视器定时器以及如何对报警3进行编程.
了解监视器定时器应用程序模式使用ntwdt驱动程序了解用户API设置超时间隔启用或禁用监视器重置,或复位监视器获取监视器定时器的状况查找和定义数据结构使用监视器程序范例对报警3进行编程了解错误消息了解不支持的特性和限制注–一旦应用程序监视器定时器处于使用状态,必须重新引导Solaris操作系统,以便返回到缺省的(非可编程)监视器定时器和缺省的LED指示灯行为(非报警3).
140SunFire入门级中型系统管理指南2006年4月了解监视器定时器应用程序模式监视程序机制可检测到系统挂起,或者应用程序挂起或崩溃这样的情况.
监视程序是一种计时器,只要操作系统和用户应用程序在运行,它就一直由用户应用程序来重置.
当应用程序重置应用程序监视器时,以下原因可导致监视器过期:正在重置的应用程序出现崩溃应用程序中正在重置的线程挂起或崩溃系统挂起当系统监视器正在运行时,系统挂起,或者更具体地说,时钟中断处理程序挂起会导致过期.
系统监视器模式为缺省设置.
如果未初始化使用应用程序监视器,则系统会使用系统监视器模式.
setupsc命令(SCLightOutManagement上的现有命令)只可用于配置系统监视器的恢复:lom>setupsc系统控制器配置应如下所示:如果启用了HostWatchdog,并且LogResetData设置为true,则系统控制器会在重置系统之前,将有关每个CPU当前状态的数据发送到控制台.
这样,如果记录控制台数据,则系统状态数据将得以保留.
其输出格式与手动转储挂起的系统的CPU状态数据时(即,如果禁用了HostWatchdog)showresetstate命令使用的格式相同.
如果将VerboseResetData设置为true,则会控制系统控制器向控制台发送的信息量.
启用此选项后,其生成的结果与使用showresetstate-v命令生成的结果相同.
使用发送到ntwdt驱动程序的输入/输出控制代码(IOCTL)可以设置应用程序监视器的恢复配置.
SCPOSTdiagLevel[off]:HostWatchdog[enabled]:LogResetData[true]:VerboseResetData[true]:RockerSwitch[enabled]:SecureMode[off]:PROCRTUsinstalled:0PROCHeadroomquantity(0todisable,4MAX)[0]:附录A了解监视器定时器应用程序模式141使用ntwdt驱动程序要使用新的应用程序监视器特性,您必须安装ntwdt驱动程序.
要启用和控制监视器的应用程序模式,您必须使用"了解用户API"一节中所描述的LOMIOCDOGxxxIOCTL对监视器系统进行编程.
如果ntwdt驱动程序(与系统控制器相反)在应用程序监视器过期时重置Solaris操作系统,则在ntwdt驱动程序的配置文件(ntwdt.
conf)中会使用以下属性值:ntwdt-boottimeout="600";如果发生紧急情况,或者应用程序监视器过期,则ntwdt驱动程序会重新编程监视器超时,将其设为该属性中指定的值.
指定的代表持续时间的值,要比重新引导并执行故障转储所花时间长.
如果指定的值不够大,SC就会在启用重置时对主机进行重置.
注-由SC进行的重置仅会出现一次.
了解用户APIntwdt驱动程序通过使用IOCTL来提供应用程序编程接口.
在发出监视器ioctl之前,您必须先打开/dev/ntwdt设备节点.
注–在/dev/ntwdt上只允许打开一个open()实例,多个open()实例将会生成以下错误消息:EAGAIN-Thedriverisbusy,tryagain.
您可以将下列IOCTL用于监视器定时器:LOMIOCDOGTIMELOMIOCDOGCTLLOMIOCDOGPATLOMIOCDOGSTATELOMIOCALCTLLOMIOCALSTATE142SunFire入门级中型系统管理指南2006年4月设置超时间隔LOMIOCDOGTIMEIOCTL可用于设置监视器的超时间隔.
此IOCTL用其指定的时间对监视器硬件进行编程.
必须在尝试启用监视器定时器(LOMIOCDOGCTL)之前先设置超时间隔(LOMIOCDOGTIME).
该参数为指向无符号整数的指针.
此整数存储着以秒为单位的新监视器超时间隔.
您可以指定从1秒到180分钟的任意超时间隔.
如果启用了监视器功能,则系统会立即重置超时间隔,以使该新值生效.
如果超时间隔小于1秒或者大于180分钟,则系统会显示错误(EINVAL).
注–LOMIOCDOGTIME不针对于常规使用.
如果将监视器超时设置得过低,则可能会导致系统在启用监视器和重置功能时发生硬件重置.
如果将超时设置得过低,则用户应用程序必须拥有更高的优先级(例如,作为实时线程)才能正常运行,而且必须更频繁地重置,以避免不小心过期.
启用或禁用监视器LOMIOCDOGCTLIOCTL可启用或禁用监视器,还可启用或禁用重置功能.
(有关监视器定时器的正确值,请参阅第143页的"查找和定义数据结构".
)该参数为指向lom_dogctl_t结构的指针(在第143页的"查找和定义数据结构"中有更详细的介绍).
使用reset_enable成员可启用或禁用系统重置功能.
使用dog_enable成员可启用或禁用监视器功能.
如果禁用监视器但启用重置,会系统显示错误(EINVAL).
注–如果在此IOCTL前还未发出LOMIOCDOGTIME以设置超时间隔,则硬件中不会启用监视器功能.
重置,或复位监视器LOMIOCDOGPATIOCTL重置或复位监视器,使得监视器重新开始计时,即从LOMIOCDOGTIME指定的值开始.
此IOCTL不需要参数.
如果启用了监视器,则此IOCTL必须按固定的间隔时间使用,而且此间隔时间要小于监视器超时,否则监视器就会过期.
附录A了解监视器定时器应用程序模式143获取监视器定时器的状况LOMIOCDOGSTATEIOCTL获取监视器和重置功能的状况,并检索监视器的当前超时间隔.
如果在此IOCTL之前还未发出LOMIOCDOGSTATE以设置超时间隔,则在硬件中不会启用该监视器.
该参数为指向lom_dogstate_t结构的指针(在第143页的"查找和定义数据结构"中有更详细的介绍).
其结构成员用于存储监视器重置电路的当前状况和当前监视超时间隔.
注-这不是在监视器触发之前的剩余时间.
LOMIOCDOGSTATEIOCTL仅要求能够成功调用open()即可.
在调用open()之后,此IOCTL可以运行任意次数,并且不需要先执行任何其他的DOGIOCTL.
查找和定义数据结构所有数据结构和ioctl都是在SUNWlomu软件包内的lom_io.
h中定义的.
监视器定时器的数据结构如下所示:1.
监视器/重置状况数据结构如下所示:2.
监视器/重置控制数据结构如下所示:代码示例A-1监视器/重置状况数据结构typedefstruct{intreset_enable;/*resetenabledifnon-zero*/intdog_enable;/*watchdogenabledifnon-zero*/uint_tdog_timeout;/*Currentwatchdogtimeout*/}lom_dogstate_t;代码示例A-2监视器/重置控制数据结构typedefstruct{intreset_enable;/*resetenabledifnon-zero*/intdog_enable;/*watchdogenabledifnon-zero*/}lom_dogctl_t;144SunFire入门级中型系统管理指南2006年4月使用监视器程序范例下面介绍一个监视器定时器程序的范例.
代码示例A-3监视器实例#include"sys/types.
h"#include"lom_io.
h"#include"fnctl.
h"#include"unistd.
h"#include"sys/stat.
h"intmain(){uint_ttimeout=30;/*30seconds*/lom_dogctl_tdogctl;intfd;dogctl.
reset_enable=1;dogctl.
dog_enable=1;fd=open("/dev/ntwdt",O_EXCL);/*Settimeout*/ioctl(fd,LOMIOCDOGTIME,(void*)&timeout);/*Enablewatchdog*/ioctl(fd,LOMIOCDOGCTL,(void*)&dogctl);/*Keeppatting*/While(1){ioctl(fd,LOMIOCDOGPAT,NULL);sleep(5);}return(0);}附录A了解监视器定时器应用程序模式145对报警3进行编程无论监视器模式为何,Solaris操作系统用户均可使用报警3.
报警3或系统报警开启与关闭已被重新定义(请参见下表).
使用LOMIOCALCTLIOCTL可设置报警3的值.
您可以像设置与清除报警1和报警2那样对报警3进行编程.
下表列出了报警3的行为:汇总表中的数据:报警3开启=中继(COM->NC),系统LED指示灯关闭报警3关闭=中继(COM->NO),系统LED指示灯开启在编程后,您可以用showalarm命令和参数system检查报警3或系统报警.
例如:与LOMIOCALCTL和LOMIOCALSTATEIOCTL一起使用的数据结构如下所示:表A-1报警3的行为报警3中继系统LED指示灯(绿色)关闭电源开启COM->NC关闭打开电源/LOM开启开启COM->NC关闭Solaris正在运行关闭COM->NO开启Solaris不在运行开启COM->NC关闭主机WDT过期开启COM->NC关闭用户设置为"开启"开启COM->NC关闭用户设置为"关闭"关闭COM->NO开启sc>showalarmsystemsystemalarmison代码示例A-4LOMIOCALCTL和LOMIOCALSTATEIOCTL数据结构#include#defineALARM_NUM_11#defineALARM_NUM_22#defineALARM_NUM_33146SunFire入门级中型系统管理指南2006年4月了解错误消息下面是可能显示的错误消息以及它们的含义.
EAGAIN如果您试图在/dev/ntwdt上打开多个open()实例,就会显示此错误消息.
EFAULT如果指定的用户空间地址有误,则系统会显示此错误消息.
EINVAL如果请求的控制命令不存在或者提供的参数无效,则系统会显示此错误消息.
EINTR如果正在等待组件状况更改的线程中断了,则系统会显示此错误消息.
ENXIO如果系统未安装驱动程序,则会显示此错误消息.
#defineALARM_OFF0#defineALARM_ON1typedefstruct{intalarm_no;intalarm_state;}lom_aldata_t;代码示例A-4LOMIOCALCTL和LOMIOCALSTATEIOCTL数据结构(续)附录A了解监视器定时器应用程序模式147了解不支持的特性和限制1.
如果SC检测到监视器定时器过期,则系统仅有一次尝试恢复的机会,如果第一次尝试未能恢复该域,则不会进行进一步的恢复尝试.
2.
如果您已启用应用程序监视器,并且是在系统控制器的lom提示符下发出break命令而进入OpenBootPROM(OBP)的,则SC会自动禁用该监视器定时器.
注–SC会显示一条控制台消息,提醒您从SC的角度,该监视器已被禁用.
但是,当您重新进入Solaris操作系统时,从Solaris操作系统的角度看,该监视器仍处于启用状态.
要让SC和Solaris操作系统看到同样的监视器状况,您必须使用监视器应用程序来启用或禁用监视器.
3.
如果您要执行动态重配置(DR)操作,即删除包含内核(持久性)内存的系统板的操作,则在执行DR操作之前,您必须先禁用监视器定时器的应用程序模式,并在执行DR操作之后启用它.
这是必不可少的,原因是Solaris软件在对持久性内存执行内存删除期间会停止所有的系统I/O并禁用所有中断.
结果,系统控制器固件和Solaris软件在执行DR操作期间无法进行通信.
注-此局限性既不影响动态增加内存,也不影响删除不包含持久性内存的板.
在这些情况下,监视器定时器的应用程序模式可以和DR实现并存运行.
您可以执行以下命令来定位包含内核(持久性)内存的系统板:sh>cfgadm-lav|grep-ipermanent4.
如果Solaris操作系统在下列情况下挂起,则系统控制器固件就无法检测到Solaris软件挂起:已设置监视器定时器应用程序模式未启用监视器定时器用户未执行重置5.
监视器定时器提供部分引导监视.
您可以使用应用程序监视器来监视域的重新引导.
但是,监视域引导不是为了:在冷启动后引导恢复挂起或有故障的域后一种情况检测不到引导故障,也不进行任何恢复尝试.
6.
监视器定时器的应用程序模式不对应用程序的启动进行监视.
在应用程序模式下,如果应用程序未能启动,则系统检测不到该故障,也不进行任何恢复尝试.
148SunFire入门级中型系统管理指南2006年4月149词汇表ap-id连接点标识符;ap-id指定系统中连接点的类型和位置,它是明确的.
有两种类型的标识:物理和逻辑.
物理标识包含完整路径名称,而逻辑标识只包含简化名称.
cfgadm命令cfgadm是在SunFire入门级中型系统上进行动态重新配置的主命令.
有关该命令及其选项的信息,请参阅cfgadm(1M)、cfgadm_sbd(1M)和cfgadm_pci(1M)手册页.
有关此命令及相关命令的最新信息,请参阅DR网站上的Solaris8部分.
请参阅第12章.
DR参阅"动态重新配置".
IP多路径(IPMP)网际协议多路径.
当多个网络接口卡连接到系统时,通过对各类故障进行负载平衡来保持应用程序的连续运行.
如果某个网络适配器发生故障,且备用适配器已连接到同一个IP链路,系统会将所有的网络访问从发生故障的适配器切换到备用适配器.
如果多个网络适配器连接到同一个IP链路,增加的网络通信将分散到各个网络适配器,因此可以增加网络的吞吐量.
RTU许可证使用权许可证.
SC软件执行所有SC硬件管理功能的主应用程序.
SNMP简单网络管理协议.
SNMP可以是监听SNMP事件的任何系统.
Suspend-SafeSuspend-Safe设备在操作系统处于静止状态时不会访问内存或中断系统.
如果某一驱动程序支持操作系统静止(暂停/恢复运行),则说明它是Suspend-Safe驱动程序,即它在暂停期间是安全的.
Suspend-Safe驱动程序还能保证,在系统成功完成暂停请求后,此驱动程序所管理的设备仍不会试图访问内存,即使之前在执行暂停请求时此设备处于打开状态.
Suspend-UnsafeSuspend-Unsafe设备是指在操作系统处于静止状态期间,仍旧访问内存或导致系统中断的设备.
插卡占用DR插座或插槽的硬件资源,如系统板或磁盘驱动器等.
插座诸如板插槽或SCSI链之类的接收器.
150SunFire入门级中型系统管理指南2006年4月动态重新配置动态重新配置(DR)是一种软件,允许管理员进行以下操作:(1)查看系统配置;(2)暂停或重新启动有关端口、存储设备或板的操作;(3)在不关闭系统电源的情况下重新配置系统(断开或连接可热交换的设备,如磁盘驱动器或接口板).
如果DR与IPMP或SolsticeDiskSuite软件(以及冗余硬件)配合使用,则在服务提供商更换现有设备或安装新设备时,服务器可继续与磁盘驱动器以及网络进行通信,因而不会出现中断.
如果某一CPU/内存板上的内存没有与系统中其他板的内存进行交叉存储,则DR支持对该CPU/内存板进行更换操作.
端口板连接器.
断开连接系统停止监视板,并关闭插槽的电源.
此时,您可以拔出处于此状态的板.
即时访问CPU安装在SunFire入门级中型系统中的CODCPU/内存板上的未经许可的CODCPU.
购买CODCPU的COD使用权(RTU)许可证期间,您最多可以访问四个CODCPU以使系统立即投入使用.
也称为净资源.
即需即用(COD)即需即用(COD)是一个按需提供附加处理资源(CPU)的选项.
这些额外的CPU安装在SunFire入门级中型系统的CODCPU/内存板上.
购买这些CODCPU的COD使用权(RTU)许可证之后,即可访问它们.
静止操作系统的暂停.
在此过程中,允许取消配置和断开那些配有非可调页OpenBootPROM(OBP)或核心内存的系统板.
底板上的所有操作系统和设备活动在此操作的关键阶段均必须停止几秒钟.
可分离性设备驱动程序支持DDI_DETACH,设备(如I/O板或SCSI链)实际上被安排成可以分离的状态.
可暂停性为适合于DR,设备驱动程序必须能够停止用户线程、执行DDI_SUSPEND调用、停止时钟和停止CPU.
连接板插入插槽且已接通电源.
此时,系统会监视插槽的温度.
连接点板及其卡插槽的总称.
物理连接点说明了卡插槽的软件驱动程序和位置.
逻辑连接点是系统为引用物理连接点而创建的缩写名称.
逻辑DR一种DR操作.
在逻辑DR操作中,硬件不会被物理添加或拆除.
例如,出现故障的板被禁用后仍保留在插槽中(以免改变冷却空气的流通),直到装入可用的替换板.
配置(板)操作系统为板分配功能角色,并为板及其连接的设备载入设备驱动程序.
配置(系统)已知连接至系统的设备的集合.
只有在更新物理设备的配置后,系统才能使用此物理设备.
操作系统为板分配功能角色,并为板及其连接的设备载入设备驱动程序.
平台特定机型的SunFire系统,如SunFire入门级中型系统.
情况连接点的运行状态.
取消配置系统以逻辑方式将板与操作系统相分离,并使关联的设备驱动程序脱机.
环境监视可继续进行,但系统不可以使用该板的设备.
热插拔热插拔板和模块具有特殊的连接器,这些连接器在接通数据引脚之前为相应板或模块提供电源.
系统正在运行时不能插入或拆卸没有热插拔连接器的板和设备.
词汇表151热交换热交换设备具有特殊的DC电源连接器和逻辑电路,允许在不关闭系统的情况下插入设备.
物理DR一种DR操作.
在物理DR操作中,板会被物理添加或拆除.
另请参阅"逻辑DR"状况插座(插槽)或插卡(板)的运行状态.
152SunFire入门级中型系统管理指南2006年4月153索引Aaddcodlicense命令,82ALOM监视器定时器API,141获取状况,143禁用,142启用,142设置超时间隔,142数据结构,143说明,139auto-bootOpenBoot变量,55安全性其他注意事项,76用户和密码,71Bbootmode命令,54,57板插口状况,122插卡状况,123情况,123显示状态,127板状态,详细,127报警设置,50报警,检查状态,43Ccfgadm命令,119,126COD(即需即用),78即时访问CPU(净资源),79前提条件,80使用权(RTU)许可证,78分配,79获得,81密钥,81,83证书,78资源CPU状态,87,88监控,80,86配置,84CPU/内存板,更换,119CPU/内存映射,92持久性内存,125从硬挂起的系统恢复,102Ddeletecodlicense命令,82diag-levelOpenBoot变量,54disablecomponent命令,100打开硬件电源,15待机关闭电源,12154SunFire入门级中型系统管理指南2006年4月底盘HostID,81电压传感器,45电源,106动态重新配置,119Eenablecomponent命令,100error-levelOpenBoot变量,55error-reset-recoveryOpenBoot变量,55Fflashupdate命令,109非持久性内存,125风扇,检查状态,45G固件,升级,109故障LED指示灯,远程检查状态,43故障,确定原因,107故障,系统,97故障排除,91挂起,确定原因,107挂起的系统恢复,101挂起的系统,恢复,102关闭电源,12待机,12H环境监控,4恢复挂起,64恢复控制,65II/O部件映射,93interleave-modeOpenBoot变量,55interleave-scopeOpenBoot变量,55J监控COD资源,86挂起的域,64环境条件,4节点映射,92禁用组件,99静止,120K可靠性,5可维护性,7可用性,7控制台POST输出,4控制台上键入,82LLOM监视系统,42-49联机文档,43设置报警,50事件日志范例,44转义序列,更改,50lom-A命令,50LOM串行端口,51停止事件报告,51lom-E命令,51lom-f命令,45lom-G命令,113lom-l命令,43索引155lom-t命令,48LOM提示符访问,36lom-v命令,45lom-X命令,50连接点,121列入黑名单manual,99组件,99逻辑连接点,121M密码设置,17用户和安全性,71N内部电压传感器,45内部温度,检查,48内存持久性,125重新配置,125非持久性,125交叉存储,125OOn/Standby开关,10OpenBootPROM变量,54OpenBoot提示符,访问,37Ppassword命令,17POST,53控制,54,57OpenBootPROM变量,54poweroff命令,14poweron命令,12printenv命令,54Q强化系统,71切换过程,27情况,组件,122RRAS,5reboot-on-errorOpenBoot变量,55restartssh命令,75RTU(使用权)许可证,78热备用,80热插拔设备,122日期和时间,设置,16SSCPOST,控制,58SecureShell(SSH)协议SSHv2服务器,73主机密钥,75setdate命令,16setenv命令,54setkeyswitchon命令,88setupnetwork命令,17setupsc命令,58showcodlicense命令,83showcodusage命令,87showcomponent命令,69,88,100showenvironment命令,104showlogs命令,67,89shutdown命令,13SNMP,72Solaris控制台访问,36ssh-keygen命令,75Suspend-Safe设备,120Suspend-Unsafe设备,120设备路径名到物理系统设备,92156SunFire入门级中型系统管理指南2006年4月设备名映射,92事件报告,51手动列入黑名单,99T通电自测,请参阅POSTUuse-nvramrcOpenBoot变量,55Vverbosity-levelOpenBoot变量,55W网络参数,设置,17维护,109温度,104温度过高,104物理连接点,121X系统强化,71硬挂起,恢复,102系统,挂起,恢复,101系统故障,97系统控制器POST,请参阅SCPOST系统身份信息,移动,103消息事件,67Y硬挂起的系统,恢复,102硬件,打开电源,15映射,92CPU/内存,92I/O部件,93节点,92域常规定义,62最小化,76远程(网络)连接SSH,73Z诊断信息显示,107自动诊断,63终端,连接,29主机密钥,SSH,75状况,组件,122自动恢复,63自动诊断(AD)引擎,62组件插口状况,124插卡状况,124禁用,99类型,124列入黑名单,99情况,124状况,124组件运行状况(CHS),63最小化,域,76
最近上洛杉矶机房联通CUVIP线路主机的商家越来越多了,HostKvm也发来了新节点上线的邮件,适用全场8折优惠码,基于KVM架构,优惠后最低月付5.2美元起。HostKvm是一家成立于2013年的国人主机商,提供基于KVM架构的VPS主机,可选数据中心包括日本、新加坡、韩国、美国、中国香港等多个地区机房,君选择国内直连或优化线路,延迟较低,适合建站或者远程办公等。以洛杉矶CUVIP线路主机为例,...
RAKsmart发布了9月份优惠促销活动,从9月1日~9月30日期间,爆款美国服务器每日限量抢购最低$30.62-$46/月起,洛杉矶/圣何塞/香港/日本站群大量补货特价销售,美国1-10Gbps大带宽不限流量服务器低价热卖等。RAKsmart是一家华人运营的国外主机商,提供的产品包括独立服务器租用和VPS等,可选数据中心包括美国加州圣何塞、洛杉矶、中国香港、韩国、日本、荷兰等国家和地区数据中心(...
博鳌云是一家以海外互联网基础业务为主的高新技术企业,运营全球高品质数据中心业务。自2008年开始为用户提供服务,距今11年,在国人商家中来说非常老牌。致力于为中国用户提供域名注册(国外接口)、免费虚拟主机、香港虚拟主机、VPS云主机和香港、台湾、马来西亚等地服务器租用服务,各类网络应用解決方案等领域的专业网络数据服务。商家支持支付宝、微信、银行转账等付款方式。目前香港有一款特价独立服务器正在促销,...
lw8为你推荐
可以发外链的论坛给几个可以发外链的论坛,还有分类信息网,不要有限制的哪种,收录不收录无所谓网络明星网络明星是怎样成名的呢?如何又是网络明星呢?!!iphone越狱后怎么恢复苹果越狱后怎么恢复出厂设置商标注册查询官网商标注册网的官网是哪个?微信怎么看聊天记录微信怎样查询聊天记录office2007简体中文版到哪里下载正版的office2007~~office2007简体中文版求office2007免费版下载地址 无需破解无需激活无须密钥价格在线最好的免费b2b?怎样申请支付宝怎么申请支付宝?南北互通从南方发往北方的产品一般是什么
大连虚拟主机 vps租用 中文域名申请 个人域名备案流程 GGC ion 鲨鱼机 512au php探针 国外网站代理服务器 全站静态化 isp服务商 paypal注册教程 万网空间购买 789 东莞主机托管 服务器论坛 lamp兄弟连 江苏徐州移动 广东服务器托管 更多