系统lw8

lw8  时间:2021-03-03  阅读:()
SunMicrosystems,Inc.
www.
sun.
com请将有关本文档的意见和建议提交至:http://www.
sun.
com/hwdocs/feedbackSunFire入门级中型系统管理指南文件号码819-0754-102004年10月,修订版A请回收版权所有2004SunMicrosystems,Inc.
,4150NetworkCircle,SantaClara,California95054,U.
S.
A.
保留所有权利.
SunMicrosystems,Inc.
拥有与本文档所述产品包含的技术有关的知识产权.
具体来讲,这些知识产权包括(但不仅限于)http://www.
sun.
com/patents网站列出的一种或多种美国专利,以及在美国和其它国家/地区注册的一种或多种其它专利或正在申请中的专利.
本文档及其所述产品的分发必须遵守许可证条款(用于限制本文档及其所述产品的使用、复制、分发和反编译).
未经Sun及其许可证发行者(如果有)事先书面授权,不得以任何形式、任何方式复制本产品或文档的任何部分.
第三方软件,包括字体技术,均已从Sun供应商获得版权和许可.
产品的部分部件可能源于BerkeleyBSD系统,Sun已从加利福尼亚大学获得使用许可.
UNIX是在美国和其它国家/地区的注册商标,Sun已从X/OpenCompany,Ltd.
获得独家使用授权.
Sun、SunMicrosystems、Sun徽标、AnswerBook2、docs.
sun.
com、SunFire和Solaris是SunMicrosystems,Inc.
在美国及其它国家/地区的商标或注册商标.
所有SPARC商标都是SPARCInternational,Inc.
在美国以及其它国家/地区的商标或注册商标,必须根据许可证条款使用.
带有SPARC商标的产品以SunMicrosystems,Inc.
开发的体系结构为基础.
OPENLOOK和SunGraphicalUserInterface是SunMicrosystems,Inc.
专门为其用户和许可证获得者开发的.
Sun感谢Xerox在用户界面形象化和图形化研发方面为计算机行业所做的先导性贡献.
Sun已从Xerox获得对Xerox图形用户界面(GUI)的非独占使用许可.
该许可也涵盖实施OPENLOOKGUI的Sun许可证获得者,而其它情况则应符合Sun的书面许可协议.
文档以"原样"提供.
除非有关的免责声明在法律上无效,否则Sun拒绝承担任何明示或默示的条件、表示和担保,包括任何对适销性、特定用途的适用性或非侵权性作出的默示担保.
iii目录序言xix1.
概述1系统控制器1I/O端口2LOM提示符3Solaris控制台4环境监控4系统指示灯板4可靠性、可用性及可维修性(RAS)5可靠性6禁用组件或板和通电自测(POST)6手动禁用组件6环境监控6可用性7动态重配置7电源故障7系统控制器重新引导7主机监视器7ivSunFire入门级中型系统管理指南2004年10月可维修性7LED指示灯8命名8系统控制器错误日志8系统控制器XIR(外部重置)支持8即需即用选件82.
启动和设置SunFire入门级中型系统9设置硬件10安装硬件并连接硬件电缆10使用电源On/Standby开关10打开和关闭电源11使用On/Standby开关打开电源11使用LOMpoweron命令打开电源12使系统进入待机模式12使用Solarisshutdown命令13使用LOMshutdown命令13使用On/Standby开关发出shutdown命令13使用LOMpoweroff命令14使用On/Standby开关发出poweroff命令14打开电源之后15设置系统16设置日期和时间16设置密码17配置网络参数17安装和引导Solaris操作系统18安装和引导Solaris操作系统18目录v安装LightsOutManagement软件包19安装LOM驱动程序20安装LOM实用程序22安装LOM手册页22重置系统23强行重置系统23重置系统控制器243.
切换过程25建立LOM控制台连接26使用串行端口访问LOM控制台26连接到ASCII终端26连接到网络终端服务器28连接到工作站的串行端口B29使用远程连接访问LOM控制台30断开LOM控制台连接31在不同控制台之间切换32切换到LOM提示符34从LOM提示符切换到Solaris控制台34从OpenBootPROM切换到LOM提示符35在Solaris运行时切换到OpenBoot提示符35在通过串行端口连接到系统控制器时终止进程35在通过网络连接到系统控制器时终止进程364.
系统控制器消息日志37viSunFire入门级中型系统管理指南2004年10月5.
在Solaris操作系统中使用LightsOutManagement和系统控制器39LOM命令语法39在Solaris操作系统中监控系统40查看LOM联机文档41查看LOM配置(lom-c)41检查故障LED和警报LED指示灯的状态(lom-l)41查看事件日志(lom-e)42检查风扇(lom-f)43检查内部电压传感器(lom-v)43检查内部温度(lom-t)46查看所有组件的状态数据和LOM的配置数据(lom-a)47可在Solaris操作系统中执行的其它LOM任务47打开和关闭警报(lom-A)48更改lom>提示符的换码序列(lom-X)48在LOM提示符下停止LOM向控制台发送报告(lom-Eoff)49升级固件(lom-Gfilename)496.
运行POST51用于配置POST的OpenBootPROM变量51使用bootmode命令控制POST55控制系统控制器POST557.
自动诊断与恢复59自动诊断与恢复概述59挂起系统的自动恢复61诊断事件62诊断和恢复控制63诊断参数63目录vii获得自动诊断和恢复信息64查看自动诊断事件消息64查看组件状态65查看其它错误信息678.
安全准则69系统安全保护69定义控制台密码70使用SNMP协议的默认配置70重新引导SC以应用设置70选择远程连接类型71启用SSH71启用SSH72SSH不支持的功能72更改SSH主机密钥73其它安全事项73允许进行RTOSShell访问的特殊密钥序列74域最小化74Solaris操作系统安全749.
即需即用75COD概述76COD许可流程76CODRTU许可证分配77即时访问CPU77用作热备用件的即时访问CPU78资源监控78COD使用入门78viiiSunFire入门级中型系统管理指南2004年10月管理CODRTU许可证79获取CODRTU许可证密钥并将其添加到COD许可证数据库79从COD许可证数据库中删除COD许可证密钥80查看COD许可证信息80激活COD资源82启用或禁用即时访问CPU以及保留RTU许可证82监控COD资源83CODCPU/内存板83确定CODCPU/内存板84COD资源使用情况84查看COD使用情况85禁用COD的CPU86其它COD信息8710.
故障排除89设备映射89CPU/内存映射89IB_SSC部件映射90系统故障94客户可更换件95SunFireE2900系统96SunFireV1280系统96Netra1280系统96手动列入黑名单(等待维修期间)97有关CPU/内存板的特别注意事项98恢复挂起的系统99手动恢复挂起的系统99移动系统身份信息100目录ix温度101电源设备103显示诊断信息104协助Sun服务人员查明故障原因10411.
固件升级过程105使用flashupdate命令105使用flashupdate命令将SunFireV1280或Netra1280系统的固件版本从5.
13.
x升级到5.
17.
0107使用flashupdate命令将SunFireE2900、SunFireV1280或Netra1280系统的固件版本从5.
17.
x升级到5.
18.
0108使用flashupdate命令将SunFireV1280或Netra1280系统的固件版本从5.
17.
x降级到5.
13.
x108使用flashupdate命令将SunFireE2900、SunFireV1280或Netra1280系统的固件版本从5.
18.
0降级到5.
17.
x109使用lom–G命令109代码样例110使用lom-G命令升级SunFireE2900、SunFireV1280或Netra1280系统的固件113使用lom-G命令降级SunFireE2900、SunFireV1280或Netra1280系统的固件11312.
CPU/内存板更换和动态重配置(DR)115动态重配置115命令行界面115DR概念116静止116Suspend-Safe和Suspend-Unsafe设备116附着点117DR操作117热插拔硬件118情况和状态118xSunFire入门级中型系统管理指南2004年10月板状态和情况118板插座状态118板占有者状态119板情况119组件状态和情况120组件插座状态120组件占有者状态120组件情况120组件类型121非永久内存和永久内存121限制121内存交叉存储121重新配置永久内存121命令行界面122cfgadm命令122显示基本板状态122显示详细板状态123命令选项125测试板和部件125测试CPU/内存板125安装或更换CPU/内存板126安装新板127热交换CPU/内存板127从系统中拆卸CPU/内存板128暂时断开CPU/内存板的连接129目录xi故障排除129CPU/内存板取消配置故障130不能取消配置其内存在多块板之间进行交叉存储的板130不能取消配置正在处理某个进程的CPU130不能在取消配置所有内存之前取消配置CPU130不能取消配置具有永久内存的板上的内存131内存不能重新配置131没有足够的可用内存131内存需求增加131不能取消配置CPU132不能断开板的连接132CPU/内存板配置故障132不能同时配置CPU0和CPU1132板上的CPU必须在配置内存之前配置132词汇表133索引137xiiSunFire入门级中型系统管理指南2004年10月xiii图图1-1I/O端口2图1-2系统指示灯板4图2-1电源On/Standby开关10图3-1控制台间的切换过程33图4-1系统控制器日志38图7-1自动诊断与恢复过程60图10-1SunFire入门级中型系统IB_SSCPCI物理插槽分配(IB6)93图10-2系统指示灯94图12-1cfgadm-av显示内容的详细信息124xivSunFire入门级中型系统管理指南2004年10月xv表表1-1选择的系统控制器管理任务3表1-2系统指示灯LED功能5表2-1电源On/Standby开关说明11表6-1POST配置参数52表7-1诊断和操作系统恢复参数63表8-1SSH服务器属性71表9-1COD许可证信息81表9-2showcodusage信息85表9-3获得COD配置和事件信息87表10-1CPU和内存代理ID分配90表10-2I/O部件类型及插槽数90表10-3每个系统具有的I/O部件数和部件名91表10-4I/O控制器代理ID分配91表10-5IB_SSC部件PCI设备映射92表10-6系统故障指示灯状态95表10-7黑名单组件名称97表10-8使用showenvironment命令检查温度条件101表12-1DR操作类型117表12-2板插座状态119表12-3板占有者状态119xviSunFire入门级中型系统管理指南2004年10月表12-4板情况119表12-5组件占有者状态120表12-6组件情况120表12-7组件类型121表12-8系统控制器(SC)产生的DR板状态122表12-9cfgadm-c命令选项125表12-10cfgadm-x命令选项125表12-11诊断级别126xvii代码样例代码样例2-1系统控制器产生的硬件重置输出15代码样例2-2setupnetwork命令产生的输出18代码样例2-3安装LOM驱动程序20代码样例2-4安装LOM实用程序22代码样例2-5安装LOM手册页22代码样例5-1lom-c命令的输出样例41代码样例5-2lom-l命令的输出样例41代码样例5-3LOM事件日志的样例(先报告最早的事件)42代码样例5-4lom-f命令的输出样例43代码样例5-5lom-v命令的输出样例43代码样例5-6lom-t命令的输出样例46代码样例6-1使用max设置时的POST输出54代码样例6-2将SCPOST诊断级别设为min56代码样例6-3诊断级别设为min时的SCPOST输出56代码样例7-1控制台上显示的自动诊断事件消息样例61代码样例7-2操作系统心跳停止后关于自动域恢复的消息输出样例62代码样例7-3操作系统未响应中断时关于自动域恢复的控制台输出样例62代码样例7-4域诊断事件消息–非致命域硬件错误62代码样例7-5自动诊断消息的样例65代码样例7-6showboards命令输出–Disabled和Degraded组件65xviiiSunFire入门级中型系统管理指南2004年10月代码样例7-7showcomponent命令输出–禁用的组件66代码样例7-8showerrorbuffer命令输出–硬件错误67代码样例9-1包含禁用CODCPU信息的控制台日志输出86代码样例9-2showcomponent命令输出–禁用的CODCPU86代码样例11-1下载lw8pci.
flash映像110代码样例11-2下载lw8cpu.
flash映像111代码样例12-1cfgadm基本命令的输出123代码样例12-2cfgadm-av命令的输出123xix序言本书简要介绍了系统,并且逐步说明了常见的管理过程.
它解释了如何在SunFire入门级中型服务器系列–SunFireE2900和SunFireV1280/Netra1280系统上配置和管理系统控制器固件,并说明了如何拆卸和更换组件以及执行固件升级.
此外,本书还包含有关系统安全、故障排除和技术术语表的信息.
本书的内容编排第1章介绍系统控制器、板状态、冗余系统组件、最低系统配置以及系统的可靠性、可用性和可维修性.
第2章说明如何初次启动并设置系统.
第3章介绍如何切换系统控制器.
第4章介绍系统控制器消息日志.
第5章说明如何在Solaris控制台中使用LOM.
第6章介绍如何运行通电自测(POST)诊断程序.
第7章说明固件的自动诊断和域恢复功能.
第8章介绍安全准则.
第9章介绍即需即用(COD)选件,以及如何分配、激活和监控COD资源.
第10章说明故障排除信息,包括LED指示灯、系统故障、显示诊断信息、显示系统配置信息、禁用组件(列入黑名单)以及将设备路径名映射到物理系统设备.
第11章介绍有关固件更新的信息,包括如何更新闪存PROM以及更新系统控制器固件的过程.
第12章介绍动态重配置功能以及您可执行的过程.
xxSunFire入门级中型系统管理指南2004年10月使用UNIX命令本书假定您熟悉UNIX操作系统.
如果您不熟悉UNIX操作系统,请参阅下列一个或多个文档,了解相关信息:用于Solaris操作系统的AnswerBook2联机文档.
系统附带的其它软件文档.
印刷约定字样含义示例AaBbCc123命令、文件和目录的名称;计算机屏幕输出编辑.
login文件.
使用ls-a列出所有文件.
%Youhavemail.
AaBbCc123键入的内容(相对于计算机的屏幕输出)%suPassword:AaBbCc123书名、新词或术语、需要强调的词命令行变量;需用真名或实际值替换阅读用户指南的第6章.
这些称为class选项.
您必须为超级用户才能执行此项操作.
若要删除文件,请键入rm文件名.
序言xxiShell提示符相关文档访问Sun文档您可从以下网站查看和打印Sun提供的各类文档(包括本地化版本):http://www.
sun.
com/documentationShell提示符Cshell计算机名%Cshellsuperuser计算机名#Bourneshell和Kornshell$Bourneshell和Kornshellsuperuser#LOMshelllom>书籍类型书名文件号码命令参考SunFireEntry-LevelMidrangeSystemControllerCommandReferenceManual817-7811-10xxiiSunFire入门级中型系统管理指南2004年10月Sun欢迎您提出意见Sun十分注重改进自身文档的质量,欢迎您提出宝贵的意见和建议.
您可以通过电子邮件将意见发送至:docfeedback@sun.
com请在电子邮件主题行内注明本文档的文件号码(819-0754-10).
1第1章概述本章简要介绍SunFire入门级中型服务器(即SunFireE2900和SunFireV1280/Netra1280系统)的基本功能.
系统设置过程概述以及详细的操作步骤将在第2章介绍.
本章包括下列主题:第1页"系统控制器"第5页"可靠性、可用性及可维修性(RAS)"第8页"即需即用选件"系统控制器系统控制器(SC)是一种嵌入式系统,它驻留在与系统底板相连的IB_SSC组件上.
SC负责提供LightsOutManagement(LOM)功能,包括通电排序、排序模块通电自测(POST)、环境监控、故障指示以及警报.
SC配有一个RS-232串行接口和一个10/100以太网接口.
通过这些接口,可以共享和获得对LOM命令行界面以及Solaris和OpenBootPROM控制台的访问权限.
系统控制器的功能包括:监控系统提供Solaris和OpenBootPROM控制台提供虚拟TOD(时间)执行环境监控执行系统初始化协调POST运行在SC上的软件应用程序提供了命令行界面,通过此界面可修改系统设置.
2SunFire入门级中型系统管理指南2004年10月I/O端口系统背面设有以下端口:控制台串行(RS-232)端口(RJ-45)保留备用的串行(RS-232)端口(RJ-45)两个千兆位以太网端口(RJ-45)警报端口(DB-15)系统控制器10/100以太网端口(RJ-45)UltraSCSI端口六个PCI端口(五个33MHz端口,一个66MHz端口)它们的位置如图1-1所示.
图1-1I/O端口AC3AC2AC1AC0SOURCEASOURCEASOURCEBSCSI3ALARMSBBAPCI333MHzPCI133MHzPCI233MHzPCI433MHzPCI566MHzPCI033MHzLinkActiveGBitLinkActiveGBitNET0NET1SerialASerialBSSC1SSC1PSU3输入PSU2输入PSU1输入PSU0输入PCI0-PCI568引脚SCSI串行端口Net0/Net1警报端口10/100以太网LOM/系统控制器第1章概述3控制台串行端口和10/100以太网端口可用于访问系统控制器.
控制台串行端口可以直接连接ASCII终端或NTS(网络终端服务器).
使用串行电缆连接系统控制器板时,您可以通过ASCII终端或NTS来访问系统控制器命令行界面.
10/100以太网端口用于将SC连接到网络.
LOM提示符LOM提示符提供了SC的命令行界面,同时它也是显示控制台消息的地方.
表1-1列出了某些系统管理任务.
lom>表1-1选择的系统控制器管理任务任务命令配置系统控制器password,setescape,seteventreporting,setupnetwork,setupsc配置系统setalarm,setlocator打开或关闭板和系统的电源poweron,poweroff,reset,shutdown测试CPU/内存板testboard重新设置系统控制器resetsc将组件标识为Faulty(故障)或OK(正常)disablecomponent,enablecomponent升级固件flashupdate显示系统控制器的当前设置showescape,showeventreporting,shownetwork,showsc显示当前系统状态showalarm,showboards,showcomponent,showenvironment,showfault,showhostname,showlocator,showlogs,showmodel,showresetstate设置日期、时间和时区setdate显示日期和时间showdate4SunFire入门级中型系统管理指南2004年10月Solaris控制台如果您正在运行Solaris操作系统、OpenBootPROM或POST,则可以访问Solaris控制台.
连接到Solaris控制台后,您将处于下列一种操作模式:Solaris操作系统控制台(%或#提示符).
OpenBootPROM(ok提示符).
系统将会运行POST,并且您可以查看POST输出.
要在这些提示符和LOM提示符之间切换,请参阅第32页"在不同控制台之间切换".
环境监控系统配有用于监控温度、电压和通风情况的传感器.
SC会及时轮询这些传感器,以便获取环境数据.
SC会在必要时关闭各个组件,以防损坏.
例如,当温度过高时,SC会通知Solaris操作系统,并由后者采取相应措施.
当极度超温时,SC软件会在事先不通知操作系统的情况下直接关闭系统.
系统指示灯板系统指示灯板包含On/Standby(打开/待机)开关和LED指示灯,如图1-2所示.
图1-2系统指示灯板SERVICEREQUIREDSYSTEMALARMPOWERSOURCE定位器系统故障系统活动On/Standby开关要求顶部进入UNIX运行警报1和警报2电源A和电源B第1章概述5表1-2列出了LED指示灯的功能.
可靠性、可用性及可维修性(RAS)可靠性、可用性和可维修性(RAS)是本系统具有的功能.
可靠性是指系统在正常环境条件下,在指定的时间期间内保持正常运作的可能性.
可靠性与可用性的区别在于可靠性只涉及系统故障,而可用性则取决于故障和恢复两方面.
可用性(也称"平均可用度")是系统可正确执行其功能的时间百分比.
可用性可以通过系统级别或为终端客户机所提供的服务可用性情况来衡量.
"系统可用性"可能会为安装在该系统顶端的任意产品强制设置可用性上限.
可维修性用于衡量产品维护和系统修复的简易度和效果.
没有单一明确定义的尺度,这是因为可维修性包含平均修复时间(MTTR)和可诊断性两方面.
以下几节详细介绍了RAS.
若要了解与硬件相关的RAS信息,请参阅《SunFireE2900SystemServiceManual》或《SunFireV1280/Netra1280ServiceManual》.
若要了解与Solaris操作系统相关的RAS功能,请参阅《Sun硬件平台指南》.
表1-2系统指示灯LED功能名称颜色功能Locator(定位器)**系统背面也有一个与此相同的指示灯.
白色常灭;可通过用户命令点亮SystemFault(系统故障)*琥珀色LOM检测到故障时亮起SystemActive(系统活动)*绿色系统通电时亮起TopAccess(顶部进入)琥珀色只能从系统顶部更换的FRU出现故障时亮起UNIXRunning(UNIX运行)绿色Solaris软件运行期间亮起Alarm1(警报1)和Alarm2(警报2)绿色当LOM中指定的事件被触发时亮起SourceA(电源A)和SourceB(电源B)绿色相关供电线路为系统供电时亮起6SunFire入门级中型系统管理指南2004年10月可靠性软件可靠性功能包括:禁用组件或板和通电自测(POST)手动禁用组件环境监控可靠性功能同时也提高了系统可用性.
禁用组件或板和通电自测(POST)通电自测(POST)是系统开机过程的一部分.
如果某一板或组件未能通过测试,POST将会禁用该组件或板.
showboards命令会将该板显示为"失败"或"降级".
只有组件通过POST测试时,才能引导运行Solaris操作系统的系统.
手动禁用组件系统控制器可提供组件级状态并允许用户根据自身的需要修改组件的状态.
从控制台运行setls命令可以设置组件位置状态.
下一次重新引导域、关闭并打开板电源或者运行POST(例如,无论何时执行setkeyswitchon或off命令操作均会运行POST)时,将会更新组件位置状态.
注–enablecomponent和disablecomponent命令已由setls命令取代.
这些命令以前用于管理组件资源.
虽然enablecomponent和disablecomponent命令仍然可用,但建议您使用setls命令来控制系统内部或外部组件的配置.
showcomponent命令用于显示组件是否被禁用等状态信息.
环境监控SC可以监控系统的温度、通风情况和电压传感器.
SC向Solaris操作系统提供最新的环境状态信息.
如果需要关闭硬件的电源,SC会通知Solaris操作系统执行系统关闭过程.
第1章概述7可用性软件可用性功能包括:动态重配置电源故障系统控制器重新引导主机监视器动态重配置以下组件可进行动态重配置:硬盘驱动器CPU/内存板电源设备风扇电源故障如果电源在中断后恢复供电,SC会尝试将系统恢复到原来的状态.
系统控制器重新引导SC可重新引导,并会启动及恢复系统管理.
重新引导不会影响当前运行的Solaris操作系统.
主机监视器SC监控Solaris操作系统的状态,如果系统没有反应,它将会启动重置过程.
可维修性软件可维修性功能可以提高系统日常及紧急维修的效率和时效.
LED指示灯命名系统控制器错误日志系统控制器XIR(外部重置)支持8SunFire入门级中型系统管理指南2004年10月LED指示灯所有可从系统外部查看的现场可更换件(FRU)都配有指示其状态的LED指示灯.
除电源设备LED指示灯之外,SC可以管理系统中的所有LED指示灯,电源设备LED指示灯由电源设备管理.
有关LED指示灯功能的说明,请参阅《SunFireV1280/Netra1280ServiceManual》中相应的板或设备章节.
命名SC、Solaris操作系统、通电自测(POST)和OpenBootPROM错误消息所用的FRU名称与系统中FRU物理标签上的名称一致.
唯一的例外是对I/O设备的OpenBootPROM命名,此命名方法在设备检测过程中使用第10章介绍的设备路径名来指示I/O设备.
系统控制器错误日志SC错误消息会自动通知给Solaris操作系统.
此外,SC还有一个用于存储错误消息的内部缓冲区.
您可以使用showlogs命令来显示存储在SC消息缓冲区内的SC日志事件.
系统控制器XIR(外部重置)支持SCreset命令使您可以恢复挂起的系统并抽取Solaris操作系统核心文件.
即需即用选件在包含UltraSPARCIVCPU/内存板的系统(例如:SunFireE2900服务器)上,即需即用(COD)选件可在必要时提供额外的处理资源(即额外的CPU).
这些额外的CPU位于系统中的CODCPU/内存板上.
不过,若要访问这些CODCPU,您必须首先为其购买COD使用权(RTU)许可证.
获得CODCPU的CODRTU许可证之后,您即可在必要时激活这些CPU.
有关COD的详细信息,请参阅第75页"即需即用".
9第2章启动和设置SunFire入门级中型系统本章介绍如何使用系统控制器命令行界面(LOM提示符)打开系统电源,如何使用setupnetwork命令设置系统控制器(SC)以及如何引导Solaris操作系统.
本章包括下列主题:第10页"设置硬件"第10页"使用电源On/Standby开关"第11页"打开和关闭电源"第16页"设置系统"第18页"安装和引导Solaris操作系统"第23页"重置系统"下面列出了您在打开系统电源和设置系统时必须执行的主要步骤:1.
安装硬件并连接硬件电缆.
2.
接通硬件的外部电源.
3.
设置系统日期和时间.
4.
设置SC密码.
5.
使用setupnetwork命令设置系统专用的参数.
6.
使用poweron命令打开所有硬件的电源.
7.
安装Solaris操作系统(如果没有预装).
8.
引导Solaris操作系统.
9.
安装SolarisSupplementaryCD中的LightsOutManagement软件包.
10SunFire入门级中型系统管理指南2004年10月设置硬件安装硬件并连接硬件电缆1.
连接终端到系统控制器板的串行端口(图1-1).
2.
设置终端,使其使用的波特率与SC串行端口(96008N1)相同.
系统控制器板的串行端口设置如下:9600波特8个数据位无奇偶校验1个停止位若要了解详细信息,请参阅《SunFireE2900系统安装指南》或《SunFireV1280/Netra1280系统安装指南》.
使用电源On/Standby开关SunFire入门级中型系统的电源(On/Standby)开关是摇杆型的瞬时生效开关.
它只能控制低压信号,但不能控制高压电路.
注–电源开关不是On/Off开关,而是On/Standby开关.
这种开关并不能完全切断设备的电源.
图2-1电源On/Standby开关SERVICEREQUIREDSYSTEMALARMPOWERSOURCEOn/Standby开关第2章启动和设置SunFire入门级中型系统11下表描述了开关的位置.
使用LOMsetupsc命令可防止意外操作On/Standby开关.
打开和关闭电源当所有电源线都连接好,且合上外部电路断路器时,系统即会进入待机模式.
在系统指示灯板上,只有电源A和电源BLED指示灯亮起.
IB_SSC部件的活动LED指示灯也会亮起,但从系统前面看不到.
用户可用下列任何一种方法在待机模式下打开系统的电源:使用On/Standby开关通过LOM端口发送poweron命令如果在OBP中设置了auto-boot变量,则系统会自动引导至Solaris操作系统.
使用On/Standby开关打开电源1.
检查系统是否已接通电源且处于待机模式.
在系统指示灯板上的所有LED指示灯中,只有电源A和电源B指示灯亮起.
IB_SSC部件的活动LED指示灯也会亮起,但从系统前面看不到.
2.
快速将On/Standby开关按到右侧.
这会完全打开系统的电源.
除电源A和电源B指示灯之外,系统活动指示灯也将亮起.
系统将执行通电自测(POST)过程.
表2-1电源On/Standby开关说明符号说明打开按下然后松开,可以打开服务器电源.
这相当于LOMpoweron命令.
待机按住的时间短于四秒钟时,可以启动系统的正常关闭过程并使系统进入待机模式.
这相当于在lom>提示符下运行shutdown命令.
这是正常操作时使用的方式.
按住的时间长于四秒钟时,可以关闭系统的电源并使系统进入待机模式.
这相当于在lom>提示符下运行poweroff命令.
此过程不可中断.
使系统进入待机模式之前,请确保有序地关闭Solaris操作系统,否则可能会丢失数据.
如果用户希望关闭系统电源并使之进入待机模式,建议用户在LOM提示符下键入shutdown命令.
12SunFire入门级中型系统管理指南2004年10月使用LOMpoweron命令打开电源在lom>提示符下键入以下命令:SC首先打开所有电源设备的电源,然后打开风扇托架的电源.
最后,SC打开系统板的电源.
如果OpenBootPROM变量auto-boot的值为true,则系统还会引导Solaris操作系统.
此外,poweron命令还可用于打开各个模块的电源.
有关详细信息,请参阅《SunFireEntry-LevelMidrangeSystemControllerCommandReferenceManual》.
系统活动指示灯亮起.
系统将会执行通电自测(POST)过程.
注–poweronall命令只能用于打开各个组件的电源,但不能引导Solaris软件.
有关poweron命令的详细信息,请参阅《SunFireEntry-LevelMidrangeSystemControllerCommandReferenceManual》.
使系统进入待机模式可用五种方法来实现此目的:使用UNIXshutdown命令通过LOM端口发送shutdown命令使用On/Standby开关发出shutdown命令通过LOM端口发送poweroff命令使用On/Standby开关发出poweroff命令注–使系统进入待机模式之前,请确保有序地关闭Solaris操作系统,否则可能会丢失数据.
lom>poweron第2章启动和设置SunFire入门级中型系统13使用Solarisshutdown命令在系统提示符下键入以下命令:系统会关闭电源并进入待机模式.
在系统指示灯板上,只有电源A和电源BLED指示灯亮起.
IB_SSC部件的活动LED指示灯也会亮起,但从系统前面看不到.
使用LOMshutdown命令LOMshutdown命令会有序地关闭系统,接着关闭所有模块和系统机箱的电源并进入待机模式.
注–如果Solaris软件正在运行,此命令先尝试有序地终止系统,然后再关闭系统的电源并使系统进入待机模式,这相当于Solarisinit5命令.
在lom>提示符下键入以下命令:在Solaris停止运行后,系统会关闭电源并进入待机模式.
在系统指示灯板上,只有电源A和电源BLED指示灯亮起.
IB_SSC部件的活动LED指示灯也会亮起,但从系统前面看不到.
有关LOMshutdown命令的详细信息,请参阅《SunFireEntry-LevelMidrangeSystemControllerCommandReferenceManual》.
使用On/Standby开关发出shutdown命令按下系统On/Standby开关的左侧.
这会启动系统的正常关闭过程,并使系统进入待机模式.
这相当于在lom>提示符下运行shutdown命令.
#shutdown-i5lom>shutdown14SunFire入门级中型系统管理指南2004年10月使用LOMpoweroff命令要关闭所有模块和系统机箱的电源并进入待机模式,请使用poweroff命令.
1.
在lom>提示符下键入以下命令:只有您想强行关闭系统电源而不考虑Solaris操作系统的运行状态时,才应回答yes.
正常操作情况下,您应使用shutdown命令.
2.
键入y继续或按回车键取消命令.
系统会关闭电源并进入待机模式.
在系统指示灯板上,只有电源A和电源BLED指示灯亮起.
IB_SSC部件的活动LED指示灯也会亮起,但从系统前面看不到.
有关poweroff命令的详细信息,请参阅《SunFireEntry-LevelMidrangeSystemControllerCommandReferenceManual》.
使用On/Standby开关发出poweroff命令只有您想强行关闭系统电源而不考虑Solaris操作系统的运行状态时,才应使用此方法.
正常操作情况下,您应在lom>提示符下或使用On/Standby开关发出shutdown命令(参阅第13页"使用On/Standby开关发出shutdown命令").
按下On/Standby开关的左侧,并至少按住四秒钟.
系统会关闭电源并进入待机模式.
在系统指示灯板上,只有电源A和电源BLED指示灯亮起.
IB_SSC部件的活动LED指示灯也会亮起,但从系统前面看不到.
lom>poweroffThiswillabruptlyterminateSolaris.
Doyouwanttocontinue[no]第2章启动和设置SunFire入门级中型系统15打开电源之后您会在系统控制器串行端口连接上看到以下输出信息:代码样例2-1系统控制器产生的硬件重置输出HardwareReset.
.
.
@(#)SYSTEMCONTROLLER(SC)POST232002/03/2218:03PSR=0x044010e5PCR=0x04004000Basicsanitychecksdone.
SkippingPOST.
.
.
ERIDevicePresentGettingMACaddressforSSC1UsingSCCMACaddressMACaddressis0:3:xx:xx:xx:xxHostname:some_nameAddress:xxx.
xxx.
xxx.
xxxNetmask:255.
255.
255.
0AttachedTCP/IPinterfacetoeriunit0Attachinginterfacelo0.
.
.
doneGateway:xxx.
xxx.
xxx.
xxxinterrupt:100MbpshalfduplexlinkupCopyright2001-2002SunMicrosystems,Inc.
Allrightsreserved.
Useissubjecttolicenseterms.
LightsOutManagementFirmwareRTOSversion:23ScAppversion:5.
13.
0007LW8_build0.
7SCPOSTdiaglevel:offThedateisFriday,July19,2002,3:48:50PMBST.
FriJul1915:48:51some_namelom:Boot:ScApp5.
13.
0007,RTOS23FriJul1915:48:54some_namelom:SBBCResetReason(s):PowerOnResetFriJul1915:48:54some_namelom:InitializingtheSCSRAMFriJul1915:48:59some_namelom:CachingIDinformationFriJul1915:49:00some_namelom:ClockSource:75MHzFriJul1915:49:02some_namelom:/N0/PS0:StatusisOKFriJul1915:49:03some_namelom:/N0/PS1:StatusisOKFriJul1915:49:03some_namelom:Chassisisinsinglepartitionmode.
FriJul1915:49:05some_namelom:Coldbootdetected:recoveringactivedomains16SunFire入门级中型系统管理指南2004年10月设置系统打开电源后,您必须使用本章所述的SCsetdate和setupnetwork命令设置系统.
本部分包括下列主题:第16页"设置日期和时间"第17页"配置网络参数"第18页"安装和引导Solaris操作系统"设置日期和时间如果您所在的时区使用标准时间或夏令时,则系统会自动进行此项设置.
在LOM提示符下,使用setdate命令设置系统日期、时间和时区:以下样例根据与格林威治标准时间(GMT)的时差将时区设为太平洋标准时间(PST),日期和时间设为星期二,2004年4月20日18点15分10秒.
如果正在运行Solaris软件,请使用Solarisdate命令.
有关setdate命令的详细信息,请参阅《SunFireEntry-LevelMidrangeSystemControllerCommandReferenceManual》.
FriJul1915:49:06some_namelom:NOTICE:/N0/FT0ispoweredoffConnected.
lom>lom>setdate-tGMT-8042018152004.
10代码样例2-1系统控制器产生的硬件重置输出(续)HardwareReset.
.
.
第2章启动和设置SunFire入门级中型系统17设置密码1.
在LOM提示符下,键入SCpassword命令.
2.
在Enternewpassword:提示符下,键入您的密码.
3.
在Enternewpasswordagain:提示符下,再次键入您的密码.
如果您丢失或遗忘了密码,请与SunService联系,获取相关建议.
配置网络参数您可以在SCLOM提示符下以及通过Solaris软件来管理SunFire入门级中型系统.
访问LOM控制台连接的方法有两种:通过SC串行端口连接.
通过远程(网络)连接(使用10/100以太网端口).
注–系统只能通过串行端口来管理,不过,如果您想使用10/100以太网端口,请使用独立的安全子网实现此连接.
默认情况下,未启用远程连接功能.
如要使用SSH或Telnet来管理系统,您必须使用setupnetwork命令将连接类型设为SSH或Telnet.
在LOM提示符下键入setupnetwork命令:注–如果您在每个问题后都按Return键,则当前值均不会改变.
有关setupnetwork命令的详细信息,请参阅《SunFireEntry-LevelMidrangeSystemControllerCommandReferenceManual》.
代码样例2-2显示了setupnetwork命令的样例.
lom>passwordEnternewpassword:Enternewpasswordagain:lom>lom>setupnetwork18SunFire入门级中型系统管理指南2004年10月有关输入每个参数值条目的信息,可参照使用代码样例2-2中的信息.
安装和引导Solaris操作系统要使用LOM命令,您必须从SolarisSupplementaryCD安装LightsOutManagement2.
0软件包(SUNWlomu、SUNWlomr和SUNWlomm).
安装和引导Solaris操作系统1.
进入LOM提示符下.
有关如何进入LOM提示符下的详细信息,请参阅第3章.
2.
要打开系统电源,请键入poweron命令.
根据OpenBootPROMauto-boot参数的设置,系统将尝试引导Solaris操作系统或保持在OpenBootPROMok提示符下.
默认设置为true,此时,系统会尝试引导至Solaris操作系统.
如果auto-boot的设置为false或没有安装可引导的Solaris映像,则您会看到OpenBootPROMok提示符.
代码样例2-2setupnetwork命令产生的输出lom>setupnetworkNetworkConfigurationIsthesystemcontrolleronanetwork[yes]:UseDHCPorstaticnetworksettings[static]:Hostname[hostname]:IPAddress[xxx.
xxx.
xxx.
xxx]:Netmask[xxx.
xxx.
xxx.
x]:Gateway[xxx.
xxx.
xxx.
xxx]:DNSDomain[xxxx.
xxx.
xxx]:PrimaryDNSServer[xxx.
xxx.
xxx.
xx]:SecondaryDNSServer[xxx.
xxx.
xx.
x]:Connectiontype(ssh,telnet,none)[ssh]:RebootingtheSCisrequiredforchangesintheabovenetworksettingstotakeeffect.
lom>第2章启动和设置SunFire入门级中型系统193.
安装Solaris操作系统(如有必要).
参阅Solaris操作系统版本附带的安装文档.
在ok提示符下键入OpenBootPROMboot命令以引导Solaris操作系统:若要了解其它可选device参数,请参阅OpenBootPROMdevalias命令,此命令显示了预定义的别名.
引导Solaris操作系统后,系统将显示login:提示符.
安装LightsOutManagement软件包SolarisSupplementaryCD中提供了SunFire入门级中型系统所需的三个LOM软件包.
SUNWlomu(LOMlite实用程序(usr))SUNWlomm(LOMlite手册页)SUNWlomr(LOM驱动程序).
注–您可从SunSolve获得这些软件包的最新修补程序.
Sun强烈建议您从SunSolve获取最新版本的修补程序并将其安装在SunFireE2900和SunFireV1280/Netra1280上,以便使用最新的LOM实用程序更新.
lom>poweron.
.
.
.
.
.
okokboot[device]login:20SunFire入门级中型系统管理指南2004年10月安装LOM驱动程序以超级用户身份键入以下命令:代码样例2-3安装LOM驱动程序#pkgadd-d.
SUNWlomrProcessingpackageinstancefromLOMlitedriver(root)(sparc)2.
0,REV=2000.
08.
22.
14.
14Copyright2000SunMicrosystems,Inc.
Allrightsreserved.
##Executingcheckinstallscript.
Usingasthepackagebasedirectory.
##Processingpackageinformation.
##Processingsysteminformation.
9packagepathnamesarealreadyproperlyinstalled.
##Verifyingpackagedependencies.
##Verifyingdiskspacerequirements.
##Checkingforconflictswithpackagesalreadyinstalled.
##Checkingforsetuid/setgidprograms.
Thispackagecontainsscriptswhichwillbeexecutedwithsuper-userpermissionduringtheprocessofinstallingthispackage.
Doyouwanttocontinuewiththeinstallationof[y,n,]yInstallingLOMlitedriver(root)as##Installingpart1of1.
20blocksi.
drivers(INFO):Startingi.
drivers(INFO):Installing/var/tmp/SUNWlomr/reloc/platform/sun4u/kernel/drv/lomi.
drivers(INFO):Installing/var/tmp/SUNWlomr/reloc/platform/sun4u/kernel/drv/lompi.
drivers(INFO):Installing/var/tmp/SUNWlomr/reloc/platform/sun4u/kernel/drv/sparcv9/lomi.
drivers(INFO):Installing/var/tmp/SUNWlomr/reloc/platform/sun4u/kernel/drv/sparcv9/lompi.
drivers(INFO):Installing/var/tmp/SUNWlomr/reloc/platform/sun4u/kernel/drv/sparcv9/lomvi.
drivers(INFO):Identifieddrivers'lomlomplomv'i.
drivers(INFO):Cleaningupolddriver'lom'.
.
.
Cleaningupolddevlinkentry'type=ddi_pseudo;name=SUNW,lomlom'i.
drivers(INFO):Cleaningupolddriver'lomp'.
.
.
Cleaningupolddevlinkentry'type=ddi_pseudo;name=lomplomp'i.
drivers(INFO):Cleaningupolddriver'lomv'.
.
.
Cleaningupolddevlinkentry'type=ddi_pseudo;name=SUNW,lomv\M0type=ddi_pseudo;name=lomv\M0'i.
drivers(INFO):Cleaningupolddriver'lomh'.
.
.
Cleaningupolddevlinkentry'type=ddi_pseudo;name=SUNW,lomhlom'i.
drivers(INFO):Addingdriver'lomp'.
.
.
driver='lomp'第2章启动和设置SunFire入门级中型系统21注–由于SUNWlomr软件包不在SunFire入门级中型系统上使用,因此在安装SUWNlomr软件包期间,可以忽略与lomp、lomv和lom驱动程序相关的警告消息.
不过,用户必须安装此软件包才能在以后使用修补程序进行升级.
aliases=''link='lomp'spec='lomp'Addingdevlinkentry'type=ddi_pseudo;name=lomplomp'addingdriverwithaliases''perm'*0644rootsys'devfsadm:driverfailedtoattach:lompWarning:Driver(lomp)successfullyaddedtosystembutfailedtoattachi.
drivers(INFO):Addingdriver'lomv'.
.
.
driver='lomv'aliases='SUNW,lomv'link='SUNW,lomvlomv'spec='\M0'Addingdevlinkentry'type=ddi_pseudo;name=SUNW,lomv\M0'Addingdevlinkentry'type=ddi_pseudo;name=lomv\M0'addingdriverwithaliases'SUNW,lomv'perm'*0644rootsys'devfsadm:driverfailedtoattach:lomvWarning:Driver(lomv)successfullyaddedtosystembutfailedtoattachi.
drivers(INFO):Addingdriver'lom'.
.
.
driver='lom'aliases='SUNW,lomhSUNW,lom'link='SUNW,lomhSUNW,lom'spec='lom'Addingdevlinkentry'type=ddi_pseudo;name=SUNW,lomhlom'Addingdevlinkentry'type=ddi_pseudo;name=SUNW,lomlom'addingdriverwithaliases'SUNW,lomhSUNW,lom'perm'*0644rootsys'devfsadm:driverfailedtoattach:lomWarning:Driver(lom)successfullyaddedtosystembutfailedtoattachi.
drivers(SUCCESS):Finished[verifyingclass]Installationofwassuccessful.
#代码样例2-3安装LOM驱动程序(续)22SunFire入门级中型系统管理指南2004年10月安装LOM实用程序以超级用户身份键入以下命令:安装LOM手册页以超级用户身份键入以下命令:代码样例2-4安装LOM实用程序#pkgadd-d.
SUNWlomuProcessingpackageinstancefromLOMliteUtilities(usr)(sparc)2.
0,REV=2000.
08.
22.
14.
14Copyright2000SunMicrosystems,Inc.
Allrightsreserved.
Usingasthepackagebasedirectory.
##Processingpackageinformation.
##Processingsysteminformation.
4packagepathnamesarealreadyproperlyinstalled.
##Verifyingpackagedependencies.
##Verifyingdiskspacerequirements.
##Checkingforconflictswithpackagesalreadyinstalled.
##Checkingforsetuid/setgidprograms.
InstallingLOMliteUtilities(usr)as##Installingpart1of1.
1432blocksInstallationofwassuccessful.
#代码样例2-5安装LOM手册页#pkgadd-d.
SUNWlommProcessingpackageinstancefromLOMlitemanualpages(sparc)2.
0,REV=2000.
08.
22.
14.
14Copyright2000SunMicrosystems,Inc.
Allrightsreserved.
第2章启动和设置SunFire入门级中型系统23重置系统在系统挂起或硬件出现故障时,可用reset命令来重置系统.
如果正在运行Solaris操作系统,系统会提示您确认此操作.
强行重置系统键入以下命令:默认情况下,重置程序将会使用XIR(外部重置)方式来重置系统中的CPU处理器.
外部重置程序会强行引导处理器进入OpenBootPROM,并启动OpenBootPROM错误重置恢复操作.
错误重置恢复操作将保留大部分的Solaris状态,以收集用于调试硬件和软件的数据,包括Solaris操作系统核心文件.
保存调试信息后,如果OpenBootPROM变量auto-boot的值为true,系统将引导Solaris操作系统.
通过设置OpenBootPROMerror-reset-recovery配置变量,可以控制OpenBootPROM错误重置恢复操作.
Usingasthepackagebasedirectory.
##Processingpackageinformation.
##Processingsysteminformation.
5packagepathnamesarealreadyproperlyinstalled.
##Verifyingdiskspacerequirements.
##Checkingforconflictswithpackagesalreadyinstalled.
##Checkingforsetuid/setgidprograms.
InstallingLOMlitemanualpagesas##Installingpart1of1.
71blocksInstallationofwassuccessful.
lom>resetThiswillabruptlyterminateSolaris.
Doyouwanttocontinue[no]yNOTICE:XIRonCPU3代码样例2-5安装LOM手册页(续)24SunFire入门级中型系统管理指南2004年10月在待机模式下无法使用reset命令.
如果使用,系统会显示"resetnotallowed,domainAkeyswitchissettooff"消息.
注–如果系统仍处于挂起状态(即您无法登录到Solaris操作系统,键入break命令强制系统回到OpenBootPROMok提示符下).
如果第一次键入reset命令不起作用,下次您必须键入reset-a以重置所有进程.
reset-a命令与OpenBootPROM下的reset-all命令等效.
重置系统控制器可用resetsc命令来重置系统控制器(SC).
当SC应用程序因硬件或软件问题而出现故障时,您可用此命令来重置SC.
此命令将重置SC,执行通过setupsc命令指定的SCPOST级别,并重新启动LOM软件.
lom>resetscAreyousureyouwanttorebootthesystemcontrollernow[no]y25第3章切换过程本章逐步介绍了连接系统以及在LOMshell和控制台之间切换的过程(附有图解).
此外,本章还说明了如何终止系统控制器(SC)进程.
本章包括下列主题:第26页"建立LOM控制台连接"第26页"连接到ASCII终端"第28页"连接到网络终端服务器"第29页"连接到工作站的串行端口B"第30页"使用远程连接访问LOM控制台"第32页"在不同控制台之间切换"第34页"切换到LOM提示符"第34页"从LOM提示符切换到Solaris控制台"第35页"从OpenBootPROM切换到LOM提示符"第35页"在Solaris运行时切换到OpenBoot提示符"第35页"在通过串行端口连接到系统控制器时终止进程"第36页"在通过网络连接到系统控制器时终止进程"26SunFire入门级中型系统管理指南2004年10月建立LOM控制台连接可用两种方法访问LOM控制台连接.
通过SC串行端口(直接)连接.
通过Telnet(网络)连接(使用10/100以太网端口).
警告–从固件版本5.
17.
0开始,默认情况下会禁用网络连接.
除非您使用setupnetwork命令启用了网络连接,否则您必须使用串行(直接)连接来访问LOM控制台.
在正常操作(Solaris正在运行或系统处于OpenBootPROM提示符下)条件下,连接到LOM控制台会使系统自动选择一个到Solaris控制台的连接.
如果系统不能连接到Solaris控制台,则会选择到LOM提示符的连接.
LOM提示符为:使用串行端口访问LOM控制台通过串行端口,您可以连接到以下三种类型的设备.
ASCII终端网络终端服务器工作站有关如何进行物理连接的详细信息,请参阅《SunFireE2900系统安装指南》或《SunFireV1280/Netra1280系统安装指南》.
连接这些设备的过程各不相同,如下所述.
连接到ASCII终端如果已设置LOM密码(且原来的连接已退出),系统将提示您输入密码.
1.
输入以前使用password命令设置的正确密码.
lom>EnterPassword:第3章切换过程27如果密码被接受,SC会指示连接已完成.
如果系统处于待机模式,则会自动显示lom提示符.
2.
否则,请按回车键,系统会显示Solaris控制台提示符.
3.
如果已通过网络端口建立了到LOM控制台的连接,则您可强行退出其它连接以实现连接目的:否则,请按回车键,系统会显示Solaris控制台提示符.
Connected.
lom>Connected.
#EnterPassword:Theconsoleisalreadyinuse.
Host:somehost.
acme.
comConnected:May2410:27Idletime:00:23:17Forcelogoutofotheruser(y/n)yConnected.
lom>Connected.
#28SunFire入门级中型系统管理指南2004年10月连接到网络终端服务器您将获得您可连接的各个服务器的菜单.
选择所需的服务器.
如果已设置LOM密码(且原来的连接已退出),系统将提示您输入密码.
1.
输入以前使用password命令设置的正确密码.
如果密码被接受,SC会指示连接已完成.
如果系统处于待机模式,则会自动显示lom提示符.
2.
否则,请按回车键,系统会显示Solaris控制台提示符.
3.
如果已通过网络端口建立了到LOM控制台的连接,则您可强行退出其它连接以实现连接目的:EnterPassword:Connected.
lom>Connected.
#EnterPassword:Theconsoleisalreadyinuse.
Host:somehost.
acme.
comConnected:May2410:27Idletime:00:23:17Forcelogoutofotheruser(y/n)yConnected.
lom>第3章切换过程294.
否则,请按回车键,系统会显示Solaris控制台提示符.
连接到工作站的串行端口B1.
在Solarisshell提示符下键入以下命令:有关tip命令的详细信息,请参阅tip手册页.
如果已设置LOM密码(且原来的连接已退出),系统会提示您输入密码.
2.
输入以前使用password命令设置的正确密码.
如果密码被接受,SC会指示连接已完成.
如果系统处于待机模式,则会自动显示lom提示符.
否则,请按回车键,系统会显示Solaris控制台提示符.
Connected.
##tiphardwireEnterPassword:Connected.
lom>Connected.
#30SunFire入门级中型系统管理指南2004年10月3.
如果已通过网络端口建立了到LOM控制台的连接,则您可强行退出其它连接以实现连接目的:使用远程连接访问LOM控制台要通过连接至10/100以太网端口的远程连接(例如:SSH连接)访问LOM控制台,您必须首先配置该接口.
参阅第17页"配置网络参数".
1.
在Solaris提示符下键入ssh命令以连接到SC.
2.
如果已设置LOM密码,系统会提示您输入密码.
3.
输入以前使用password命令设置的正确密码.
如果密码被接受,SC会指示连接已完成.
如果系统处于待机模式,则会自动显示lom提示符.
EnterPassword:Theconsoleisalreadyinuse.
Host:somehost.
acme.
comConnected:May2410:27Idletime:00:23:17Forcelogoutofotheruser(y/n)yConnected.
lom>%sshhostname#Enterpassword:Connected.
lom>第3章切换过程314.
否则,请按回车键,系统会显示Solaris控制台提示符.
5.
如果已通过串行端口建立了到LOM控制台的连接,则您可强行退出其它连接以实现连接目的:此情况下,您应首先在串行连接上运行LOMlogout命令,以使该连接可用.
有关详细信息,请参阅《SunFireEntry-LevelMidrangeSystemControllerCommandReferenceManual》.
断开LOM控制台连接使用LOM控制台后,您可以使用logout命令断开连接.
通过串行端口连接时,系统会作出以下回应:Connected.
##sshhostnameTheconsoleisalreadyinuse.
Host:somehost.
acme.
comConnected:May2410:27Idletime:00:23:17Forcelogoutofotheruser(y/n)yConnected.
lom>lom>logoutConnectionclosed.
32SunFire入门级中型系统管理指南2004年10月通过网络连接时,系统会作出以下回应:在不同控制台之间切换通过SC控制台连接,用户可访问SCLOM命令行界面或SolarisOpenBootPROM控制台.
本节介绍如何在以下进程之间切换:LOM提示符.
Solaris操作系统.
OpenBootPROM.
图3-1显示了这些切换过程.
lom>logoutConnectionclosed.
Connectiontohostnameclosedbyremotehost.
Connectiontohostnameclosed.
Connectionclosed.
$第3章切换过程33图3-1控制台间的切换过程Solaris操作系统OpenBootPROMLOMshell#oklom>键入换码序列键入换码序列键入:lom>console键入:lom>break34SunFire入门级中型系统管理指南2004年10月切换到LOM提示符连接到Solaris控制台时,键入换码序列可从控制台切换到LOM提示符.
默认情况下,换码序列设为"#.
",即#符号后面加一个英文句号.
例如,如果换码序列为默认的"#.
".
您会看到:当您键入换码序列的第一个字符时,这个字符在一秒钟后才会显示在屏幕上.
这是因为系统在等待下一个键入的字符是否是换码序列中的下一个字符.
第二个字符必须在这一秒内键入.
键入所有换码序列字符后,系统将显示lom>提示符.
如果下一个键入的字符不是换码序列的下一个字符,屏幕将显示已键入的换码序列字符.
在选择换码序列时,不要以那些经常在控制台上键入的字符开头,否则,您所敲击的字符键与显示在屏幕上的字符可能会出现延迟,并且可能会造成混乱.
从LOM提示符切换到Solaris控制台在LOM提示符下键入console命令,然后按回车键.
如果Solaris软件正在运行,系统将会显示Solaris提示符:如果系统先前处于OpenBootPROM提示符下,则会显示OpenBootPROM提示符:如果系统处于待机模式,则会生成以下消息:lom>lom>console#lom>console{2}oklom>consoleSolarisisnotactive第3章切换过程35从OpenBootPROM切换到LOM提示符从OpenBootPROM切换到LOM提示符的过程与从Solaris操作系统切换到LOM提示符的过程相同.
键入换码序列字符(默认为#.
).
在Solaris运行时切换到OpenBoot提示符Solaris操作系统正在运行时,向控制台发送中断信号的通常用途是强制系统进入OpenBootPROM或核心调试程序.
在LOM提示符下键入break命令可以实现这一目的:在通过串行端口连接到系统控制器时终止进程如果您现处于Solaris提示符或OpenBootPROM下,请键入换码序列以切换到LOM提示符,然后键入logout并按回车键以终止LOM提示符进程:如果您通过终端服务器连接到系统控制器,请调用终端服务器命令以断开连接.
如果连接是通过tip命令建立的,请键入tip退出序列~.
(波浪号加英文句号):{2}oklom>lom>breakThiswillsuspendSolaris.
Doyouwanttocontinue[no]yType'go'toresumedebuggerentered.
{1}oklom>logout~.
36SunFire入门级中型系统管理指南2004年10月在通过网络连接到系统控制器时终止进程如果您现处于Solaris提示符或OpenBootPROM下,请键入换码序列以切换到LOM提示符下,然后键入logout命令以终止LOM提示符进程.
远程进程(SSH或Telnet,取决于使用setupnetwork命令所选的设置)会自动终止:lom>logoutConnectionclosedbyforeignhost.
%37第4章系统控制器消息日志对于各种系统事件,如打开电源、引导系统、关闭电源、更改可热插拔的装置、环境警告等,SC可以生成具有时戳的消息.
最初,消息存储在SC板内存的缓冲区内,此缓冲区可循环存储128条消息(注意一条消息可跨越多行).
另外,SC还将这些消息发送给正在运行Solaris软件的Solaris主机,由系统日志守护程序(syslogd)来处理这些消息.
Solaris软件正在运行时,SC会在生成消息的同时将它们发送出去.
引导Solaris操作系统或重置SC时,系统会检索尚未从SC中复制的消息.
此外,还可以在Solaris提示符下运行lom(1m)实用程序来显示这些消息(参阅第5章).
一般情况下,这些消息存储在Solaris主机的/var/adm/messages文件中,唯一的限制因素是可用的磁盘空间.
存储在SC消息缓冲区内的消息很容易丢失.
如果发生以下情况,消息将会丢失:两个电源同时断电而导致关闭SC的电源可工作的电源设备少于两个拆除IB_SSC重置SC重新引导Solaris操作系统时,存储在系统磁盘上的消息仍可使用.
在lom>提示符下,用户可用seteventreporting命令来控制共享Solaris/SC控制台端口上的消息显示(参阅《SunFireEntry-LevelMidrangeSystemControllerCommandReferenceManual》).
该命令确定系统控制器在生成消息时是否立即在lom>提示符下打印消息,以及是否将消息传送给Solaris日志系统,以便将其写入/var/adm/messages文件.
38SunFire入门级中型系统管理指南2004年10月注–在配有增强内存SC(也称"SCV2")的系统中,可另外使用112KB的SC内存区域来存储固件消息.
此内存是非易失性的;当关闭SC的电源时,其存储的消息不会丢失.
原来的LOM历史记录缓冲区是动态的,在电源关闭时会丢失信息.
在lom>提示符下使用showlogs–p命令或showerrorbuffer-p命令可显示SCV2永久历史记录日志中存储的消息.
有关说明,请参阅《SunFireEntry-LevelMidrangeSystemControllerCommandReferenceManual》中的相应章节.
图4-1显示了这两种消息缓冲区.
图4-1系统控制器日志主要系统硬件主CPUSolaris消息删除启动并运行系统时可访问磁盘中的/var/adm/messages文件系统控制器LOM写入消息LOM端口无论系统处于打开或待机模式(即系统控制器未停止运行或未断电),均可使用LOM命令访问历史记录日志.
删除永久LOM历史记录日志(112KB).
仅在具有5.
17.
0固件的SCV2上可用.
循环缓冲区(可存储128条消息)中的LOM历史记录日志最后输入的消息可供使用(先进先出)39第5章在Solaris操作系统中使用LightsOutManagement和系统控制器本章介绍如何在Solaris中通过可用的LightsOutManagement(LOM)特定命令来监控和管理SunFire入门级中型系统.
要使用这些命令,您必须从SolarisSupplementalCD中安装LightsOutManagement2.
0软件包(SUNWlomr、SUNWlomu和SUNWlomm).
有关如何安装LOM软件包的说明,请参阅第19页"安装LightsOutManagement软件包".
注–您可以从SunSolve的修补程序110208中获得这些软件包的最新修补程序.
Sun强烈建议您从SunSolve获取最新版本的修补程序110208,并将其安装在SunFire入门级中型系统上,从而使用最新的LOM实用程序.
本章包括下列主题:第40页"在Solaris操作系统中监控系统"第47页"可在Solaris操作系统中执行的其它LOM任务"LOM命令语法lom[-c][-l][-f][-v][-t][-a][-G][-X]#lom-en,[x]lom-Aon|offlom-Eon|off40SunFire入门级中型系统管理指南2004年10月其中:-c显示LOM配置.
-l显示故障LED指示灯和警报LED指示灯的状态.
-e显示事件日志.
-f显示风扇状态.
另外,此信息还显示在Solarisprtdiag-v命令的输出中.
-v显示电压传感器的状态.
另外,此信息还显示在Solarisprtdiag-v命令的输出中.
-t显示温度信息.
另外,此信息还显示在Solarisprtdiag-v命令的输出中.
-a显示所有组件的状态数据.
-A打开和关闭警报.
-X更改换码序列.
-E打开或关闭控制台事件日志.
-G升级固件.
在Solaris操作系统中监控系统可用两种方法查询LOM设备(SC)或向其发送要执行的命令:在lom>shell提示符下执行LOM命令(参阅第3章).
在UNIX#提示符下执行LOM特定的Solaris命令,如本章所述.
本节介绍的Solaris命令均可通过在UNIX#提示符下运行/usr/sbin/lom实用程序来获得.
本节在介绍这些命令行时还根据需要附带了它们的典型输出.
第5章在Solaris操作系统中使用LightsOutManagement和系统控制器41查看LOM联机文档要查看LOM实用程序的手册页,请键入以下命令:查看LOM配置(lom-c)要查看LOM的当前配置,请键入以下命令:检查故障LED和警报LED指示灯的状态(lom-l)要检查是否已打开(或关闭)系统故障LED指示灯和警报LED指示灯,请键入以下命令:Alarm1和Alarm2是软件标记.
它们与特定条件无关,您可按自己的方式或通过命令行进行设置(参阅第48页"打开和关闭警报(lom-A)").
Alarm3表示UNIXRunning(UNIX运行),用户不能自行配置.
#manlom代码样例5-1lom-c命令的输出样例#lom-cLOMconfigurationsettings:serialescapesequence=#.
serialeventreporting=defaultEventreportinglevel=fatal,warning&informationfirmwareversion=5.
17.
0,build5.
0productID=NetraT12代码样例5-2lom-l命令的输出样例#lom-lLOMalarmstates:Alarm1=offAlarm2=offAlarm3=onFaultLED=off#42SunFire入门级中型系统管理指南2004年10月查看事件日志(lom-e)要查看事件日志,请键入以下命令:其中n是您想查看的报告数(最多128条),x指定您感兴趣的报告级别.
共有四种事件级别:1.
致命事件2.
警告事件3.
信息事件4.
用户事件(不适用于SunFire入门级中型系统)如果您指定一个级别,将会看到该级别以及该级别以上的事件报告.
例如,如果指定级别2,将会看到级别2和级别1的事件报告.
如果指定级别3,将会看到级别3、级别2和级别1的事件报告.
如果未指定级别,将会看到级别3、级别2和级别1的事件报告.
代码样例5-3显示了事件日志的样例.
#lom-en,[x]代码样例5-3LOM事件日志的样例(先报告最早的事件)#lom-e11LOMliteEventLog:FriJul1915:16:00commando-sclom:Boot:ScApp5.
13.
0007,RTOS23FriJul1915:16:06commando-sclom:CachingIDinformationFriJul1915:16:08commando-sclom:ClockSource:75MHzFriJul1915:16:10commando-sclom:/N0/PS0:StatusisOKFriJul1915:16:11commando-sclom:/N0/PS1:StatusisOKFriJul1915:16:11commando-sclom:Chassisisinsinglepartitionmode.
FriJul1915:27:29commando-sclom:LocatorOFFFriJul1915:27:46commando-sclom:Alarm1ONFriJul1915:27:52commando-sclom:Alarm2ONFriJul1915:28:03commando-sclom:Alarm1OFFFriJul1915:28:08commando-sclom:Alarm2OFF第5章在Solaris操作系统中使用LightsOutManagement和系统控制器43检查风扇(lom-f)要检查风扇的状态,请键入以下命令:如果需要更换风扇,请与Sun当地的销售代表联系,并提供所需组件的部件号码.
有关信息,请相应参阅《SunFireV1280/Netra1280ServiceManual》或《SunFireE2900SystemServiceManual》.
另外,此命令的信息输出也包含在Solarisprtdiag-v命令的输出中.
检查内部电压传感器(lom-v)-v选项可以显示SunFire入门级中型系统内部电压传感器的状态.
要检查各条供电干线和内部电压传感器的状态,请键入以下命令:代码样例5-4lom-f命令的输出样例#lom-fFans:1OKspeedself-regulating2OKspeedself-regulating3OKspeedself-regulating4OKspeedself-regulating5OKspeedself-regulating6OKspeedself-regulating7OKspeedself-regulating8OKspeedself-regulating9OKspeed100%10OKspeed100%#代码样例5-5lom-v命令的输出样例#lom-vSupplyvoltages:1SSC1v_1.
5vdc0status=ok2SSC1v_3.
3vdc0status=ok3SSC1v_5vdc0status=ok4RP0v_1.
5vdc0status=ok5RP0v_3.
3vdc0status=ok6RP2v_1.
5vdc0status=ok7RP2v_3.
3vdc0status=ok8SB0v_1.
5vdc0status=ok9SB0v_3.
3vdc0status=ok44SunFire入门级中型系统管理指南2004年10月10SB0/P0v_cheetah0status=ok11SB0/P1v_cheetah1status=ok12SB0/P2v_cheetah2status=ok13SB0/P3v_cheetah3status=ok14SB2v_1.
5vdc0status=ok15SB2v_3.
3vdc0status=ok16SB2/P0v_cheetah0status=ok17SB2/P1v_cheetah1status=ok18SB2/P2v_cheetah2status=ok19SB2/P3v_cheetah3status=ok20IB6v_1.
5vdc0status=ok21IB6v_3.
3vdc0status=ok22IB6v_5vdc0status=ok23IB6v_12vdc0status=ok24IB6v_3.
3vdc1status=ok25IB6v_3.
3vdc2status=ok26IB6v_1.
8vdc0status=ok27IB6v_2.
4vdc0status=okSystemstatusflags:1PS0status=okay2PS1status=okay3FT0status=okay4FT0/FAN0status=okay5FT0/FAN1status=okay6FT0/FAN2status=okay7FT0/FAN3status=okay8FT0/FAN4status=okay9FT0/FAN5status=okay10FT0/FAN6status=okay11FT0/FAN7status=okay12RP0status=okay13RP2status=okay14SB0status=ok15SB0/P0status=online16SB0/P0/B0/D0status=okay17SB0/P0/B0/D1status=okay18SB0/P0/B0/D2status=okay19SB0/P0/B0/D3status=okay20SB0/P1status=online21SB0/P1/B0/D0status=okay22SB0/P1/B0/D1status=okay23SB0/P1/B0/D2status=okay24SB0/P1/B0/D3status=okay25SB0/P2status=online26SB0/P2/B0/D0status=okay27SB0/P2/B0/D1status=okay28SB0/P2/B0/D2status=okay代码样例5-5lom-v命令的输出样例(续)第5章在Solaris操作系统中使用LightsOutManagement和系统控制器45另外,此命令的信息输出也包含在Solarisprtdiag-v命令的输出中.
29SB0/P2/B0/D3status=okay30SB0/P3status=online31SB0/P3/B0/D0status=okay32SB0/P3/B0/D1status=okay33SB0/P3/B0/D2status=okay34SB0/P3/B0/D3status=okay35SB2status=ok36SB2/P0status=online37SB2/P0/B0/D0status=okay38SB2/P0/B0/D1status=okay39SB2/P0/B0/D2status=okay40SB2/P0/B0/D3status=okay41SB2/P1status=online42SB2/P1/B0/D0status=okay43SB2/P1/B0/D1status=okay44SB2/P1/B0/D2status=okay45SB2/P1/B0/D3status=okay46SB2/P2status=online47SB2/P2/B0/D0status=okay48SB2/P2/B0/D1status=okay49SB2/P2/B0/D2status=okay50SB2/P2/B0/D3status=okay51SB2/P3status=online52SB2/P3/B0/D0status=okay53SB2/P3/B0/D1status=okay54SB2/P3/B0/D2status=okay55SB2/P3/B0/D3status=okay56IB6status=ok57IB6/FAN0status=okay58IB6/FAN1status=okay#代码样例5-5lom-v命令的输出样例(续)46SunFire入门级中型系统管理指南2004年10月检查内部温度(lom-t)要检查系统内部温度以及系统警告和关闭的临界温度,请键入以下命令:代码样例5-6lom-t命令的输出样例#lom-tSystemTemperatureSensors:1SSC1t_sbbc036degC:warning102degC:shutdown107degC2SSC1t_cbh045degC:warning102degC:shutdown107degC3SSC1t_ambient023degC:warning82degC:shutdown87degC4SSC1t_ambient121degC:warning82degC:shutdown87degC5SSC1t_ambient228degC:warning82degC:shutdown87degC6RP0t_ambient022degC:warning82degC:shutdown87degC7RP0t_ambient122degC:warning53degC:shutdown63degC8RP0t_sdc062degC:warning102degC:shutdown107degC9RP0t_ar047degC:warning102degC:shutdown107degC10RP0t_dx062degC:warning102degC:shutdown107degC11RP0t_dx165degC:warning102degC:shutdown107degC12RP2t_ambient023degC:warning82degC:shutdown87degC13RP2t_ambient122degC:warning53degC:shutdown63degC14RP2t_sdc057degC:warning102degC:shutdown107degC15RP2t_ar042degC:warning102degC:shutdown107degC16RP2t_dx053degC:warning102degC:shutdown107degC17RP2t_dx156degC:warning102degC:shutdown107degC18SB0t_sdc048degC:warning102degC:shutdown107degC19SB0t_ar039degC:warning102degC:shutdown107degC20SB0t_dx049degC:warning102degC:shutdown107degC21SB0t_dx154degC:warning102degC:shutdown107degC22SB0t_dx257degC:warning102degC:shutdown107degC23SB0t_dx353degC:warning102degC:shutdown107degC24SB0t_sbbc053degC:warning102degC:shutdown107degC25SB0t_sbbc140degC:warning102degC:shutdown107degC26SB0/P0Ambient29degC:warning82degC:shutdown87degC27SB0/P0Die57degC:warning92degC:shutdown97degC28SB0/P1Ambient27degC:warning82degC:shutdown87degC29SB0/P1Die51degC:warning92degC:shutdown97degC30SB0/P2Ambient27degC:warning82degC:shutdown87degC31SB0/P2Die53degC:warning92degC:shutdown97degC32SB0/P3Ambient29degC:warning82degC:shutdown87degC33SB0/P3Die50degC:warning92degC:shutdown97degC34SB2t_sdc051degC:warning102degC:shutdown107degC35SB2t_ar040degC:warning102degC:shutdown107degC36SB2t_dx052degC:warning102degC:shutdown107degC37SB2t_dx154degC:warning102degC:shutdown107degC38SB2t_dx261degC:warning102degC:shutdown107degC39SB2t_dx353degC:warning102degC:shutdown107degC40SB2t_sbbc052degC:warning102degC:shutdown107degC第5章在Solaris操作系统中使用LightsOutManagement和系统控制器47另外,此命令的信息输出也包含在Solarisprtdiag-v命令的输出中.
查看所有组件的状态数据和LOM的配置数据(lom-a)要查看所有LOM的状态和配置数据,请键入以下命令:可在Solaris操作系统中执行的其它LOM任务本节介绍如何:打开和关闭警报指示灯更改LOM换码序列停止LOM向控制台发送报告升级固件41SB2t_sbbc142degC:warning102degC:shutdown107degC42SB2/P0Ambient27degC:warning82degC:shutdown87degC43SB2/P0Die54degC:warning92degC:shutdown97degC44SB2/P1Ambient26degC:warning82degC:shutdown87degC45SB2/P1Die53degC:warning92degC:shutdown97degC46SB2/P2Ambient27degC:warning82degC:shutdown87degC47SB2/P2Die51degC:warning92degC:shutdown97degC48SB2/P3Ambient27degC:warning82degC:shutdown87degC49SB2/P3Die51degC:warning92degC:shutdown97degC50IB6t_ambient029degC:warning82degC:shutdown87degC51IB6t_ambient129degC:warning82degC:shutdown87degC52IB6t_sdc068degC:warning102degC:shutdown107degC53IB6t_ar077degC:warning102degC:shutdown107degC54IB6t_dx076degC:warning102degC:shutdown107degC55IB6t_dx178degC:warning102degC:shutdown107degC56IB6t_sbbc051degC:warning102degC:shutdown107degC57IB6t_schizo048degC:warning102degC:shutdown107degC58IB6t_schizo153degC:warning102degC:shutdown107degC#lom-a代码样例5-6lom-t命令的输出样例(续)48SunFire入门级中型系统管理指南2004年10月打开和关闭警报(lom-A)与LOM关联的警报有两个.
它们与特定条件无关,只是软件标记,您可按自己的方式或通过命令行进行设置.
1.
要通过命令行打开警报,请键入以下命令:其中n是您想设置的警报的编号:1或2.
2.
要关闭警报,请键入以下命令:其中n是您想关闭的警报的编号:1或2.
更改lom>提示符的换码序列(lom-X)字符序列#.
(井号,句点)可以使您从Solaris切换到lom>提示符下.
要更改默认的换码序列,请键入以下命令:其中xy是您想使用的字母数字字符.
注–对于需要通过Shell编译的特殊字符,可能需要加上引号.
如果您在控制台键入换码序列的第一个字符,这个字符在一秒钟后才会显示在屏幕上.
这是因为系统在等待下一个键入的字符是否是换码序列中的下一个字符.
键入所有换码序列字符后,系统将显示lom>提示符.
如果下一个键入的字符不是换码序列的下一个字符,屏幕将显示已键入的换码序列字符.
#lom-Aon,n#lom-Aoff,n#lom-Xxy第5章在Solaris操作系统中使用LightsOutManagement和系统控制器49在LOM提示符下停止LOM向控制台发送报告(lom-Eoff)LOM事件报告可能会对您欲在控制台上发送或接收的信息造成干扰.
要在LOM提示符下停止LOM消息的显示,请关闭连续事件报告.
这相当于《SunFireEntry-LevelMidrangeSystemControllerCommandReferenceManual》中介绍的seteventreporting命令.
1.
要停止LOM向控制台发送报告,请键入以下命令:2.
要重新启用连续事件报告,请键入以下命令:升级固件(lom-Gfilename)有关详细信息,请参阅第11章.
#lom-Eoff#lom-Eon50SunFire入门级中型系统管理指南2004年10月51第6章运行POST每个系统板(CPU/内存板和IB_SSC部件)均配有闪存PROM.
此PROM用于为通电自测(POST)诊断程序提供存储空间.
POST诊断程序测试以下各项:CPU芯片外部高速缓存内存总线互连I/OASICI/O总线POST提供了多个诊断级别.
您可以通过OpenBootPROM变量diag-level来选择这些级别.
另外,使用bootmode命令可以声明系统下次重新引导时所用的POST设置.
系统安装了专用于诊断SC的POST,此POST可以通过setupsc命令来控制.
本章包括下列主题:第51页"用于配置POST的OpenBootPROM变量"第55页"使用bootmode命令控制POST"第55页"控制系统控制器POST"用于配置POST的OpenBootPROM变量您可以使用OpenBootPROM来设置用于配置POST运行方式的变量.
《OpenBoot4.
xCommandReferenceManual》中介绍了这些变量.
您可以使用OpenBootprintenv命令显示变量的当前设置:{3}okprintenvdiag-leveldiag-levelinit(init)52SunFire入门级中型系统管理指南2004年10月您可以使用OpenBootPROMsetenv命令更改变量的当前设置:例如,您可以使用以下命令配置POST,使其以最快的速度运行:这与在LOM提示符下运行SC命令bootmodeskipdiag的效果相同.
区别在于OpenBoot命令将永久性保留这些设置,直到您再次作出更改.
{1}oksetenvdiag-levelquickdiag-level=quick{1}oksetenvdiag-levelinitdiag-level=init{1}oksetenvverbosity-leveloffverbosity-level=off表6-1POST配置参数参数值说明diag-levelinit(默认值)只运行系统板初始化代码.
不进行任何测试.
这种方式将快速通过POST.
quick使用少数测试模式对所有系统板组件进行少量的测试.
max使用所有测试模式对除内存和Ecache模块以外的所有系统板组件进行全面测试.
对于内存和Ecache模块,则使用多种模式对所有存储单元进行测试.
此级别不运行规模较大且耗时的算法.
mem1以默认级别运行所有测试并运行更加详尽的DRAM和SRAM测试算法.
mem2与mem1大致相同,只不过多了一项DRAM测试,这项测试明确比较DRAM数据的操作.
verbosity-leveloff不显示任何状态消息.
min(默认值)显示测试名称状态消息和错误消息.
max显示子测试跟踪消息.
error-leveloff不显示错误消息.
min显示失败的测试名称.
max(默认值)显示所有相关的错误状态.
第6章运行POST53interleave-scopewithin-board(默认值)系统板上的内存组将进行交叉存储.
across-boards系统中所有系统板内存组上的内存都将进行交叉存储.
interleave-modeoptimal(默认值)内存将进行不同大小的交叉存储,以达到最佳性能.
fixed内存将进行固定大小的交叉存储.
off不进行内存交叉存储.
reboot-on-errorfalse(默认值)出错时暂停系统.
true出错时重新引导系统.
use-nvramrc此参数的作用与OpenBootPROM下的nvramrc参数相同.
此参数使用存储在nvramrc中的别名.
true如果此参数设为true,OpenBootPROM将执行存储在nvramrc中的脚本.
false(默认值)如果此参数设为false,OpenBootPROM将不评估存储在nvramrc中的脚本.
auto-boot控制Solaris操作系统的引导.
true(默认值)如果此参数设为true,系统将在运行POST后自动引导Solaris操作系统.
false如果此参数设为false,则在运行POST后,系统会显示OpenBootPROMok提示符,您必须在此提示符下键入boot命令才能引导Solaris操作系统.
error-reset-recovery控制系统在发生外部重置(XIR)和红色模式陷阱之后的行为.
sync(默认值)OpenBootPROM调用sync.
此时会生成一个核心文件.
如果调用返回,OpenBootPROM将执行重新引导.
noneOpenBootPROM打印一则描述(造成错误重置的)重置陷阱的消息,并将控制权传递到OpenBootPROMok提示符下.
描述重置陷阱类型的消息因平台而异.
bootOpenBootPROM固件重新引导系统,但不生成核心文件.
系统可用diag-device或boot-device参数的OpenBootPROM设置来执行重新引导,具体取决于OpenBootPROM配置变量diag-switch的值.
如果diag-switch设为true,系统将默认使用diag-device参数中指定的设备来执行引导.
如果diag-switch设为false,系统将默认使用boot-device参数中指定的设备来执行引导.
表6-1POST配置参数(续)参数值说明54SunFire入门级中型系统管理指南2004年10月POST的默认输出类似于代码样例6-1.
代码样例6-1使用max设置时的POST输出TestingCPUBoards.
.
.
LoadingthetesttablefromboardSB0PROM0.
.
.
{/N0/SB0/P0}RunningCPUPORandSetClocks{/N0/SB0/P1}RunningCPUPORandSetClocks{/N0/SB0/P2}RunningCPUPORandSetClocks{/N0/SB0/P3}RunningCPUPORandSetClocks{/N0/SB0/P0}@(#)lpost5.
13.
00072002/07/1812:45{/N0/SB0/P2}@(#)lpost5.
13.
00072002/07/1812:45{/N0/SB0/P1}@(#)lpost5.
13.
00072002/07/1812:45{/N0/SB0/P0}Copyright2001SunMicrosystems,Inc.
Allrightsreserved.
{/N0/SB0/P0}Subtest:SettingFireplaneConfigRegisters{/N0/SB0/P0}Subtest:DisplayCPUVersion,frequency{/N0/SB0/P0}Versionregister=003e0015.
21000507{/N0/SB0/P0}Cpu/Systemratio=6,cpuactualfrequency=900{/N0/SB0/P1}Copyright2001SunMicrosystems,Inc.
Allrightsreserved.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
pcibootbus-controllerpciProbing/ssm@0,0/pci@18,700000Device1NothingthereProbing/ssm@0,0/pci@18,700000Device2NothingthereProbing/ssm@0,0/pci@18,700000Device3idediskcdromProbing/ssm@0,0/pci@18,600000Device1NothingthereProbing/ssm@0,0/pci@18,600000Device2scsidisktapescsidisktapepcipciProbing/ssm@0,0/pci@19,700000Device1NothingthereProbing/ssm@0,0/pci@19,700000Device2NothingthereProbing/ssm@0,0/pci@19,700000Device3NothingthereProbing/ssm@0,0/pci@19,600000Device1networkProbing/ssm@0,0/pci@19,600000Device2networkSunFireV1280OpenFirmwareversion5.
13.
0007(02-7-1812:45)Copyright2001SunMicrosystems,Inc.
Allrightsreserved.
SmartFirmware,Copyright(C)1996-2001.
保留所有权利.
16384MBmemoryinstalled,Serial#9537054.
Ethernetaddress8:0:xx:xx:xx:xx,HostID:80xxxxxx.
NOTICE:obp_main:Extendeddiagnosticsarenowswitchedon.
{0}ok第6章运行POST55使用bootmode命令控制POSTSCbootmode命令只能用于指定系统下次重新引导时所用的引导配置.
这样就不必将系统切换到OpenBootPROM下进行相应更改,例如更改diag-level变量.
例如,使用以下命令强迫系统在下次重新引导之前运行最高级别的POST测试:要强迫系统在下次重新引导之前运行最低级别的POST测试,请使用:如果系统未在发出bootmode命令之后的十分钟内重新引导,bootmode设置将返回到normal状态,并应用以前设置的diag-level值和verbosity-level值.
有关这些命令的详细信息,请参阅《SunFireEntry-LevelMidrangeSystemControllerCommandReferenceManual》.
控制系统控制器POSTSC的通电自测(POST)程序通过LOMsetupsc命令进行配置.
此命令可将SC的POST级别设为off、min或max.
有关此命令的详细信息,请参阅《SunFireEntry-LevelMidrangeSystemControllerCommandReferenceManual》.
SCPOST输出只显示在SC串行连接上.
lom>shutdownlom>bootmodediaglom>poweronlom>shutdownlom>bootmodeskipdiaglom>poweron56SunFire入门级中型系统管理指南2004年10月要将SCPOST诊断级别默认值设为min,请键入以下命令:SCPOSTdiag-level设为min时,如果您重置SC,串行端口上会产生以下输出:代码样例6-2将SCPOST诊断级别设为minlom>setupscSystemControllerConfigurationSCPOSTdiagLevel[off]:minHostWatchdog[enabled]:RockerSwitch[enabled]:SecureMode[off]:lom>代码样例6-3诊断级别设为min时的SCPOST输出@(#)SYSTEMCONTROLLER(SC)POST212001/12/1117:11PSR=0x044010e5PCR=0x04004000SelfTestrunningatDiagLevel:0x20SCBootPROMTestBootPROMCheckSumTestIUTestIUinstructionsetTestLittleendianaccessTestFPUTestFPUinstructionsetTestSparcReferenceMMUTestSRMMUTLBRAMTestSRMMUTLBReadmissTestSRMMUpageprobeTestSRMMUsegmentprobeTestSRMMUregionprobeTestSRMMUcontextprobeTest.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
LocalI2CAT24C64TestEEPROMDeviceTestperformingeepromsequentialread第6章运行POST57LocalI2CPCF8591TestVOLT_ADDeviceTestchannel[00000001]Voltage(0x00000099):1.
49channel[00000002]Voltage(0x0000009D):3.
37channel[00000003]Voltage(0x0000009A):5.
1channel[00000004]Voltage(0x00000000):0.
0LocalI2CLM75TestTEMP0(IIep)DeviceTestTemparature:24.
50Degree(C)LocalI2CLM75TestTEMP1(Rio)DeviceTestTemparature:23.
50Degree(C)LocalI2CLM75TestTEMP2(CBH)DeviceTestTemparature:32.
0Degree(C)LocalI2CPCF8574TestScCSRDeviceTestConsoleBusHubTestCBHRegisterAccessTestPOSTComplete.
代码样例6-3诊断级别设为min时的SCPOST输出(续)58SunFire入门级中型系统管理指南2004年10月59第7章自动诊断与恢复本章介绍SunFire入门级中型系统固件附带的错误诊断和域恢复功能.
本章包括下列主题:第59页"自动诊断与恢复概述"第61页"挂起系统的自动恢复"第62页"诊断事件"第63页"诊断和恢复控制"第64页"获得自动诊断和恢复信息"自动诊断与恢复概述默认情况下,SunFire中型系统中启用了诊断和恢复功能.
本节简要介绍这些功能的工作原理.
如图7-1所示,系统控制器根据发生的硬件错误类型和设置的诊断控制选项来执行某些诊断和恢复步骤.
固件具有自动诊断(AD)引擎,该引擎用于检测并诊断那些影响系统可用性的硬件错误.
注–虽然入门级中型系统不象其它中型系统那样支持多个域,但通常诊断输出中提供的系统状态是DomainA(域A)的状态.
60SunFire入门级中型系统管理指南2004年10月图7-1自动诊断与恢复过程下面简要描述了图7-1中所示的过程:1.
SC检测硬件错误并暂停操作系统.
2.
自动诊断.
AD引擎分析硬件错误并确定哪些现场可更换件(FRU)与硬件错误相关.
根据硬件错误和涉及的组件,AD引擎提供以下诊断结果之一:确定导致错误的单个FRU.
确定导致错误的多个FRU.
注意,并非所有列出的组件均存在故障.
硬件错误可能与所列组件的一部分相关.
指明无法确定导致错误的FRU.
这种情形被视为"unresolved"(未解决),需要服务人员进一步分析.
AD引擎记录受影响组件的诊断信息,并将此信息作为组件运行状况(CHS)的一部分进行维护.
AD引擎以控制台事件消息的形式报告诊断信息.
系统正在运行自动诊断自动恢复系统控制器检测到硬件错误并暂停操作系统(OS)OS重新启动第7章自动诊断与恢复61代码样例7-1显示了控制台上出现的自动诊断事件消息.
在此样例中,单个FRU导致了硬件错误.
有关AD消息内容的详情,请参阅第64页"查看自动诊断事件消息".
注–看到这些自动诊断消息时,请与服务人员联系.
服务人员将查看这些自动诊断信息,并采取适当的服务措施.
showlogs、showboards、showcomponent和showerrorbuffer命令的输出(有关这些命令显示的与诊断相关的详情,请参阅第64页"获得自动诊断和恢复信息").
这些命令的输出补充了事件消息中提供的诊断信息,可用于进一步排除故障.
3.
自动恢复.
在自动恢复过程中,POST会检查由AD引擎更新的FRU组件运行状况.
POST使用此信息,并通过取消配置(禁用)域中已确定为导致硬件错误的所有FRU,来尝试隔离故障.
即使POST无法隔离故障,作为域恢复的一部分,系统控制器也会随后自动重新引导该域.
挂起系统的自动恢复在出现以下任一情况时,系统控制器会自动监控系统是否挂起:在指定的超时期内操作系统心跳停止.
默认的超时值是3分钟,但您可以在域/etc/systems文件中设置watchdog_timeout_seconds参数以更改此值.
如果将该值设为小于3分钟,系统控制器仍使用3分钟(默认值)的超时期.
有关此系统参数的详情,请参阅Solaris操作系统版本的system(4)手册页.
系统不能响应中断.
在启用hostwatchdog(如setupsc命令中所述)时,系统控制器会自动执行外部重置(XIR)并重新引导挂起的操作系统.
如果OpenBootPROMnvram变量error-reset-recovery设为sync,则还会在XIR之后生成一个核心文件,以用于排除操作系统挂起故障.
代码样例7-1控制台上显示的自动诊断事件消息样例[AD]Event:E2900.
ASIC.
AR.
ADR_PERR.
10473006CSN:DomainID:AADInfo:1.
SCAPP.
17.
0Time:FriDec1209:30:20PST2003FRU-List-Count:2;FRU-PN:5405564;FRU-SN:A08712;FRU-LOC:/N0/IB6FRU-PN:5404974;FRU-SN:000274;FRU-LOC:/N0/RP2Recommended-Action:Serviceactionrequired62SunFire入门级中型系统管理指南2004年10月代码样例7-2显示了操作系统心跳停止后显示的控制台消息.
代码样例7-3显示了操作系统未响应中断时显示的控制台消息.
诊断事件某些非致命硬件错误可由Solaris操作系统确定并报告给系统控制器.
系统控制器将会执行以下操作:为受影响资源记录和维护此信息,作为组件运行状况的一部分.
通过在控制台上显示事件消息来报告此信息.
POST在下一次运行时会检查受影响资源的运行状况,并且如果可能,会从系统中取消相应资源的配置.
代码样例7-4显示了非致命域错误的事件消息.
看到此类事件消息时,请与服务人员联系以便采取适当的服务措施.
第64页"查看自动诊断事件消息"中描述了提供的事件消息信息.
您可以按照第65页"查看组件状态"中的说明,运行showboards和showcomponent命令来获得那些被POST取消配置的组件的详细信息.
代码样例7-2操作系统心跳停止后关于自动域恢复的消息输出样例TueDec0912:24:47commandolom:Domainwatchdogtimerexpired.
TueDec0912:24:48commandolom:Usingdefaulthang-policy(RESET).
TueDec0912:24:48commandolom:Resetting(XIR)domain.
代码样例7-3操作系统未响应中断时关于自动域恢复的控制台输出样例TueDec0912:37:38commandolom:Domainisnotrespondingtointerrupts.
TueDec0912:37:38commandolom:Usingdefaulthang-policy(RESET).
TueDec0912:37:38commandolom:Resetting(XIR)domain代码样例7-4域诊断事件消息–非致命域硬件错误[DOM]Event:SFV1280.
L2SRAM.
SERD.
0.
60.
10040000000128.
7fd78d140CSN:DomainID:AADInfo:1.
SF-SOLARIS-DE.
5_8_Generic_116188-01Time:WedNov2612:06:14PST2003FRU-List-Count:1;FRU-PN:3704129;FRU-SN:100ACD;FRU-LOC:/N0/SB0/P0/E0Recommended-Action:Serviceactionrequired第7章自动诊断与恢复63诊断和恢复控制本节介绍各种影响恢复功能的控制和参数.
诊断参数表7-1描述了一些控制诊断和操作系统恢复过程的参数设置.
诊断和操作系统恢复参数的默认值是建议使用的设置.
注–如果您不使用默认设置,则恢复功能将不会如第59页"自动诊断与恢复概述"中说明的那样有效.
表7-1诊断和操作系统恢复参数参数使用的设置默认值说明HostWatchdogsetupsccommandenabled在检测到硬件错误时自动重新引导域.
当OBP.
auto-boot参数设为true时,还会引导Solaris操作系统.
reboot-on-errorOBPsetenvtrue在检测到硬件错误时自动重新引导域.
当OBP.
auto-boot参数设为true时,还会引导Solaris操作系统.
auto-bootOBPsetenvtrue在运行POST后引导Solaris操作系统.
error-reset-recoveryOBPsetenvsync在执行XIR后自动重新引导系统,并生成可用于排除系统挂起故障的核心文件.
不过请注意,在交换区必须分配足够的磁盘空间以保存该核心文件.
64SunFire入门级中型系统管理指南2004年10月获得自动诊断和恢复信息本节介绍了多种方法,用于监控硬件错误以及获得与硬件错误相关的组件的其它信息.
查看自动诊断事件消息自动诊断[AD]和域[DOM]事件消息显示在控制台上,并且也显示在以下位置:/var/adm/messages文件,条件是您按照第4章中的说明正确设置了事件报告参数.
showlogs命令输出,在控制台上显示已记录的事件消息.
在配有增强内存系统控制器(SCV2)的系统中,日志消息保存在永久缓冲区内.
您可以使用showlogs-p-ffilter命令,根据消息类型选择性地查看某些类型的日志消息,如故障事件消息.
有关详情,请参阅《SunFireEntry-LevelMidrangeSystemControllerCommandReferenceManual》中的showlogs命令说明.
[AD]或[DOM]事件消息(参阅代码样例7-1、代码样例7-4、代码样例7-5和代码样例7-6)包括以下信息:[AD]或[DOM]–消息的开头.
AD表示ScApp或POST自动诊断引擎生成了事件消息.
DOM表示受影响域上的Solaris操作系统生成了自动诊断事件消息.
Event–字母数字文本字符串,用于确定由服务人员使用的平台和事件特定信息.
CSN–机箱系列号,标识您的SunFire中型系统.
DomainID–受硬件错误影响的域.
入门级中型系统始终为DomainA.
ADInfo–自动诊断消息的版本、诊断引擎的名称(SCAPP或SF-SOLARIS_DE)和自动诊断引擎版本.
对于域诊断事件,诊断引擎为Solaris操作系统(SF-SOLARIS-DE),并且诊断引擎的版本为当前使用的Solaris操作系统版本.
Time–执行自动诊断的时间:星期几、月份、日期、时间(小时、分钟和秒钟)、时区以及年份.
FRU-List-Count–与错误有关的组件(FRU)数量及以下FRU数据:如果涉及单个组件,则如代码样例7-1所示,显示FRU部件号码、系列号和位置.
如果涉及多个组件,则如代码样例7-5所示,报告每个涉及组件的FRU部件号码、系列号和位置.
注意,某些情况下,并非所有列出的FRU均存在故障.
可能是所列组件的一部分发生故障.
如果SCAPP诊断引擎无法指出特定组件,则会显示"UNRESOLVED"条目,如代码样例7-6所示.
第7章自动诊断与恢复65Recommended-Action:Serviceactionrequired–指示管理员联系服务人员以便进一步采取服务措施.
此外,也表示自动诊断消息的结束.
查看组件状态您可以查看下列项目,获得那些在自动诊断期间被取消配置或由于其它原因被禁用的组件的其它信息:执行自动诊断后的showboards命令输出代码样例7-6显示了系统中所有组件的位置分配和状态.
组件的Status列提供了与诊断相关的信息.
状态为Failed或Disabled的组件已从系统中取消配置.
Failed状态表示该板测试失败且不可用.
Disabled表示该板已从系统中取消配置,这是因为已使用setls命令将它禁用或者它未能通过POST.
Degraded状态表示板上的某些组件已出现故障或被禁用,但板上仍有可用部件.
状态为Degraded的组件仍会配置在系统中.
您可以查看showcomponent命令的输出,从而获得有关Failed、Disabled或Degraded组件的其它信息.
代码样例7-5自动诊断消息的样例TueDec0214:35:56commandolom:ErrorMonitor:DomainAhasaSYSTEMERROR.
.
.
TueDec0214:35:59commandolom:[AD]Event:E2900CSN:DomainID:AADInfo:1.
SCAPP.
17.
0Time:TueDec0214:35:57PST2003FRU-List-Count:0;FRU-PN:;FRU-SN:;FRU-LOC:UNRESOLVEDRecommended-Action:ServiceactionrequiredTueDec0214:35:59commandolom:AfatalconditionisdetectedonDomainA.
Initiatingautomaticrestorationforthisdomain代码样例7-6showboards命令输出–Disabled和Degraded组件SlotPwrComponentTypeStateStatusSSC1OnSystemControllerV2MainPassed/N0/SCC-SystemConfigCardAssignedOK/N0/BP-BaseplaneAssignedPassed/N0/SIB-IndicatorBoardAssignedPassed/N0/SPDB-SystemPowerDistributionBd.
AssignedPassed/N0/PS0OnA166PowerSupply-OK/N0/PS1OnA166PowerSupply-OK/N0/PS2OnA166PowerSupply-OK66SunFire入门级中型系统管理指南2004年10月执行自动诊断后的showcomponent命令输出代码样例7-7中的Status列显示了组件的状态.
状态为enabled或disabled.
禁用的组件会从系统中取消配置.
POST状态chs(组件运行状况的缩写)用于标识那些需由服务人员进一步分析的组件.
注–POST状态为chs的禁用组件无法通过setls命令启用.
请与服务人员联系,获取帮助信息.
某些情况下,属于与硬件错误相关的"父"组件的子组件也会如父组件一样,显示禁用状态.
您无法重新启用与硬件错误相关的父组件的子组件.
查看自动诊断事件消息可以确定哪些父组件与错误相关.
/N0/PS3OnA166PowerSupply-OK/N0/FT0OnFanTrayAutoSpeedPassed/N0/RP0OnRepeaterBoardAssignedOK/N0/RP2OnRepeaterBoardAssignedOK/N0/SB0OnCPUBoardActivePassed/N0/SB2OnCPUBoardV3AssignedDisabled/N0/SB4OnCPUBoardActiveDegraded/N0/IB6OnPCII/OBoardActivePassed/N0/MB-MediaBayAssignedPassed代码样例7-7showcomponent命令输出–禁用的组件schostname:SC>showcomponentComponentStatusPendingPOSTDescription/N0/SB0/P0disabled-chsUltraSPARC-IV,1050MHz,16MECache/N0/SB0/P1disabled-chsUltraSPARC-IV,1050MHz,16MECache/N0/SB0/P2disabled-chsUltraSPARC-IV,1050MHz,16MECache/N0/SB0/P3disabled-chsUltraSPARC-IV,1050MHz,16MECache/N0/SB0/P0/B0/L0disabled-chsempty/N0/SB0/P0/B0/L2disabled-chsempty/N0/SB0/P0/B1/L1disabled-chs2048MDRAM/N0/SB0/P0/B1/L3disabled-chs2048MDRAM.
.
.
/N0/SB0/P3/B0/L0disabled-chsempty/N0/SB0/P3/B0/L2disabled-chsempty/N0/SB0/P3/B1/L1disabled-chs1024MDRAM/N0/SB0/P3/B1/L3disabled-chs1024MDRAM/N0/SB4/P0enabled-passUltraSPARC-IV,1050MHz,16MECache/N0/SB4/P1enabled-passUltraSPARC-IV,1050MHz,16MECache代码样例7-6showboards命令输出–Disabled和Degraded组件(续)第7章自动诊断与恢复67查看其它错误信息对于配有增强内存SC(SCV2)的系统,可用showerrorbuffer-p命令显示那些保存在永久缓冲区内的错误内容.
然而,对于没有增强内存SC的系统,showerrorbuffer命令将会显示动态缓冲区内的内容,并显示在重新引导域(作为域恢复过程的一部分)时可能丢失的错误消息.
任一情况下,服务人员均可使用显示的信息进行故障排除.
代码样例7-8显示了域硬件错误的输出.
/N0/SB4/P2enabled-passUltraSPARC-IV,1050MHz,16MECache/N0/SB4/P3enabled-passUltraSPARC-IV,1050MHz,16MECache.
.
.
代码样例7-8showerrorbuffer命令输出–硬件错误EX07:lom>showerrorbufferErrorData[0]Date:FriJan3010:23:32EST2004Device:/SSC1/sbbc0/systemepldRegister:FirstError[0x10]:0x0200SB0encounteredthefirsterrorErrorData[1]Date:FriJan3010:23:32EST2004Device:/SB0/bbcGroup0/repeaterepldRegister:FirstError[0x10]:0x0002sdc0encounteredthefirsterrorErrorData[2]Date:FriJan3010:23:32EST2004Device:/SB0/sdc0ErrorID:0x60171010Register:SafariPortError0[0x200]:0x00000002ParSglErr[01:01]:0x1ParitySingleerror代码样例7-7showcomponent命令输出–禁用的组件(续)68SunFire入门级中型系统管理指南2004年10月69第8章安全准则本章提供了关于系统安全保护的重要信息,并说明了安全建议和域最小化操作.
此外,它还提供了关于Solaris操作系统安全的参考文献.
本章包括下列主题:第69页"系统安全保护"第71页"选择远程连接类型"第73页"其它安全事项"系统安全保护下面列出了您应考虑的安全措施:确保所有密码符合安全准则.
定期更改密码.
定期审查日志文件,确定是否存在异常情况.
配置系统以限制非授权访问的措施称为"强化".
可用多个配置步骤来强化您的系统.
这些步骤是系统配置的指导准则:配置或安装任何SunFire域之前,以及更新SunFireRTOS和SC应用程序固件之后,立即应用安全修改.
通常应限制对SC操作系统和RTOS的访问.
限制对串行端口的物理访问.
根据配置的更改情况进行重新引导.
70SunFire入门级中型系统管理指南2004年10月定义控制台密码SC控制台密码的唯一限制是:密码字符必须是ASCII和当前所用终端仿真程序支持的字符.
SC采用MD5算法生成所输入密码的散列码.
因此,输入的所有字符都进行严格的区分.
密码的最小长度为16个字符,鼓励使用密码短语(而不是密码).
密码应由小写字母、大写字母、数字和标点符号混合组成.
有关如何设置控制台密码的信息,请参阅第17页"设置密码".
使用SNMP协议的默认配置简单网络管理协议(SNMP)通常用于监控和管理网络设备及系统.
默认情况下,系统会禁用SNMP.
注–使用SunManagementCenter软件时,需要用到SNMP.
不过,由于SC不支持SNMP协议的安全版本,因此除非您必须使用SunManagementCenter软件,否则不要启用SNMP.
重新引导SC以应用设置如果控制台显示了类似以下内容的信息,则需重新引导SC:键入resetsc-y命令,重新引导SCSC可在Solaris域启动和运行期间重新引导.
重新引导SC后,使用shownetwork命令验证是否应用了所有网络修改.
有关使用SunSecurityToolkit为运行Solaris操作系统的系统创建安全配置的信息,请访问以下网站:http://www.
sun.
com/security/jassRebootingtheSCisrequiredforchangesinnetworksettingstotakeeffect.
第8章安全准则71选择远程连接类型默认情况下,SC上的SSH和Telnet服务处于禁用状态.
启用SSH如果SC位于普通网络上,则您可以使用SSH(而不是Telnet)来确保对SC的安全远程访问.
SSH会加密主机和客户机之间传输的数据.
它提供的身份验证机制可以确定主机和用户的身份,从而实现已知系统之间的安全连接.
由于Telnet协议传输的信息(包括密码)不进行加密,因此Telnet本质上是不安全的.
注–SSH并不能保证FTP、HTTP、SYSLOG或SNMPv1协议的安全.
这些协议是不安全的,因此在普通网络上使用时应格外小心.
SC提供有限的SSH功能,仅支持SSH第2版(SSHv2)客户机请求.
表8-1列出了各种SSH服务器属性,并描述了这些属性在该子网中的处理方式.
这些属性的设置不可配置.
表8-1SSH服务器属性属性值注释Protocol2仅支持SSHv2Port22监听端口ListenAddress0.
0.
0.
0支持多个IP地址AllowTcpForwardingno不支持端口转发RSAAuthenticationno禁用公钥验证PubkeyAuthenticationno禁用公钥验证PermitEmptyPasswordsyes由SC控制密码验证MACshmac-sha1,hmac-md5SSH服务器应用与Solaris9操作系统相同Ciphersaes128-cbc,blowfish-cbc,3des-cbcSSH服务器应用与Solaris9操作系统相同72SunFire入门级中型系统管理指南2004年10月启用SSH1.
要启用SSH,请键入以下命令:系统会提示您输入网络配置和连接参数.
例如:有关setupnetwork命令的详细信息,请参阅《SunFireEntry-LevelMidrangeSystemControllerCommandReferenceManual》中的命令说明.
SSH不支持的功能SunFire入门级中型系统上的SSH服务器不支持下列功能:远程命令行执行scp命令(安全复制程序)sftp命令(安全文件传输程序)端口转发基于密钥的用户验证SSHv1客户机lom>setupnetworklom>setupnetworkNetworkConfigurationIsthesystemcontrolleronanetwork[yes]:UseDHCPorstaticnetworksettings[static]:Hostname[hostname]:IPAddress[xxx.
xxx.
xxx.
xxx]:Netmask[xxx.
xxx.
xxx.
x]:Gateway[xxx.
xxx.
xxx.
xxx]:DNSDomain[xxxx.
xxx.
xxx]:PrimaryDNSServer[xxx.
xxx.
xxx.
xx]:SecondaryDNSServer[xxx.
xxx.
xx.
x]:Connectiontype(ssh,telnet,none)[ssh]:RebootingtheSCisrequiredforchangesintheabovenetworksettingstotakeeffect.
lom>第8章安全准则73如果您尝试使用上述任何功能,系统均会生成一条错误消息.
例如,如果键入以下命令系统会生成以下信息:在SSH客户机上:在SC控制台上:更改SSH主机密钥定期更改主机密钥是有效管理机器的一项得力安全措施.
如果您怀疑主机密钥可能已泄露,则可使用ssh-keygen命令重新生成系统主机密钥.
主机密钥一旦生成,如果不使用setdefaults命令,则只能进行更换而不能被删除.
要激活新生成的主机密钥,必须通过运行restartssh命令或重新引导系统来重新启动SSH服务器.
有关ssh-keygen和restartssh命令的详细信息及示例,请参阅《SunFireEntry-LevelMidrangeSystemControllerCommandReferenceManual》.
注–此外,您还可以使用ssh-keygen命令显示SC上的主机密钥指纹.
其它安全事项本节包括下列主题:允许进行RTOSShell访问的特殊密钥序列域最小化Solaris操作系统安全#sshSCHOSTshowboardsConnectiontoSCHOSTclosedbyremotehost.
[0x89d1e0]sshdSessionServerCreate:noserverregisteredforshowboards[0x89d1e0]sshd:FailedtocreatesshdSession74SunFire入门级中型系统管理指南2004年10月允许进行RTOSShell访问的特殊密钥序列在SC引导期间,可通过SC的串行连接向SC发出特殊密钥序列.
如果在SC重新引导后的前30秒内在串行端口上输入这些密钥序列,将会产生特殊的功能.
系统会在显示Sun版权信息过后30秒,自动禁用这些密钥序列的特殊功能.
一旦其功能被禁用,密钥序列的操作方式将与普通控制密钥无异.
由于对RTOSshell的非授权访问可能会危及SC的安全,因此您应控制对SC串行端口的访问.
域最小化提高SunFire中型系统安全的其中一种方法是在满足基本需要的前提下尽量减少软件的安装.
通过限制每个域上安装的软件组件数量(称为"域最小化"),您可以降低安全漏洞被潜在入侵者利用的危险.
有关最小化的详细说明以及示例,请参阅以下网址的《MinimizingDomainsforSunFireV1280,6800,12K,and15KSystems》文档(分为两部分):http://www.
sun.
com/security/blueprintsSolaris操作系统安全有关Solaris操作系统安全保护的信息,请参考以下文献:SolarisSecurityBestPractices–可在以下网址获得http://www.
sun.
com/security/blueprintsSolarisSecurityToolkit–可在以下网址获得http://www.
sun.
com/security/jassSolaris9SystemAdministratorCollection中的Solaris8SystemAdministrationSupplement或SystemAdministrationGuide:SecurityServices75第9章即需即用SunFire入门级中型系统的处理器(CPU)安装在CPU/内存板上.
这些板可随初始系统配置一起购买,也可以作为单独的组件另行购买.
初始购买价格已包括了对这些板上CPU的使用权.
对于使用UltraSPARCIVCPU/内存板的系统(例如:SunFireE2900),其即需即用(COD)选件可以提供额外的处理资源,不过,您需付费才能使用这些资源.
通过COD选件,您可以购买未经许可的CODCPU/内存板并将其装入您的系统.
每块CODCPU/内存板均包括四个CPU,这些CPU被视为可用的处理资源.
不过,您没有使用这些CODCPU的权限,直到您购买了这些CPU的使用权(RTU)许可证.
购买CODRTU许可证后,您会可以得到一个许可证密钥,用于启用相应数量的COD处理器.
您可以运行SunFire入门级中型系统固件中的COD命令来分配、激活和监控COD资源.
本章包括下列主题:第76页"COD概述"第78页"COD使用入门"第79页"管理CODRTU许可证"第82页"激活COD资源"第83页"监控COD资源"76SunFire入门级中型系统管理指南2004年10月COD概述COD选件允许您在系统中安装CODCPU/内存板,从而获得额外的CPU资源.
虽然您的中型系统最初只安装了最低数量的标准(活动)CPU/内存板,但是您的系统还可以安装CODCPU/内存板,以达到系统所允许的最大容量.
系统中至少应有一个活动的CPU.
如果您想获得COD选件,并且您的系统目前没有配置CODCPU/内存板,则请联系Sun销售代表或授权的Sun经销商,向其购买CODCPU/内存板.
销售人员将协同服务提供商为您的系统安装CODCPU/内存板.
下面几节介绍COD选件的主要事项:COD许可流程CODRTU许可证分配即时访问CPU用作热备用件的即时访问CPU资源监控COD许可流程您必须获得CODRTU许可证才能启用CONCPU资源.
COD许可流程包括下列任务:1.
为要启用的COD资源获得CODRTU许可证书和CODRTU许可证密钥您随时可以从Sun销售代表或经销商处购买CODRTU许可证.
随后,您会获得Sun许可证中心提供的许可证密钥(用于启用您所购买的COD资源).
2.
在COD许可证数据库中输入CODRTU许可证密钥COD许可证数据库中存储了您用于启用COD资源的许可证密钥.
您可以使用addcodlicense命令将该许可证信息记录到COD许可证数据库中.
CODRTU许可证是浮动许可证,可用于系统中安装的任意CODCPU资源.
有关完成许可任务的详细信息,请参阅第79页"获取CODRTU许可证密钥并将其添加到COD许可证数据库".
第9章即需即用77CODRTU许可证分配通过COD选件,您的系统可以配置一定数量的CODCPU,具体取决于您所购买的CODCPU/内存板和CODRTU许可证的数量.
您所获得的CODRTU许可证按照可用许可证池的方式处理.
当您激活包含CODCPU/内存板的域,或通过动态重配置(DR)操作过程将CODCPU/内存板连接到一个域时,系统会自动执行下列操作:系统检查当前安装的CODRTU许可证.
对于COD板上的每个CPU,系统会从许可证池中获得一个CODRTU许可证.
为CPU分配CODRTU许可证时采用"先到先得"的原则.
不过,您可以使用setupsc命令分配特定数量的RTU许可证.
有关详细信息,请参阅第82页"启用或禁用即时访问CPU以及保留RTU许可证".
如果CODRTU许可证的数量不足,无法为某个CODCPU分配许可证,则该CODCPU会被视为"未经许可".
同时,系统将该CODCPU的状态指定为"COD被禁用".
如果某一CODCPU/内存板没有足够的CODRTU许可证分配给其上面的CODCPU,则在开机过程中,系统将无法启用该CODCPU/内存板.
有关其它信息和样例,请参阅第86页"禁用COD的CPU".
当您通过动态重配置操作过程删除某一CODCPU/内存板或正常关闭某一CODCPU/内存板时,这些板上CPU所用的CODRTU许可证会被释放并添加到可用许可证池中.
您可以通过showcodusage命令来查看COD使用情况以及CODRTU许可证状态.
有关showcodusage以及其它提供COD信息的命令的详细信息,请参阅第83页"监控COD资源".
即时访问CPU如果您想在完成CODRTU许可证购买流程之前使用CODCPU资源,则可以暂时启用一定数量的资源,这些资源称为"即时访问CPU"(也称"冗余").
只要系统中存在未经许可的CODCPU,就可以使用这些即时访问CPU.
SunFire入门级中型系统中可用的即时访问资源最多为四个CPU.
默认情况下,SunFire中型系统中的即时访问CPU是禁用的.
如果您想使用这些资源,请运行setupsc命令来激活它们.
一些警告消息会显示在控制台上,用于提醒您所用的即时访问CPU(冗余)数量已超过了可用的COD许可证数量.
一旦您获得了用于这些即时访问CPU的CODRTU许可证密钥并将其添入COD许可证数据库,系统便会停止显示这些警告消息.
有关激活即时访问CPU的详细信息,请参阅第82页"启用或禁用即时访问CPU以及保留RTU许可证".
78SunFire入门级中型系统管理指南2004年10月用作热备用件的即时访问CPU您可以暂时启用一个可用的即时访问CPU来代替发生故障的非CODCPU.
此情况下,该即时访问CPU称为"热备用件"(即用于快速替换发生故障的非CODCPU的备用CPU).
不过,当更换发生故障的非CODCPU之后,您必须禁用该即时访问CPU(参阅第82页"启用或禁用即时访问CPU以及保留RTU许可证").
如果您想继续使用该即时访问CPU,请联系Sun销售代表或经销商,向其购买该即时访问CPU的CODRTU许可证.
资源监控有关COD事件(例如:激活即时访问CPU(冗余)或许可证违规)的信息,会记录在控制台日志消息中,并且还可出现在showlogs命令的输出中.
其它命令(例如:showcodusage命令)可提供COD组件和COD配置的有关信息.
有关获得COD信息和状态的详细信息,请参阅第83页"监控COD资源".
COD使用入门在SunFire入门级中型系统上使用COD之前,您必须先完成某些必要任务.
这些任务包括:在系统控制器(SC)和系统板上安装相同版本的固件(5.
18.
0或更高版本).
有关升级固件的详细信息,请参阅第105页"固件升级过程".
注–5.
18.
0版以前的SunFire入门级中型系统固件不能识别CODCPU/内存板.
联系Sun销售代表或经销商,并进行以下工作:除签订SunFire入门级中型系统的标准购买合同之外,还应签订COD合同附录.
购买CODCPU/内存板并安排安装事宜.
按照第79页"获取CODRTU许可证密钥并将其添加到COD许可证数据库"中的说明,执行CODRTU许可流程.
第9章即需即用79管理CODRTU许可证CODRTU许可证管理工作包括获取CODRTU许可证密钥并将其添加到COD许可证数据库.
此外,您还可以根据需要从许可证数据库中删除CODRTU许可证.
注意,COD许可证密钥信息始终与某个特定的系统相关联.
如果您执行以下操作,则可能会出现CODRTU许可证失效的情况:将IB_SSC板从一个系统移至另一个系统.
使用另一个SCC卡(即具有不同主机ID的SCC卡)更换现有的SCC卡.
第一个系统的CODRTU许可证密钥现已位于另一个系统上,但这些许可证密钥仍保留着与第一个系统的关联关系.
这些许可证密钥会被视为无效.
为了避免CODRTU许可证密钥失效,请在取出IB_SSC板之前,在第一个系统中运行setdefaults命令(以便恢复默认的系统配置值).
如果您没有在第一个系统中运行setdefaults命令,则可以在将IB_SSC板插入第二个系统之后,在该系统上运行此命令.
获取CODRTU许可证密钥并将其添加到COD许可证数据库1.
联系Sun销售代表或授权的Sun经销商,为每个要启用的CODCPU购买CODRTU许可证.
对于您购买的每一个CPU许可证,Sun均会向您发送一个CODRTU许可证书.
许可证书上的CODRTU许可证标签中列出了用于获取CODRTU许可证密钥的使用权系列号.
2.
联系Sun许可证中心,提供下列信息以获得CODRTU许可证密钥:CODRTU许可证书上的许可标签中所列的CODRTU系列号系统的机箱主机ID,用于标识您的系统要获得系统的机箱主机ID,请运行showsc命令.
有关联系Sun许可证中心的说明,请查阅您收到的CODRTU许可证书,或浏览Sun许可证中心网站:http://www.
sun.
com/licensingSun许可证中心会向您发送电子邮件,其中包括用于您所购买的COD资源的RTU许可证密钥.
3.
运行addcodlicense命令,将许可证密钥添加到COD许可证数据库.
在SC的控制台上,键入以下命令:lom>addcodlicenselicense-signature80SunFire入门级中型系统管理指南2004年10月其中:license-signature是Sun许可证中心分配的完整CODRTU许可证密钥.
您可以直接复制Sun许可证中心发送给您的许可证密钥.
4.
运行showcodlicense-r命令,验证指定的许可证密钥是否已添加到COD许可证数据库(参阅第80页"查看COD许可证信息").
您添加的CODRTU许可证密钥应显示在showcodlicense命令的输出中.
从COD许可证数据库中删除COD许可证密钥1.
在SC的控制台上,键入以下命令:其中:license-signature是要从COD许可证数据库中删除的完整CODRTU许可证密钥.
系统将会验证删除许可证是否会导致CODRTU许可证违规问题,这种问题在COD许可证的数量少于正在使用的COD资源数量时发生.
如果删除操作会导致CODRTU许可证违规问题,则SC不会删除许可证密钥.
注–您可以运行deletecodlicense命令并指定-f选项来强制删除许可证密钥.
不过请注意,这种删除许可证密钥的方法可能会导致许可证违规问题或RTU许可证保留无法兑现问题.
当RTU域保留数量多于系统中安装的RTU许可证时,就会发生RTU许可证无法兑现问题.
有关其它信息,请参阅《SunFireEntry-LevelMidrangeSystemControllerCommandReferenceManual》中所述的deletecodlicense命令.
2.
运行showcodlicense-r命令(将在下面的过程中介绍),验证许可证密钥是否已从COD许可证数据库中删除.
删除的许可证密钥不应出现在showcodlicense命令的输出中.
查看COD许可证信息在SC的控制台上,执行以下一种操作可显示COD许可证信息:要按编译格式查看许可证数据,请键入以下命令:lom>deletecodlicenselicense-signaturelom>showcodlicense第9章即需即用81例如:表9-1解释了showcodlicense输出中的COD许可证信息.
要按原始许可证密钥格式查看许可证数据,请键入以下命令:此时会显示COD资源的许可证密钥签名.
例如:注–以上列出的CODRTU许可证密钥仅作为示例,并不是有效的许可证密钥.
有关showcodlicense命令的详细信息,请参阅《SunFireEntry-LevelMidrangeSystemControllerCommandReferenceManual》中提供的命令说明.
lom>showcodlicenseDescriptionVerExpirationCountStatusPROC01NONE4GOOD表9-1COD许可证信息项目说明Description资源(处理器)的类型.
Ver许可证的版本号.
Expiration无.
不支持(无有效期).
Count授权给既定资源的RTU许可证数量.
Status以下状态之一:GOOD–表示资源许可证有效.
EXPIRED–表示资源许可证已失效.
lom>showcodlicense-rlom>showcodlicense-r01:83198b89:86017912:0201000000:4:00000000:VW03IcpXYAIO8DYqaF/wSQ82SunFire入门级中型系统管理指南2004年10月激活COD资源要激活即时访问CPU并分配CODRTU许可证,请使用setupsc命令.
有关setupsc命令选项的详细信息,请参阅《SunFireEntry-LevelMidrangeSystemControllerCommandReferenceManual》中提供的命令说明.
启用或禁用即时访问CPU以及保留RTU许可证1.
在SC的控制台上,键入以下命令:系统会提示您输入COD参数(冗余CPU数量和RTU信息).
例如:注意下面关于所显示的提示信息的说明:即时访问CPU(冗余)数量括号中的文本表示允许使用的即时访问CPU(冗余)的最大数量.
方括号中的数值表示当前配置的即时访问CPU的数量.
要禁用即时访问CPU(冗余)功能,请键入0.
仅当没有使用即时访问CPU时,才能不显示冗余数量.
lom>setupsclom>setupscSystemControllerConfigurationSCPOSTdiagLevel[off]:HostWatchdog[enabled]:RockerSwitch[enabled]:SecureMode[off]:PROCRTUsinstalled:4PROCHeadroomQuantity(0todisable,4MAX)[0]:2第9章即需即用832.
通过showsc命令检查COD资源的配置情况:例如:监控COD资源本节介绍多种用于跟踪COD资源使用情况和获取COD信息的方法.
CODCPU/内存板您可以通过showboards命令来确定系统中的哪些CPU/内存板是COD板.
lom>showsclom>showscSC:SSC1SystemControllerV2Clockfailoverdisabled.
SCdate:MonMay0310:22:33EDT2004SCuptime:3days18hours4minutes4secondsScAppversion:5.
18.
0RTOSversion:38SolarisHostStatus:Active-SolarisChassisHostID:83198b89PROCRTUsinstalled:4PROCHeadroomQuantity:284SunFire入门级中型系统管理指南2004年10月确定CODCPU/内存板在SC的控制台上,键入以下命令:CODCPU/内存板会被标识为CODCPU板.
例如:COD资源使用情况要获得系统中COD资源的使用情况,请使用showcodusage命令.
lom>showboardslom>showboardsSlotPwrComponentTypeStateStatusSSC1OnSystemControllerV2MainPassed/N0/SCC-SystemConfigCardAssignedOK/N0/BP-BaseplaneAssignedPassed/N0/SIB-IndicatorBoardAssignedPassed/N0/SPDB-SystemPowerDistributionBd.
AssignedPassed/N0/PS0OnA166PowerSupply-OK/N0/PS1OnA166PowerSupply-OK/N0/PS2OnA166PowerSupply-OK/N0/PS3OnA166PowerSupply-OK/N0/FT0OnFanTrayAutoSpeedPassed/N0/RP0OnRepeaterBoardAssignedOK/N0/RP2OnRepeaterBoardAssignedOK/N0/SB0OnCODCPUBoardActiveDegraded/N0/SB2OnCODCPUBoardV3AssignedDisabled/N0/SB4OnCODCPUBoardAssignedDisabled/N0/IB6OnPCII/OBoardActivePassed/N0/MB-MediaBayAssignedPassed第9章即需即用85查看COD使用情况在SC的控制台上,键入以下命令:输出信息中将包括CPU的状态.
例如:表9-2解释了上面所示的COD资源信息.
lom>showcodusage-vlom>showcodusage-vDomain/ResourceInUseInstalledReservedStatusA-PROC440SB0-PROC44/N0/SB0/P0Licensed/N0/SB0/P1Licensed/N0/SB0/P2Licensed/N0/SB0/P3LicensedUnused-PROC000表9-2showcodusage信息项目说明Domain/ResourceCOD资源(处理器).
未用的处理器是尚未分配的CODCPU.
InUse当前正在使用的CODCPU数量.
Installed已安装的CODCPU数量.
Reserved已分配的CODRTU许可证数量.
Status以下CPU状态之一:Licensed–CODCPU拥有CODRTU许可证.
Unused–CODCPU不在使用中.
Unlicensed–CODCPU没有获得CODRTU许可证并且不在使用中.
86SunFire入门级中型系统管理指南2004年10月禁用COD的CPU当您激活一个使用CODCPU/内存板的域时,那些没有获得CODRTU许可证的CODCPU会被SC禁用.
您可通过查看以下项目来确定哪些CODCPU被禁用了:poweron操作的控制台日志没有获得CODRTU许可证的CODCPU会被标识为Cod-dis(COD被禁用的缩写).
如果某一COD/内存板上的所有CODCPU全被禁用,则无法对该CODCPU/内存板执行poweron操作,如代码样例9-1所示.
showcomponent命令输出代码样例9-2显示了系统中各组件的状态信息类型.
如果无法为某个CODCPU分配CODRTU许可证,则该CODCPU的状态会显示为Cod-dis(COD被禁用的缩写).
代码样例9-1包含禁用CODCPU信息的控制台日志输出lom>poweron{/N0/SB0/P0}Passed{/N0/SB0/P1}Passed{/N0/SB0/P2}Passed{/N0/SB0/P3}Passed{/N0/SB0/P0}Cod-dis{/N0/SB0/P1}Cod-dis{/N0/SB0/P2}Cod-dis{/N0/SB0/P3}Cod-dis.
.
.
EnteringOBP.
.
.
Jun2719:04:38schostnameDomain-A.
SC:Excludedunusable,unlicensed,failedordisabledboard:/N0/SB0代码样例9-2showcomponent命令输出–禁用的CODCPUlom>showcomponentComponentStatusPendingPOSTDescription.
.
.
/N0/SB2/P0Cod-dis-untestUltraSPARC-IV,1050MHz,16MECache/N0/SB2/P1Cod-dis-untestUltraSPARC-IV,1050MHz,16MECache/N0/SB2/P2Cod-dis-untestUltraSPARC-IV,1050MHz,16MECache第9章即需即用87其它COD信息表9-3汇总了您可以通过其它系统控制器命令获得的COD配置和事件信息.
有关这些命令的详细信息,请参阅《SunFireEntry-LevelMidrangeSystemControllerCommandReferenceManual》中的相关说明.
/N0/SB2/P3Cod-dis-untestUltraSPARC-IV,1050MHz,16MECache/N0/SB2/P0/B0/L0Cod-dis-untest2048MDRAM/N0/SB2/P0/B0/L2Cod-dis-untest2048MDRAM/N0/SB2/P0/B1/L1Cod-dis-untest2048MDRAM/N0/SB2/P0/B1/L3Cod-dis-untest2048MDRAM/N0/SB2/P1/B0/L0Cod-dis-untest2048MDRAM/N0/SB2/P1/B0/L2Cod-dis-untest2048MDRAM/N0/SB2/P1/B1/L1Cod-dis-untest2048MDRAM/N0/SB2/P1/B1/L3Cod-dis-untest2048MDRAM/N0/SB2/P2/B0/L0Cod-dis-untest2048MDRAM.
.
.
表9-3获得COD配置和事件信息命令说明showlogs显示控制台中记录的有关COD事件(例如:许可证违规或激活即时访问CPU)的信息.
showsc显示当前COD资源的配置和相关信息:正在使用的即时访问CPU(冗余)数量机箱主机ID代码样例9-2showcomponent命令输出–禁用的CODCPU(续)88SunFire入门级中型系统管理指南2004年10月89第10章故障排除本章介绍适于系统管理员的故障排除信息,包括下列主题:第89页"设备映射"第94页"系统故障"第99页"恢复挂起的系统"第101页"温度"第103页"电源设备"第104页"显示诊断信息"第104页"协助Sun服务人员查明故障原因"设备映射物理地址表示设备特有的物理特性.
设备的物理地址包括总线地址和插槽编号.
插槽编号表示设备的安装位置.
您可以使用节点标识—代理ID(AID)-来表示物理设备.
AID的范围介于0和31之间(十进制表示法);若采用十六进制表示法,则介于0和1f之间.
在以ssm@0,0开头的设备路径中,第一个编号0即为节点ID.
CPU/内存映射CPU/内存板和内存代理ID(AID)的范围介于0和23之间(十进制表示法);若采用十六进制表示法,则介于0和17之间.
本系统最多可以安装三块CPU/内存板.
90SunFire入门级中型系统管理指南2004年10月每块CPU/内存板可以安装四个CPU,具体取决于您的配置.
每块CPU/内存板可以安装四个内存组.
每个内存组均由一个内存管理单元(MMU)(即CPU)控制.
下面的代码样例显示了CPU及其相关内存的设备树条目:其中:在b,0中b为CPU代理标识(AID)0为CPU寄存器在b,400000中b为内存代理标识(AID)400000为内存控制器寄存器每块CPU/内存板上最多可以安装四个CPU(表10-1):具有代理ID0–3的CPU位于名为SB0的板上具有代理ID8–11的CPU位于名为SB2的板上,等等.
IB_SSC部件映射表10-2列出了I/O部件的类型、每个I/O部件具有的插槽数以及支持这些I/O部件类型的系统.
/ssm@0,0/SUNW/UltraSPARC-III@b,0/ssm@0,0/SUNW/memory-controller@b,400000表10-1CPU和内存代理ID分配CPU/内存板名称每块CPU/内存板上的代理IDCPU0CPU1CPU2CPU3SB00(0)1(1)2(2)3(3)SB28(8)9(9)10(a)11(b)SB416(10)17(11)18(12)19(13)代理ID栏中的第一个数字是十进制数字.
圆括号内的数字或字母是十六进制数字.
表10-2I/O部件类型及插槽数I/O部件类型每个I/O部件具有的插槽数PCI6第10章故障排除91表10-3列出了每个系统具有的I/O部件数以及I/O部件的名称.
每个I/O部件包含两个I/O控制器:I/O控制器0I/O控制器1将I/O设备树条目映射到系统中的物理组件时,您必须考虑设备树中的五个节点:节点标识(ID)I/O控制器代理I/O(AID)总线分支PCI插槽设备例程表10-4为每个I/O部件中的两个I/O控制器列出了AID.
I/O控制器具有两条总线:A和B.
总线A为66MHz,由分支600000表示.
总线B为33MHz,由分支700000表示.
I/O部件中的板插槽由设备编号表示.
本节介绍PCII/O部件的插槽分配并提供了设备路径的样例.
下面的代码样例列出了SCSI磁盘的设备树细分条目:注–设备路径中的编号采用十六进制.
表10-3每个系统具有的I/O部件数和部件名I/O部件数I/O部件名1IB6表10-4I/O控制器代理ID分配插槽编号I/O部件名偶I/O控制器AID奇I/O控制器AID6IB624(18)25(19)列中的第一个数字为十进制数字.
圆括号内的数字(或数字和字母的组合)为十六进制数字.
/ssm@0,0/pci@19,700000/pci@3/SUNW,isptwo@4/sd@5,092SunFire入门级中型系统管理指南2004年10月其中:在19,700000中19为I/O控制器代理标识(AID)700000为总线分支在pci@3中3为设备编号.
isptwo为SCSI主机适配器在sd@5,0中5为磁盘的SCSI目标号0为目标磁盘的逻辑设备号(LUN)本节介绍PCII/O部件的插槽分配并提供了设备路径的示例.
表10-5以十六进制列出了插槽编号、I/O部件名、每个I/O部件的设备路径、I/O控制器编号和总线.
其中:w=板载LSI1010RSCSI控制器x=板载CMD646U2EIDE控制器y=板载Gigaswift以太网控制器0z=板载Gigaswift以太网控制器1表10-5IB_SSC部件PCI设备映射I/O部件名设备路径物理插槽编号I.
/O控制器编号总线IB6/ssm@0,0/pci@18,700000/*@100B/ssm@0,0/pci@18,700000/*@210B/ssm@0,0/pci@18,700000/*@3x0B/ssm@0,0/pci@18,600000/*@150A/ssm@0,0/pci@18,600000/*@2w0A/ssm@0,0/pci@19,700000/*@121B/ssm@0,0/pci@19,700000/*@231B/ssm@0,0/pci@19,700000/*@341B/ssm@0,0/pci@19,600000/*@1y1A/ssm@0,0/pci@19,600000/*@2z1A第10章故障排除93另外,*表示取决于安装在插槽中的PCI卡类型.
注意以下事项:600000为总线分支,表示总线A,操作速度为66MHz.
700000为总线分支,表示总线B,操作速度为33MHz.
*@3为设备编号.
本示例中,@3表示总线上的第三个设备.
图10-1SunFire入门级中型系统IB_SSCPCI物理插槽分配(IB6)其中,*表示取决于安装在插槽中的PCI卡类型.
例如:双向差分UltraSCSI卡(375-0006)安装在插槽4中FC-AL卡(375-3019)安装在插槽3中FC-AL卡(375-3019)安装在插槽2中/ssm@0,0/pci@18,600000/*@1/ssm@0,0/pci@19,700000/*@3/ssm@0,0/pci@19,700000/*@2/ssm@0,0/pci@19,700000/*@1/ssm@0,0/pci@18,700000/*@2/ssm@0,0/pci@18,700000/*@1插槽01234594SunFire入门级中型系统管理指南2004年10月上述项目将会生成下面的设备路径:系统故障系统故障是指任何影响系统正常操作的情况.
如果系统出现故障,故障LED指示灯()将会亮起.
图10-2显示了系统指示灯.
图10-2系统指示灯/ssm@0,0/pci@19,700000/scsi@3,1/ssm@0,0/pci@19,700000/scsi@3,1(scsi-2)/ssm@0,0/pci@19,700000/scsi@3,1/tape(byte)/ssm@0,0/pci@19,700000/scsi@3,1/disk(block)/ssm@0,0/pci@19,700000/scsi@3(scsi-2)/ssm@0,0/pci@19,700000/scsi@3/tape(byte)/ssm@0,0/pci@19,700000/scsi@3/disk(block)/ssm@0,0/pci@19,700000/SUNW,qlc@2(scsi-fcp)/ssm@0,0/pci@19,700000/SUNW,qlc@2/fp@0,0(fp)/ssm@0,0/pci@19,700000/SUNW,qlc@2/fp@0,0/disk(block)/ssm@0,0/pci@19,700000/SUNW,qlc@1(scsi-fcp)/ssm@0,0/pci@19,700000/SUNW,qlc@1/fp@0,0(fp)/ssm@0,0/pci@19,700000/SUNW,qlc@1/fp@0,0/disk(block)SERVICEREQUIREDSYSTEMALARMPOWERSOURCE定位器系统故障系统电源On/Standby开关要求顶部进入UNIX运行警报1和警报2电源A和电源B第10章故障排除95表10-6列出了指示灯的状态.
您必须立即采取适当的措施来消除系统故障.
客户可更换件下面几节按系统介绍了现场可更换件.
表10-6系统故障指示灯状态FRU名称检测到故障时故障指示灯亮起**此列包括只出现FRU降级的故障.
1如果指示灯亮起,则表示出现故障的FRU需从平台顶部维修.
注意,在通过导轨滑出平台之前,务必为机柜安装防翻支脚.
出现FRU故障时系统故障指示灯亮起*出现FRU故障时"顶部进入"指示灯亮起1注释系统板是是是包括处理器、Ecache模块和DIMM2级转发器是是是IB_SSC是是是系统控制器否是是IB_SSC故障LED指示灯亮起风扇是是是IB风扇故障LED指示灯亮起电源设备是(按硬件)是否所有的电源设备指示灯均由电源设备硬件点亮.
此外,还有一个故障预警指示灯.
由于没有指示灯控制,因此电源设备EEPROM错误不会导致降级状态.
配电板否是是只能降级.
底板否是是只能降级.
系统指示灯板否是是只能降级.
系统配置卡否是否风扇托架是是否主风扇是是否介质槽否是是磁盘是是否96SunFire入门级中型系统管理指南2004年10月SunFireE2900系统您可以处理下列FRU上的故障:硬盘–可热交换PSU(PS0/PS1/PS2/PS3)–可热交换CPU/内存板(SB0/SB2/SB4)–如果认为发生故障可列入黑名单转发器板(RP0/RP2)–如果认为发生故障可列入黑名单如果其它FRU出现故障,或需要物理更换上面列入黑名单的FRU,则应致电SunService.
SunFireV1280系统您可以处理下列FRU上的故障:硬盘–可热交换PSU(PS0/PS1/PS2/PS3)–可热交换CPU/内存板(SB0/SB2/SB4)–如果认为发生故障可列入黑名单转发器板(RP0/RP2)–如果认为发生故障可列入黑名单如果其它FRU出现故障,或需要物理更换上面列入黑名单的FRU,则应致电SunService.
Netra1280系统您可以处理下列FRU上的故障:硬盘–可热交换PSU(PS0/PS1/PS2/PS3)–可热交换注–只有受过专门培训的人员或SunService才可打开那些限制进入的场所,以热交换PSU或硬盘驱动器.
CPU/内存板(SB0/SB2/SB4)–如果认为发生故障可列入黑名单转发器板(RP0/RP2)–如果认为发生故障可列入黑名单如果其它FRU出现故障,或需要物理更换上面列入黑名单的FRU,则应致电SunService.
第10章故障排除97手动列入黑名单(等待维修期间)SC支持黑名单功能.
通过此功能,您可以禁用板上的组件(表10-7).
黑名单列出了一些不会被测试也不被配置到Solaris操作系统中的系统板组件.
黑名单存储在非易失内存中.
如果您认为一些组件或设备可能出现间断性故障或已损坏,请将它们列入黑名单.
然后,排除它们的故障.
您可使用以下两个系统控制器命令来执行黑名单操作:setlsshowcomponent注–enablecomponent和disablecomponent命令已由setls命令取代.
这些命令以前用于管理组件资源.
虽然enablecomponent和disablecomponent命令仍然可用,但建议您使用setls命令来控制系统内部或外部组件的配置.
setls命令仅更新黑名单.
它不能直接影响当前配置的系统板的状态.
表10-7黑名单组件名称系统组件组件子系统组件名称CPU系统插槽/端口/物理内存组/逻辑内存组CPU/内存板(插槽)SB0,SB2,SB4CPU/内存板上的端口P0,P1,P2,P3CPU/内存板上的物理内存组B0,B1CPU/内存板上的逻辑内存组L0,L1,L2,L3I/O部件系统插槽/端口/总线或插槽/插卡I/O部件IB6I/O部件上的端口P0,P1I/O部件上的总线B0,B1I/O部件中的I/O卡C0,C1,C2,C3,C4,C5转发器系统转发器板RP0,RP298SunFire入门级中型系统管理指南2004年10月更新的黑名单会在您执行以下操作后生效:重新引导系统.
使用动态重配置功能将包含黑名单所列组件的板配置到系统外,然后重新配置回系统.
要对转发器板(RP0/RP2)运行setls命令,首先必须使用poweroff命令关闭系统并使系统进入待机模式.
对转发器板(RP0/RP2)运行selts命令之后,SC将自动重置以应用新设置.
如果插入新的转发器板,则需运行resetsc命令以手动重置SC.
有关此命令的详细信息,请参阅《SunFireEntry-LevelMidrangeSystemControllerCommandReferenceManual》.
有关CPU/内存板的特别注意事项在POST期间,如果CPU/内存板未能通过互连测试(很少发生),屏幕将显示类似以下消息的POST输出:CPU/内存板未能通过互连测试时,您可能无法使用poweron命令完全打开系统的电源.
出现此情况时,系统会返回到lom>提示符下.
作为临时性的措施,您可以在服务人员到达之前,在SClom>提示符下键入以下命令序列,将出现故障的CPU/内存板与系统隔离:然后输入poweron命令即可.
Jul1515:58:12nonamelom:SB0/ar0BitinerrorP3_ADDR[2]Jul1515:58:12nonamelom:SB0/ar0BitinerrorP3_ADDR[1]Jul1515:58:12nonamelom:SB0/ar0BitinerrorP3_ADDR[0]Jul1515:58:12nonamelom:ARInterconnecttest:SystemboardSB0/ar0addressrepeaterconnectionstosystemboardRP2/ar0failedJul1515:58:13nonamelom:SB0/ar0BitinerrorP3_INCOMING[0]Jul1515:58:17nonamelom:SB0/ar0BitinerrorP3_PREREQ[0]Jul1515:58:17nonamelom:SB0/ar0BitinerrorP3_ADDR[18]Jul1515:58:17nonamelom:SB0/ar0BitinerrorP3_ADDR[17]lom>disablecomponentSBx.
.
lom>poweroff.
.
lom>resetsc-y第10章故障排除99恢复挂起的系统如果您无法登录到Solaris操作系统,并且在LOMshell中键入break命令后,仍不能强制系统回到OpenBootPROMok提示符下,则说明系统已被挂起.
某些情况下,主机监视器会在检测到Solaris操作系统挂起时自动重置系统.
如果没有禁用主机监视器(使用setupsc命令),则主机监视器会自动重置系统.
另外,您还可以在lom>提示符下运行reset命令(默认选项为-x,此选项用于将外部重置(XIR)命令发送到处理器).
reset命令将终止Solaris操作系统的运行.
警告–终止Solaris操作系统时,内存中的数据可能不会保存到磁盘中.
因此,此操作可能会丢失或损坏应用文件系统的数据.
终止Solaris操作系统之前,系统会要求您确认此操作.
手动恢复挂起的系统1.
完成第104页"协助Sun服务人员查明故障原因"中的步骤.
2.
访问LOMshell.
参阅第3章.
3.
键入reset命令,强制系统回到OpenBootPROM提示符下.
reset命令会将外部重置(XIR)命令发送给系统并收集用于调试硬件的数据.
注–如果已经使用setsecure命令将系统置入安全模式,系统将会显示错误信息.
系统在安全模式下时,无法运行reset或break命令.
有关详细信息,请参阅《SunFireEntry-LevelMidrangeSystemControllerCommandReferenceManual》.
lom>reset100SunFire入门级中型系统管理指南2004年10月4.
此步骤取决于OpenBootPROMerror-reset-recovery配置变量的设置.
如果error-reset-recovery配置变量设为none,系统将立即返回到OpenBootPROM提示符下.
取得控制权后,OpenBootPROM会根据OpenBootPROMerror-reset-recovery配置变量的设置来执行相应的步骤.
您可以在ok提示符下键入任何OpenBootPROM命令,包括用于重新引导Solaris操作系统的boot命令.
此外,您还可以使用sync命令强制生成核心文件.
通过此变量配置的操作可能意味着系统将不能返回到ok提示符下.
如果error-reset-recovery配置变量没有设为none,OpenBootPROM将自动执行恢复操作.
如果error-reset-recovery配置变量设为sync(默认值),系统将生成一个Solaris操作系统核心文件并进行重新引导.
如果OpenBootPROMerror-reset-recovery配置变量设为boot,将会重新引导系统.
5.
如果上述操作不能重新引导系统,请使用poweroff和poweron命令关闭并重新打开系统的电源.
要关闭系统的电源,请键入以下命令:要打开系统的电源,请键入以下命令:移动系统身份信息您可能认为恢复服务的最简单方法是完全更换系统.
为了将系统身份信息和关键设置从一个系统快速移到另一个更换系统上,您可以从故障系统的SCC阅读器(SCCR)中取出系统配置卡(SCC),然后插入更换系统的SCCR中.
系统配置卡(SCC)中存储的信息包括:MAC地址系统控制器10/100以太网端口板载千兆位以太网端口NET0板载千兆位以太网端口NET1主机IDlom>powerofflom>poweron第10章故障排除101LOM关键配置LOM密码换码序列SC网络设置(IP地址/DHCP/网关等)eventreporting级别启用/禁用主机监视器启用/禁用On/Standby启用/禁用安全模式OpenBootPROM关键配置auto-bootboot-devicediag-deviceuse-nvramrclocal-mac-address温度一个或多个组件的温度过高时,可能会导致问题.
使用showenvironment命令可以列出组件的当前状态.
表10-8使用showenvironment命令检查温度条件lom>showenviromentSlotDeviceSensorValueUnitsAgeStatusSSC1SBBC0Temp.
034DegreesC1secOKSSC1CBH0Temp.
041DegreesC1secOKSSC1Board0Temp.
022DegreesC1secOKSSC1Board0Temp.
122DegreesC1secOKSSC1Board0Temp.
228DegreesC1secOKSSC1Board01.
5VDC01.
49VoltsDC1secOKSSC1Board03.
3VDC03.
35VoltsDC1secOKSSC1Board05VDC04.
98VoltsDC1secOK/N0/PS0Input0Volt.
0--1secOK/N0/PS048VDC0Volt.
048.
00VoltsDC1secOK/N0/PS1Input0Volt.
0--5secOK/N0/PS148VDC0Volt.
048.
00VoltsDC5secOK/N0/FT0Fan0Cooling0Auto5secOK/N0/FT0Fan1Cooling0Auto5secOK/N0/FT0Fan2Cooling0Auto5secOK/N0/FT0Fan3Cooling0Auto5secOK/N0/FT0Fan4Cooling0Auto5secOK102SunFire入门级中型系统管理指南2004年10月/N0/FT0Fan5Cooling0Auto5secOK/N0/FT0Fan6Cooling0Auto5secOK/N0/FT0Fan7Cooling0Auto5secOK/N0/RP0Board01.
5VDC01.
49VoltsDC5secOK/N0/RP0Board03.
3VDC03.
37VoltsDC5secOK/N0/RP0Board0Temp.
020DegreesC5secOK/N0/RP0Board0Temp.
119DegreesC5secOK/N0/RP0SDC0Temp.
055DegreesC5secOK/N0/RP0AR0Temp.
045DegreesC5secOK/N0/RP0DX0Temp.
057DegreesC5secOK/N0/RP0DX1Temp.
059DegreesC5secOK/N0/RP2Board01.
5VDC01.
48VoltsDC5secOK/N0/RP2Board03.
3VDC03.
37VoltsDC5secOK/N0/RP2Board0Temp.
022DegreesC5secOK/N0/RP2Board0Temp.
122DegreesC5secOK/N0/RP2SDC0Temp.
053DegreesC5secOK/N0/RP2AR0Temp.
043DegreesC5secOK/N0/RP2DX0Temp.
049DegreesC5secOK/N0/RP2DX1Temp.
052DegreesC5secOK/N0/SB0Board01.
5VDC01.
51VoltsDC5secOK/N0/SB0Board03.
3VDC03.
29VoltsDC5secOK/N0/SB0SDC0Temp.
046DegreesC5secOK/N0/SB0AR0Temp.
039DegreesC5secOK/N0/SB0DX0Temp.
045DegreesC5secOK/N0/SB0DX1Temp.
049DegreesC5secOK/N0/SB0DX2Temp.
053DegreesC5secOK/N0/SB0DX3Temp.
048DegreesC5secOK/N0/SB0SBBC0Temp.
049DegreesC5secOK/N0/SB0Board1Temp.
024DegreesC5secOK/N0/SB0Board1Temp.
124DegreesC6secOK/N0/SB0CPU0Temp.
047DegreesC6secOK/N0/SB0CPU01.
8VDC01.
72VoltsDC6secOK/N0/SB0CPU1Temp.
047DegreesC6secOK/N0/SB0CPU11.
8VDC11.
72VoltsDC6secOK/N0/SB0SBBC1Temp.
037DegreesC6secOK/N0/SB0Board1Temp.
224DegreesC6secOK/N0/SB0Board1Temp.
324DegreesC6secOK/N0/SB0CPU2Temp.
049DegreesC6secOK/N0/SB0CPU21.
8VDC01.
71VoltsDC6secOK/N0/SB0CPU3Temp.
046DegreesC6secOK/N0/SB0CPU31.
8VDC11.
72VoltsDC7secOK/N0/SB2Board01.
5VDC01.
51VoltsDC6secOK/N0/SB2Board03.
3VDC03.
29VoltsDC6secOK/N0/SB2SDC0Temp.
055DegreesC6secOK/N0/SB2AR0Temp.
037DegreesC6secOK/N0/SB2DX0Temp.
047DegreesC6secOK/N0/SB2DX1Temp.
050DegreesC6secOK表10-8使用showenvironment命令检查温度条件(续)第10章故障排除103电源设备每个电源设备(PSU)都配有自身的LED指示灯,如下所述:电源/活动指示灯–当PSU正在供电时,此指示灯亮起;当PSU处于待机模式时,此指示灯闪烁故障指示灯–如果PSU检测到故障并停止供电,此指示灯亮起/N0/SB2DX2Temp.
053DegreesC6secOK/N0/SB2DX3Temp.
047DegreesC6secOK/N0/SB2SBBC0Temp.
048DegreesC6secOK/N0/SB2Board1Temp.
023DegreesC7secOK/N0/SB2Board1Temp.
124DegreesC7secOK/N0/SB2CPU0Temp.
045DegreesC7secOK/N0/SB2CPU01.
8VDC01.
72VoltsDC7secOK/N0/SB2CPU1Temp.
046DegreesC7secOK/N0/SB2CPU11.
8VDC11.
73VoltsDC7secOK/N0/SB2SBBC1Temp.
037DegreesC7secOK/N0/SB2Board1Temp.
224DegreesC7secOK/N0/SB2Board1Temp.
325DegreesC7secOK/N0/SB2CPU2Temp.
047DegreesC7secOK/N0/SB2CPU21.
8VDC01.
71VoltsDC7secOK/N0/SB2CPU3Temp.
045DegreesC7secOK/N0/SB2CPU31.
8VDC11.
71VoltsDC7secOK/N0/IB6Board01.
5VDC01.
50VoltsDC7secOK/N0/IB6Board03.
3VDC03.
35VoltsDC7secOK/N0/IB6Board05VDC04.
95VoltsDC7secOK/N0/IB6Board012VDC011.
95VoltsDC7secOK/N0/IB6Board0Temp.
029DegreesC7secOK/N0/IB6Board0Temp.
128DegreesC7secOK/N0/IB6Board03.
3VDC13.
30VoltsDC7secOK/N0/IB6Board03.
3VDC23.
28VoltsDC7secOK/N0/IB6Board01.
8VDC01.
81VoltsDC7secOK/N0/IB6Board02.
5VDC02.
51VoltsDC7secOK/N0/IB6Fan0Cooling0High7secOK/N0/IB6Fan1Cooling0High7secOK/N0/IB6SDC0Temp.
063DegreesC7secOK/N0/IB6AR0Temp.
077DegreesC7secOK/N0/IB6DX0Temp.
069DegreesC7secOK/N0/IB6DX1Temp.
073DegreesC8secOK/N0/IB6SBBC0Temp.
051DegreesC8secOK/N0/IB6IOASIC0Temp.
046DegreesC8secOK/N0/IB6IOASIC1Temp.
152DegreesC8secOK表10-8使用showenvironment命令检查温度条件(续)104SunFire入门级中型系统管理指南2004年10月故障预警指示灯–如果PSU检测到潜在的内部故障,并且仍在供电(只有PSU风扇速度降低才会造成这种情况),此指示灯亮起.
另外还有两个标识为SourceA(电源A)和SourceB(电源B)的系统LED指示灯.
这两个LED指示灯显示系统的供电状态.
系统共有四条物理供电线路,分为A和B两种.
供电线路A向PS0和PS1供电,供电线路B向PS2和PS3供电.
如果PS0或PS1接收到输入电源,那么SourceA指示灯将会亮起.
如果PS2或PS3接收到输入电源,那么SourceB指示灯将会亮起.
如果没有电源设备接收到输入电源,这些指示灯将会熄灭.
这些指示灯的监控频率设为每10秒钟至少一次.
显示诊断信息有关显示诊断信息的详情,请参阅Solaris操作系统版本附带的《Sun硬件平台指南》.
协助Sun服务人员查明故障原因请向Sun服务人员提供以下信息,以便查明故障原因:产生故障时写入系统控制台的输出内容的详细副本.
同时,还应包括用户操作产生的所有打印输出.
如果该副本未显示特定的用户操作,请另附一份单独的文件,说明产生特定消息的操作.
产生故障时来自/var/adm/messages的系统日志文件副本.
在LOMshell下运行下列系统控制器命令所产生的输出:showsc-v命令showboards-v命令showlogs命令historydateshowresetstateshowenvironment105第11章固件升级过程本章介绍如何升级系统固件.
可用两种方法更新SunFire入门级中型系统中的固件:在SCLOM提示符下运行flashupdate命令.
在Solaris操作系统中运行lom-G命令.
第一种方法要求将SC10/100以太网端口连接到合适的网络并作相应的配置,使其可以访问那些包含所需新固件映像的外部FTP或HTTP服务器.
本章包括下列主题:第105页"使用flashupdate命令"第109页"使用lom–G命令"使用flashupdate命令flashupdate命令要求10/100以太网端口可以访问外部FTP或HTTP服务器.
flashupdate命令可以更新SC及系统板(CPU/内存板和I/O部件)中的闪存PROM.
源闪存映像通常保存在NFS服务器上.
如果您更新的是CPU/内存板,则可以使用一块板的闪存映像来更新另一块板的闪存映像.
flashupdate命令的语法如下:flashupdate[-y|-n]-furlall|systemboards|scapp|rtos|board.
.
.
flashupdate[-y|-n]-csource_boarddestination_board.
.
.
flashupdate[-y|-n]-u106SunFire入门级中型系统管理指南2004年10月其中:-y不显示确认提示.
-n如果需要确认则不执行此命令.
-f将URL指定为闪存映像的来源.
此选项要求通过网络连接至NFS服务器上的闪存映像.
您可使用此选项安装新的固件.
url是包含闪存映像目录的URL,必须采用以下格式:ftp://[userid:password@]hostname/path或http://hostname/pathall将更新所有板(CPU/内存板、I/O部件和系统控制器).
此操作将重新引导SC.
systemboards将更新所有CPU/内存板和I/O部件.
scapp将更新SC应用程序.
此操作将重新引导SC.
rtos将更新SCRTOS.
此操作将重新引导SC.
board命名要更新的板(sb0、sb2、sb4或ib6).
-c将某块板指定为闪存映像源.
您可使用此选项来更新那些新(更换)的CPU/内存板.
source_board表示系统中现有的、用作闪存映像源的CPU/内存板(sb0、sb2或sb4).
destination_board表示要更新的CPU/内存板(sb0、sb2或sb4).
-u使用当前具有最高固件版本的板上的映像自动更新所有的CPU/内存板.
您可使用此选项来更新那些新(更换)的CPU/内存板.
-h显示此命令的帮助信息.
要激活更新的OpenBootPROM,需要关闭并重新打开系统的电源.
注–flashupdate不能检索带安全保护(用户ID/密码)的HTTPURL闪存映像.
即使文件可能存在,系统仍会返回以下格式的消息:flashupdate:failed,URLdoesnotcontainrequiredfile:file.
警告–切勿中断flashupdate操作.
如果异常终止flashupdate命令,SC将进入单用模式,并且只能从串行端口进行访问.
第11章固件升级过程107警告–执行flashupdate之前,应使用showboards-pversion命令检查所有板的固件版本.
警告–如要更新SC应用程序(scapp)RTOS,请从运行于串行连接之上的LOMshell中运行flashupdate命令,以便完全监控运行结果.
警告–更新CPU/内存板或I/O部件之前,请确保使用poweron命令打开所有要更新的板的电源.
使用flashupdate命令将SunFireV1280或Netra1280系统的固件版本从5.
13.
x升级到5.
17.
01.
升级SC上的固件:2.
打开所有板的电源:3.
升级系统板上的固件:此步骤会将sb0、sb2、sb4和IB6升级到与系统控制器相同的固件级别4.
退出Solaris操作系统.
5.
关闭系统电源.
6.
打开系统电源.
lom>flashupdate-furlscapprtoslom>poweronalllom>flashupdate-furlsb0sb2sb4ib6108SunFire入门级中型系统管理指南2004年10月使用flashupdate命令将SunFireE2900、SunFireV1280或Netra1280系统的固件版本从5.
17.
x升级到5.
18.
01.
打开所有板的电源:2.
升级SC上的固件:此步骤会将CPU/内存板、IB6和系统控制器升级到相同的固件级别.
3.
退出Solaris操作系统.
4.
关闭系统电源.
5.
打开系统电源.
使用flashupdate命令将SunFireV1280或Netra1280系统的固件版本从5.
17.
x降级到5.
13.
x1.
降级SC上的固件:2.
打开所有板的电源:3.
降级系统板上的固件:4.
退出Solaris操作系统.
5.
关闭系统电源.
lom>poweronalllom>flashupdate-furlalllom>flashupdate-furlscapprtoslom>poweronalllom>flashupdate-furlsb0sb2sb4ib6第11章固件升级过程1096.
打开系统电源.
注–5.
13.
x固件不支持UltraSPARCIVCPU/内存板以及5.
17.
x或5.
18.
0固件中的任何新增功能.
使用flashupdate命令将SunFireE2900、SunFireV1280或Netra1280系统的固件版本从5.
18.
0降级到5.
17.
x1.
打开所有板的电源:2.
降级SC上的固件:此步骤将CPU/内存板、IB6和系统控制器降级到相同的固件级别.
3.
退出Solaris操作系统.
4.
关闭系统电源.
5.
打开系统电源.
使用lom–G命令共有四种映像类型可能需要使用这种方式传输,这四种映像类型的名称格式如下:lw8pci.
flash(包含I/O板本地POST)lw8cpu.
flash(包含CPU/内存板本地POST和OBP)sgsc.
flash(包含LOM/SC固件)sgrtos.
flash(包含LOM/SC实时操作系统)您必须将这些类型的映像放在适当的目录下,如/var/tmp目录,并在lom-G命令之后输入您要下载的文件的名称.
根据文件包含的标题信息,固件便可知道所升级的映像类型.
lom>poweronalllom>flashupdate-furlall110SunFire入门级中型系统管理指南2004年10月www.
sunsolve.
sun.
com网站以修补程序的形式提供了这些映像.
您可以从该网站下载这些映像,也可以向Sun服务代表订购.
修补程序附带的README文件中包含有关安装这些新固件映像的详细说明.
请注意,您必须完全遵循说明进行操作,否则可能导致系统无法引导.
警告–切勿中断lom-G操作.
如果异常终止lom-G命令,SC将进入单用模式,并且只能从串行端口进行访问.
警告–执行lom-G之前,应使用showboards-pversion命令检查所有板的固件版本.
警告–从运行于串行连接之上的Solaris控制台中运行lom-G命令,以便可以完全监控运行结果.
警告–更新CPU/内存板或I/O部件之前,请确保使用poweron命令打开所有要更新的板的电源.
代码样例下载lw8pci.
flash映像:代码样例11-1下载lw8pci.
flash映像#lom-Glw8pci.
flashThisprogramwillreplaceLOMfirmwarewithversion5.
17.
0AreyousureyouwanttocontinueEnter'C'andreturntoContinueoranythingelsetoTerminateCTransferring346kBimagetothesystemcontroller.
Thismaytakeseveralminutes.
Validatingimage.
.
.
346kBIOimagetransferred.
Programming/N0/IB6/FP0Comparingimageandflash#Imageandflasharedifferent,proceedingwithupdate.
Erasing.
.
.
.
.
.
DoneProgramming.
.
.
.
.
.
Done第11章固件升级过程111下载lw8cpu.
flash映像:Verifying.
.
.
.
.
.
DoneFriDec1208:20:42commandolom:/N0/IB6/FP0updatedwithversion5.
17.
012/12/2003.
Dec1211:20:41commando-alw8:/N0/IB6/FP0updatedwithversion5.
17.
012/12/2003.
Firmwareupdatecomplete.
YoumustrebootSolaristoloadthenewfirmware.
代码样例11-2下载lw8cpu.
flash映像#lom-Glw8cpu.
flashThisprogramwillreplaceLOMfirmwarewithversion5.
17.
0AreyousureyouwanttocontinueEnter'C'andreturntoContinueoranythingelsetoTerminateCTransferring906kBimagetothesystemcontroller.
Thismaytakeseveralminutes.
Validatingimage.
.
.
#906kBCPUimagetransferred.
Programming/N0/SB0/FP0ComparingimageandflashImageandflasharedifferent,proceedingwithupdate.
ErasingDoneProgrammingDoneVerifyingDoneFriDec1208:23:43commandolom:/N0/SB0/FP0updatedwithversion5.
17.
012/12/2003.
Dec1211:23:42commando-alw8:/N0/SB0/FP0updatedwithversion5.
17.
012/12/2003.
Programming/N0/SB0/FP1ComparingimageandflashImageandflasharedifferent,proceedingwithupdate.
ErasingDoneProgrammingDoneVerifyingDoneFriDec1208:24:24commandolom:/N0/SB0/FP1updatedwithversion5.
17.
012/12/2003.
Dec1211:24:23commando-alw8:/N0/SB0/FP1updatedwithversion5.
17.
012/12/2003.
Programming/N0/SB2/FP0Comparingimageandflash代码样例11-1下载lw8pci.
flash映像(续)112SunFire入门级中型系统管理指南2004年10月Imageandflasharedifferent,proceedingwithupdate.
ErasingDoneProgrammingDoneVerifyingDoneFriDec1208:25:06commandolom:/N0/SB2/FP0updatedwithversion5.
17.
012/12/2003.
Dec1211:25:06commando-alw8:/N0/SB2/FP0updatedwithversion5.
17.
012/12/2003.
Programming/N0/SB2/FP1ComparingimageandflashImageandflasharedifferent,proceedingwithupdate.
ErasingDoneProgrammingDoneVerifyingDoneFriDec1208:25:48commandolom:/N0/SB2/FP1updatedwithversion5.
17.
012/12/2003.
Dec1211:25:48commando-alw8:/N0/SB2/FP1updatedwithversion5.
17.
012/12/2003.
Programming/N0/SB4/FP0ComparingimageandflashImageandflasharedifferent,proceedingwithupdate.
ErasingDoneProgrammingDoneVerifyingDoneFriDec1208:26:31commandolom:/N0/SB4/FP0updatedwithversion5.
17.
012/12/2003.
Dec1211:26:30commando-alw8:/N0/SB4/FP0updatedwithversion5.
17.
012/12/2003.
Programming/N0/SB4/FP1ComparingimageandflashImageandflasharedifferent,proceedingwithupdate.
ErasingDoneProgrammingDoneVerifyingDoneFriDec1208:27:11commandolom:/N0/SB4/FP1updatedwithversion5.
17.
012/12/2003.
Dec1211:27:10commando-alw8:/N0/SB4/FP1updatedwithversion5.
17.
012/12/2003.
Firmwareupdatecomplete.
YoumustrebootSolaristoloadthenewfirmware.
代码样例11-2下载lw8cpu.
flash映像(续)第11章固件升级过程113使用lom-G命令升级SunFireE2900、SunFireV1280或Netra1280系统的固件将固件从5.
13.
xx升级到5.
17.
x或5.
18.
0时,可以使用相同的升级过程.
1.
升级SC上的固件:2.
换码到lom>并重置SC:3.
升级系统板上的固件:4.
退出Solaris操作系统.
5.
关闭系统电源.
6.
打开系统电源.
使用lom-G命令降级SunFireE2900、SunFireV1280或Netra1280系统的固件将固件从5.
18.
0降级到5.
17.
x或5.
13.
x时,可以使用相同的降级过程.
注–5.
13.
x固件不支持UltraSPARCIVCPU/内存板以及5.
17.
x或5.
18.
0固件中的任何新增功能.
#lom–Gsgsc.
flash#lom–Gsgrtos.
flashlom>resetsc–y#lom–Glw8cpu.
flash#lom–Glw8pci.
flash114SunFire入门级中型系统管理指南2004年10月1.
降级SC上的固件:2.
换码到lom>并重置SC:3.
降级其它板上的固件:4.
退出Solaris操作系统.
5.
关闭系统电源.
6.
打开系统电源.
#lom–Gsgsc.
flash#lom–Gsgrtos.
flashlom>resetsc–y#lom–Glw8cpu.
flash#lom–Glw8pci.
flash115第12章CPU/内存板更换和动态重配置(DR)本章介绍如何动态重配置SunFire入门级中型系统上的CPU/内存板.
本章包括下列主题:第115页"动态重配置"第122页"命令行界面"第129页"故障排除"动态重配置动态重配置(DR)软件是Solaris操作系统的一部分.
通过DR软件,您可以在运行Solaris操作系统的同时动态重配置系统板以及安全地拆卸和安装系统板,而且几乎不会中断正在系统上运行的用户进程.
可用DR软件执行下列操作:安装或拆卸板时,尽可能缩短系统应用程序的中断时间.
删除可能出现故障的设备,以防此故障造成操作系统崩溃.
显示板的操作状态.
可在系统保持运行的同时启动板的系统测试.
命令行界面Solariscfgadm(1M)命令提供了用于管理DR功能的命令行界面.
116SunFire入门级中型系统管理指南2004年10月DR概念静止在取消配置具有永久内存(OpenBootPROM或核心内存)的系统板期间,操作系统会暂停一段时间,这称为操作系统"静止".
底板上的所有操作系统和设备活动在此操作的关键阶段均必须停止.
注–静止状态可能会持续数分钟,这取决于工作负载和系统配置.
进入静止状态之前,操作系统必须暂时挂起所有进程、CPU和设备活动.
系统可能需要数分钟才能进入静止状态,这取决于系统的使用情况和当前正在进行的活动.
如果不能进入静止状态,操作系统将会显示原因,这些原因可能包括:某一执行线程不能挂起.
实时进程正在运行.
存在操作系统不能暂停的设备.
导致进程不能挂起的情况一般是暂时性的.
检查故障原因.
如果操作系统遇到的问题是暂时性的—未能挂起进程—您可以稍后重试.
RPC或TCP超时或连接中断默认情况下,两分钟后就会出现超时.
管理员可能需要增加这一超时值,以免DR软件引发的操作系统静止过程出现超时,因为这一过程需要的时间可能不止两分钟.
系统静止将使系统和相关网络服务在一段时间内都不能使用,这段时间可能超过两分钟.
这些更改既影响客户机也影响服务器.
Suspend-Safe和Suspend-Unsafe设备当DR软件挂起操作系统时,所有与操作系统挂接的设备驱动程序也必须挂起.
如果某个驱动程序不能挂起(或挂起后又恢复运行),DR操作会失败.
Suspend-Safe设备在操作系统处于静止状态时不会访问内存或中断系统.
如果某一驱动程序支持操作系统静止(挂起/恢复运行),则说明它是Suspend-Safe驱动程序,即它在挂起期间是安全的.
Suspend-Safe驱动程序还能保证,在系统成功完成挂起请求后,此驱动程序所管理的设备仍不会试图访问内存,即使之前在执行挂起请求时此设备处于打开状态.
Suspend-Unsafe设备是指在操作系统处于静止状态期间,仍允许访问内存或中断系统的设备.
第12章CPU/内存板更换和动态重配置(DR)117附着点附着点是板及其插槽的总称.
DR可以显示插槽、板和附着点的状态.
板的DR定义还包括与其连接的设备,所以"占有者"是指板及其连接设备的组合.
插槽(也称"插座")可使占有者与主机之间实现电气隔离,即软件可以将单个插槽置入低功率模式.
插座可根据插槽的编号来命名,也可以使用匿名(例如:SCSI链).
要获得所有可用逻辑附着点的列表,请运行带-l选项的cfgadm(1M)命令.
附着点有两种格式:物理附着点描述软件驱动程序和插槽的位置.
下面是物理附着点名称的示例:其中逻辑附着点是由系统创建的缩写名,用于表示物理附着点.
逻辑附着点的格式如下:注意cfgadm命令还会显示I/O部件N0.
IB6,但由于它不是冗余的附着点,因此不允许在这个附着点上进行任何DR操作.
DR操作DR操作主要有四种类型:/devices/ssm@0,0:N0.
SBxN0是指节点0(零)SB是指系统板x是指插槽编号.
系统板的插槽编号可以为0、2或4N0.
SBx表12-1DR操作类型类型说明连接插槽为板提供电源并监控其温度.
配置操作系统为板分配功能角色,为板载入设备驱动程序,并使板上的设备供Solaris操作系统使用.
取消配置系统以逻辑方式将板与操作系统分离.
环境监控继续进行,但板上的设备不可供系统使用.
断开连接系统停止监控此板,并关闭插槽的电源.
118SunFire入门级中型系统管理指南2004年10月如果某系统板正在使用中,请先停止使用此板并断开其与系统的连接,然后再关闭其电源.
插入新的或升级的系统板并接通其电源后,请连接此板的附着点,并对其作相应的配置,使其可供操作系统使用.
cfgadm(1M)命令可以通过单个命令来进行连接和配置(或取消配置和断开连接),但是如有必要,也可单独执行每项操作(连接、配置、取消配置或断开连接).
热插拔硬件热插拔设备具有特殊的连接器,这些连接器在接通数据引脚之前即为板或模块提供电源.
系统正在运行时,可以插入和取出具有热插拔连接器的板和设备.
这些设备设有控制电路,以确保它们在插入过程中具有共同参考基准和电源控制.
板就位后,SC会指示系统向接口供电.
SunFire入门级中型系统中使用的CPU/内存板是热插拔设备.
情况和状态状态是指插座(插槽)或占有者(板)的操作状态.
情况是指附着点的操作状态.
在系统中对板或组件进行DR操作之前,您必须先确定它们的状态和情况.
运行带-la选项的cfgadm(1M)命令可以显示每个组件的类型、状态和情况,以及系统中每个板插槽的状态和情况.
有关组件类型的列表,请参阅第121页"组件类型"一节.
板状态和情况本节介绍CPU/内存板(也称"系统插槽")的状态和情况.
板插座状态板插座可有三种状态:empty(空置)、disconnected(未连接)或connected(已连接).
当插入板时,插座状态将从empty变为disconnected.
当卸下板时,插座状态将从disconnected变为empty.
警告–无论是物理拆除处于connected状态的板,还是拆除电源打开但处于disconnected状态的板,均可能造成操作系统崩溃并导致系统板的永久性损坏.
第12章CPU/内存板更换和动态重配置(DR)119板占有者状态板可以有两种占有者状态:configured(已配置)或unconfigured(已取消配置).
disconnected板的占有者状态总为unconfigured.
板情况板可以有四种情况:unknown(未知)、ok(正常)、failed(失败)或unusable(不可用).
表12-2板插座状态名称说明empty板不存在.
disconnected板与系统总线的连接断开.
板在电源没有关闭时可处于disconnected状态.
但是,从插槽中卸下板之前,必须关闭板的电源且板处于disconnected状态.
connected板的电源已打开且板与系统总线连接.
只有板处于connected状态,您才能查看板上的组件.
表12-3板占有者状态名称说明configured板上至少配置了一个组件.
unconfigured取消配置板上的所有组件.
表12-4板情况名称说明unknown板尚未经过测试.
ok板运行正常.
failed板测试失败.
unusable板插槽不可用.
120SunFire入门级中型系统管理指南2004年10月组件状态和情况本节介绍组件的状态和情况.
组件插座状态组件不能单独连接或断开连接.
因此,组件只有一种状态:connected(已连接).
组件占有者状态组件可有两种占有者状态:configured(已配置)或unconfigured(已取消配置).
组件情况组件可有三种情况:unknown(未知)、ok(正常)或failed(失败).
表12-5组件占有者状态名称说明configured组件可供Solaris操作系统使用.
unconfigured组件不能供Solaris操作系统使用.
表12-6组件情况名称说明unknown组件尚未经过测试.
ok组件运行正常.
failed组件测试失败.
第12章CPU/内存板更换和动态重配置(DR)121组件类型您可以使用DR来配置或取消配置几种类型的组件.
非永久内存和永久内存在删除一块板之前,操作系统必须腾出该板上的内存.
腾出板内存就是将板的非永久内存刷新到交换区,而将板的永久内存(即核心内存和OpenBootPROM内存)复制到其它内存板.
要重新定位永久内存,必须暂时挂起系统中的操作系统或将其置入静止状态.
挂起的时间取决于系统配置和运行负载.
将板与永久内存分离只能在操作系统处于挂起状态时进行;因此,您应知道永久内存的位置,以免对系统操作造成严重影响.
您可以运行带-v选项的cfgadm(1M)命令来显示永久内存.
如果板上存在永久内存,操作系统必须找到另一有足够容量的内存组件来接收此永久内存.
如果找不到,DR操作将会失败.
限制内存交叉存储如果系统内存交叉存储在多个CPU/内存板之间,则不能动态重配置系统板.
重新配置永久内存在系统外动态重配置那些包含不可重定位(永久)内存的CPU/内存板时,要求暂停所有域活动,此过程可能会延迟应用程序的响应时间.
一般情况下,这种情况适用于系统中的某个CPU/内存板.
板上内存由cfgadm-av命令产生的状态显示中的非零永久内存大小来标识.
只有满足以下其中一个条件时,DR才支持将一块系统板的永久内存重新配置到另一系统板:目标系统板具有与源系统板相同的内存容量;目标系统板的内存大于源系统板的内存.
此情况下,可将更多的内存添加到可用内存池中.
表12-7组件类型名称说明cpu单个CPUmemory板上所有内存122SunFire入门级中型系统管理指南2004年10月命令行界面本节介绍以下操作步骤:第122页"cfgadm命令"第122页"显示基本板状态"第123页"显示详细板状态"第125页"测试板和部件"第125页"测试CPU/内存板"第127页"安装新板"第127页"热交换CPU/内存板"第128页"从系统中拆卸CPU/内存板"第129页"暂时断开CPU/内存板的连接"注–无需明确启用动态重配置(DR).
默认情况下,系统已启用DR.
cfgadm命令您可使用cfgadm(1M)命令对那些可动态重配置的硬件资源执行配置管理操作.
表12-8列出了DR板状态.
显示基本板状态cfgadm程序可以显示板和插槽的有关信息.
有关此命令的选项,请参阅cfgadm(1)手册页.
许多操作都要求您指定系统板的名称.
表12-8系统控制器(SC)产生的DR板状态板状态说明Available插槽尚未分配.
Assigned板已分配,但尚未配置使用它的硬件.
板可由机箱端口重新分配和释放.
Active板已激活,正在使用中.
激活的板不能重新分配.
第12章CPU/内存板更换和动态重配置(DR)123要获得这些系统板名称,请键入以下命令:如果不使用选项,cfgadm命令将显示所有已知附着点的信息,包括板插槽和SCSI总线.
下面显示了该命令的典型输出.
显示详细板状态要获得更详细的状态报告,请使用cfgadm-av命令.
-a选项用于列出附着点,而-v选项用于启用详细描述.
代码样例12-2是cfgadm-av命令生成的部分显示.
由于此显示中的很多行发生折行,因此输出看起来有点复杂.
(此状态报告对应的系统与代码样例12-1使用的系统相同.
)图12-1提供了每一显示项目的详细信息.
#cfgadm代码样例12-1cfgadm基本命令的输出#cfgadmAp-IdTypeReceptacleOccupantConditionN0.
IB6PCI_I/O_BoaconnectedconfiguredokN0.
SB0CPU_BoardconnectedconfiguredunknownN0.
SB4unknownemptyunconfiguredunknownc0scsi-busconnectedconfiguredunknownc1scsi-busconnectedunconfiguredunknownc2scsi-busconnectedunconfiguredunknownc3scsi-busconnectedconfiguredunknown代码样例12-2cfgadm-av命令的输出#cfgadm-avAp-IdReceptacleOccupantConditionInformationWhenTypeBusyPhys_IdN0.
IB6connectedconfiguredokpowered-on,assignedApr318:04PCI_I/O_Boan/devices/ssm@0,0:N0.
IB6N0.
IB6::pci0connectedconfiguredokdevice/ssm@0,0/pci@19,70000Apr318:04ion/devices/ssm@0,0:N0.
IB6::pci0N0.
IB6::pci1connectedconfiguredokdevice/ssm@0,0/pci@19,600000Apr318:04ion/devices/ssm@0,0:N0.
IB6::pci1N0.
IB6::pci2connectedconfiguredokdevice/ssm@0,0/pci@18,700000124SunFire入门级中型系统管理指南2004年10月图12-1显示了代码样例12-2中显示内容的详细信息:图12-1cfgadm-av显示内容的详细信息Apr318:04ion/devices/ssm@0,0:N0.
IB6::pci2N0.
IB6::pci3connectedconfiguredokdevice/ssm@0,0/pci@18,600000Apr318:04ion/devices/ssm@0,0:N0.
IB6::pci3N0.
SB0connectedconfiguredunknownpowered-on,assignedApr318:04CPU_Boardn/devices/ssm@0,0:N0.
SB0N0.
SB0::cpu0connectedconfiguredokcpuid0,speed750MHz,ecache8MBytesApr318:04cpun/devices/ssm@0,0:N0.
SB0::cpu0N0.
SB0::cpu1connectedconfiguredokcpuid1,speed750MHz,ecache8MBytesApr318:04cpun/devices/ssm@0,0:N0.
SB0::cpu1N0.
SB0::cpu2connectedconfiguredokcpuid2,speed750MHz,ecache8MBytesApr318:04cpun/devices/ssm@0,0:N0.
SB0::cpu2代码样例12-2cfgadm-av命令的输出(续)N0.
IB6connectedconfiguredokpowered-on,assignedApr318:04PCI_I/O_Boan/devices/ssm@0,0:N0.
IB6附着点ID插座状态占有者状态情况板/组件信息连接时间板/组件类型繁忙状态物理ID和位置第12章CPU/内存板更换和动态重配置(DR)125命令选项表12-9列出了cfgadm-c命令的选项.
表12-10列出了cfgadm-x命令提供的选项.
cfgadm_sbd手册页提供了有关cfgadm-c和cfgadm-x选项的其它信息.
sbd库通过cfgadm结构提供sbd类别的热插拔系统板的功能.
测试板和部件测试CPU/内存板测试CPU/内存板之前,必须先打开其电源然后断开连接.
如果不能满足这些条件,板测试将会失败.
1.
以超级用户的身份键入Solariscfgadm命令来测试CPU/内存板:表12-9cfgadm-c命令选项cfgadm-c选项功能connect插槽为板提供电源,且系统开始监控板.
如果插槽先前未被分配,则现在进行分配.
disconnect系统停止监控此板,并关闭插槽的电源.
configure操作系统为板分配功能角色,并为板及其连接的设备载入设备驱动程序.
unconfigure系统以逻辑方式将板与操作系统分离,并使相关的设备驱动程序脱机.
环境监控继续进行,但板上的任何设备都不可用于系统.
表12-10cfgadm-x命令选项cfgadm-x选项功能poweron打开CPU/内存板的电源.
poweroff关闭CPU/内存板的电源.
#cfgadm-tap-id126SunFire入门级中型系统管理指南2004年10月要更改cfgadm运行的诊断级别,请为cfgadm命令提供如下所示的诊断级别:其中level是诊断级别ap-id可以是N0.
SB0、N0.
SB2或N0.
SB4.
如果没有提供level,系统会将诊断级别设为默认值.
诊断级别包括:安装或更换CPU/内存板警告–物理板更换只能由合格的维修人员执行.
#cfgadm-oplatform=diag=-tap-id表12-11诊断级别诊断级别说明init只运行系统板初始化代码.
不进行任何测试.
这种方式将快速通过POST.
quick使用少数测试模式对所有系统板组件进行少量的测试.
default使用所有测试模式对除内存和Ecache模块以外的所有系统板组件进行全面测试.
注意max与default的定义相同.
max使用所有测试模式对除内存和Ecache模块以外的所有系统板组件进行全面测试.
注意max与default的定义相同.
mem1以default级别运行所有测试并运行更为详尽的DRAM和SRAM测试算法.
对于内存和Ecache模块,则使用多种模式对所有存储单元进行测试.
此级别不运行规模较大且耗时的算法.
mem2与mem1大致相同,只不过多了一项DRAM测试,这项测试对DRAM数据进行了明确的对比.
第12章CPU/内存板更换和动态重配置(DR)127安装新板警告–有关物理拆卸和更换CPU/内存板的详细信息,请参阅《SunFireE2900SystemServiceManual》或《SunFireV1280/Netra1280ServiceManual》.
请严格遵守所述的过程,否则可能会损坏系统板和其它组件.
注–在更换板时,有时需要填充面板.
如果您不知道如何将板插入系统,请先阅读《SunFireE2900SystemServiceManual》或《SunFireV1280/Netra1280ServiceManual》,然后执行本过程.
1.
戴上接地腕带,并正确接地.
2.
找到空插槽后,从中取出系统板填充面板.
3.
您应在一分钟内将板插入插槽,以防系统过热.
有关板插入操作过程的详细步骤,请参阅《SunFireE2900SystemServiceManual》或《SunFireV1280/Netra1280ServiceManual》.
4.
使用cfgadm-cconfigure命令打开该板的电源、测试和配置该板:其中ap-id可以是N0.
SB0、N0.
SB2或N0.
SB4.
热交换CPU/内存板警告–有关物理拆卸和更换板的详细信息,请参阅《SunFireE2900SystemServiceManual》或《SunFireV1280/Netra1280ServiceManual》.
请严格遵守所述的过程,否则可能会损坏系统板和其它组件.
1.
戴上接地腕带,并正确接地.
2.
使用cfgadm命令关闭板的电源.
#cfgadm-cconfigureap-id128SunFire入门级中型系统管理指南2004年10月其中ap-id可以是N0.
SB0、N0.
SB2或N0.
SB4.
此命令将从Solaris操作系统及OpenBootPROM中删除相关资源,并关闭板的电源.
3.
确认Power(电源)和HotplugOK(热插拔正常)LED指示灯的状态.
在CPU/内存板冷却期间,绿色PowerLED指示灯会快速闪烁.
只有在绿色PowerLED指示灯熄灭且琥珀色HotplugOKLED指示灯亮起时,才可以从系统中拆卸板.
4.
拆卸硬件并安装CPU/内存板.
有关信息,请相应参阅《SunFireE2900SystemServiceManual》或《SunFireV1280/Netra1280ServiceManual》.
5.
拆卸并装好板后,使用Solaris动态重配置命令cfgadm将板放回Solaris操作系统.
其中ap-id可以是N0.
SB0、N0.
SB2或N0.
SB4.
此命令将打开板的电源,测试、连接该板,并将该板的所有资源放回Solaris操作系统.
6.
验证绿色PowerLED指示灯是否亮起.
从系统中拆卸CPU/内存板注–执行本过程之前,请确保您已准备好系统板填充面板,以便替换您要拆卸的系统板.
系统板填充面板是一块带有插槽的金属板,它可以促进冷空气的循环,从而加快冷却速度.
1.
使用cfgadm-cdisconnect命令从系统中逻辑断开CPU/内存板并关闭其电源.
其中ap-id可以是N0.
SB0、N0.
SB2或N0.
SB4.
#cfgadm-cdisconnectap-id#cfgadm-cconfigureap-id#cfgadm-cdisconnectap-id第12章CPU/内存板更换和动态重配置(DR)129警告–有关物理拆卸和更换板的详细信息,请参阅《SunFireE2900SystemServiceManual》或《SunFireV1280/Netra1280ServiceManual》.
请严格遵守所述的过程,否则可能会损坏系统板和其它组件.
2.
从系统中拆卸CPU/内存板.
有关拆卸板的详细步骤,请参阅《SunFireE2900SystemServiceManual》或《SunFireV1280/Netra1280ServiceManual》.
3.
在卸下CPU/内存板后一分钟内将系统板填充面板插入相应的插槽,以防系统过热.
暂时断开CPU/内存板的连接您可以使用DR软件关闭板的电源并将其保留在原来的位置.
例如,在CPU/内存板出现故障时,但没有合适的替换板或系统板填充面板,您可能需要这样做.
使用cfgadm-cdisconnect命令逻辑断开CPU/内存板并关闭其电源.
其中ap-id可以是N0.
SB0、N0.
SB2或N0.
SB4°故障排除本节介绍常见的故障类型:取消配置操作故障配置操作故障下面是cfgadm诊断消息的样例.
(其中不包括语法错误消息.
)#cfgadm-cdisconnectap-idcfgadm:hardwarecomponentisbusy,tryagaincfgadm:operation:Dataerror:error_textcfgadm:operation:Hardwarespecificfailure:error_textcfgadm:operation:Insufficientprivilegescfgadm:operation:Operationrequiresaserviceinterruptioncfgadm:Systemisbusy,tryagainWARNING:Processornumbernumberfailedtooffline.
130SunFire入门级中型系统管理指南2004年10月有关其它错误消息的详细信息,请参阅以下手册页:cfgadm(1M)、cfgadm_sbd(1M)和config_admin(3X).
CPU/内存板取消配置故障取消配置CPU/内存板时,如果系统未处于正确的状态,则取消配置操作将会失败.
尝试取消配置板之前,板上的内存在多块板之间进行交叉存储.
尝试取消配置板之前,某个进程正在使用CPU.
尝试取消配置某个系统板上的CPU之前,该板上的内存在使用中.
板上的内存处于已配置状态(使用中).
参阅第131页"不能取消配置具有永久内存的板上的内存".
板上的CPU不能脱机.
参阅第132页"不能取消配置CPU".
不能取消配置其内存在多块板之间进行交叉存储的板如果您尝试取消配置的系统板上的内存在多块系统板之间进行交叉存储,系统将显示如下错误消息:不能取消配置正在处理某个进程的CPU如果您尝试取消配置的CPU正在处理某个进程,系统将显示如下错误消息:停止CPU处理该进程,然后重新执行取消配置操作.
不能在取消配置所有内存之前取消配置CPU尝试取消配置CPU之前,必须先取消配置系统板上的所有内存.
如果您在未取消配置该板上的所有内存之前尝试取消配置CPU,系统将显示如下错误消息:先取消配置该板上的所有内存,然后再取消配置CPU.
cfgadm:Hardwarespecificfailure:unconfigureN0.
SB2::memory:Memoryisinterleavedacrossboards:/ssm@0,0/memory-controller@b,400000cfgadm:Hardwarespecificfailure:unconfigureN0.
SB2::cpu3:Failedtooff-line:/ssm@0,0/SUNW,UltraSPARC-IIIcfgadm:Hardwarespecificfailure:unconfigureN0.
SB2::cpu0:Can'tunconfigcpuifmemonline:/ssm@0,0/memory-controller第12章CPU/内存板更换和动态重配置(DR)131不能取消配置具有永久内存的板上的内存要取消配置具有永久内存的板上的内存,需将其永久内存页转移到另一块板上,且后者必须有足够的可用内存,以便容纳这些永久内存页.
开始取消配置操作之前,此类附加板必须处于可用状态.
内存不能重新配置如果取消配置操作失败,且出现如下的错误消息,则不能取消配置该板上的内存:在另一块板上添加足够的内存,以便容纳这些永久内存页,然后再次执行取消配置操作.
要确认内存页是否能够转移,请使用cfgadm命令的详情选项,并在列表中查找permanent字样:没有足够的可用内存如果取消配置失败,且出现以下任何一则消息,则表示如果卸下该板,系统将没有足够的可用内存:减少系统中的内存使用量,然后重试.
如果可行,在另一板插槽中安装更多内存.
内存需求增加如果取消配置失败并出现如下消息,表示内存需求在取消配置操作期间已增加:cfgadm:Hardwarespecificfailure:unconfigureN0.
SB0:Noavailablememorytarget:/ssm@0,0/memory-controller@3,400000#cfgadm-av-s"select=type(memory)"cfgadm:Hardwarespecificfailure:unconfigureN0.
SB0:Insufficientmemorycfgadm:Hardwarespecificfailure:unconfigureN0.
SB0:Memoryoperationfailed132SunFire入门级中型系统管理指南2004年10月减少系统中的内存使用量,然后重试.
不能取消配置CPU取消配置CPU是CPU/内存板取消配置过程的一部分.
如果取消配置操作不能使CPU进入脱机状态,系统会将以下消息记录到控制台:导致此故障的原因包括:某个进程正在使用此CPU.
此CPU是CPU集中的最后一个.
此CPU是系统中最后一个联机CPU.
不能断开板的连接取消配置某个板后,可能会出现不能断开该板连接的情况.
cfgadm状态显示会将该板列为不可分离.
如果该板正在提供重要的硬件服务且此服务不能被重新定位到备用板,将会发生此问题.
CPU/内存板配置故障不能同时配置CPU0和CPU1配置CPU0或CPU1之前,请确保已取消配置另一个CPU.
取消配置CPU0和CPU1之后,即可配置它们.
板上的CPU必须在配置内存之前配置配置内存之前,必须先配置系统板上的所有CPU.
如果您在未配置一个或多个CPU时配置内存,系统将显示如下错误消息:cfgadm:Hardwarespecificfailure:unconfigureN0.
SB0:MemoryoperationrefusedWARNING:Processornumberfailedtooffline.
cfgadm:Hardwarespecificfailure:configureN0.
SB2::memory:Can'tconfigmemoryifnotallcpusareonline:/ssm@0,0/memorycontroller133词汇表ap-id附着点标识;ap-id指明附着点的类型及其在系统中的位置.
在系统中,附着点标识是唯一的.
有两种类型的标识:物理和逻辑.
物理标识包含完整路径名称,而逻辑标识只包含简化名称.
cfgadm命令cfgadm是在SunFire入门级中型系统上进行动态重配置的主要命令.
有关此命令及其选项的详细信息,请参阅cfgadm(1M)、cfgadm_sbd(1M)和cfgadm_pci(1M)手册页.
有关此命令及相关命令的最新信息,请参阅DR网站上的Solaris8部分.
参阅第12章.
DR参阅"动态重配置"IP多路径(IPMP)网际协议多路径.
当多个网络接口卡连接到系统时,通过对各类故障进行负载均衡来保持应用程序的连续运行.
如果某个网络适配器发生故障,且备用适配器已连接到同一个IP链路,系统会将所有的网络访问从发生故障的适配器切换到备用适配器.
如果多个网络适配器连接到同一个IP链路,增加的网络通信将分散到各个网络适配器,因此可以增加网络的吞吐量.
RTU许可证使用权许可证.
SC软件执行所有SC硬件管理功能的主要应用程序.
SNMP简单网络管理协议.
SNMP可以是监听SNMP事件的任何系统.
Suspend-SafeSuspend-Safe设备在操作系统处于静止状态时不会访问内存或中断系统.
如果某一驱动程序支持操作系统静止(挂起/恢复运行),则说明它是Suspend-Safe驱动程序,即它在挂起期间是安全的.
Suspend-Safe驱动程序还能保证,在系统成功完成挂起请求后,此驱动程序所管理的设备仍不会试图访问内存,即使之前在执行挂起请求时此设备处于打开状态.
Suspend-UnsafeSuspend-Unsafe设备是指在操作系统处于静止状态期间,仍旧访问内存或导致系统中断的设备.
即需即用(COD)即需即用(COD)选件使您可以根据自身的需要使用额外的处理资源(CPU).
这些额外的CPU安装在SunFire入门级中型系统的CODCPU/内存板上.
购买COD使用权限(RTU)许可证之后,即可使用这些CODCPU.
插座诸如板插槽或SCSI链之类的接收器.
134SunFire入门级中型系统管理指南2004年10月动态重配置动态重配置(DR)是一种软件,允许管理员进行以下操作:(1)查看系统配置;(2)挂起或重新启动有关端口、存储设备或板的操作;(3)在不关闭系统电源的情况下重新配置系统(断开或连接可热交换的设备,如磁盘驱动器或接口板).
如果DR与IPMP或SolsticeDiskSuite软件(以及冗余硬件)配合使用,则在服务提供商更换现有设备或安装新设备时,服务器可继续与磁盘驱动器以及网络进行通信,因而不会出现中断.
如果某一CPU/内存板上的内存没有与系统中其它板的内存进行交叉存储,则DR支持对该CPU/内存板进行更换操作.
端口板连接器.
断开连接系统停止监控板,并关闭插槽的电源.
此时,您可以拔出处于此状态的板.
附着点板及其卡插槽的总称.
物理附着点描述软件驱动程序和卡插槽的位置.
逻辑附着点是由系统创建的缩写名,用于指明物理附着点.
即时访问CPU安装在SunFire入门级中型系统中的CODCPU/内存板上的未经许可的CODCPU.
为CODCPU购买COD使用权(RTU)许可证期间,您最多可访问四个CODCPU供自己随时使用.
它也称为"冗余"CPU.
静止操作系统的暂停.
在此过程中,允许取消配置和断开那些配有非可调页OpenBootPROM(OBP)或核心内存的系统板.
底板上的所有操作系统和设备活动在此操作的关键阶段均必须停止几秒钟.
可分离性设备驱动程序支持DDI_DETACH,且设备(例如:I/O板或SCSI链)按物理方式安排,因此可将其分离.
可挂起性为满足DR操作的要求,设备驱动程序必须能够停止用户线程,执行DDI_SUSPEND调用,停止时钟以及停止CPU.
连接板插入插槽且已接通电源.
此时,系统会监控插槽的温度.
逻辑DR一种DR操作.
在逻辑DR操作中,硬件不会被物理添加或拆除.
例如,出现故障的板被禁用后仍保留在插槽中(以免改变冷却空气的流通),直到装入可用的替换板.
配置(板)操作系统为板分配功能角色,并为板及其连接的设备载入设备驱动程序.
配置(系统)已知连接至系统的设备的集合.
只有在更新物理设备的配置后,系统才能使用此物理设备.
操作系统为板分配功能角色,并为板及其连接的设备载入设备驱动程序.
平台特定机型的SunFire系统,如SunFire入门级中型系统.
情况附着点的操作状态.
取消配置系统以逻辑方式将板与操作系统相分离,并使关联的设备驱动程序脱机.
环境监控继续进行,但板上的任何设备都不可用于系统.
热插拔热插拔板和模块具有特殊的连接器,这些连接器在接通数据引脚之前为相应板或模块提供电源.
系统正在运行时不能插入或拆卸没有热插拔连接器的板和设备.
热交换热交换设备具有特殊的DC电源连接器和逻辑电路,允许在不关闭系统的情况下插入设备.
词汇表135物理DR一种DR操作.
在物理DR操作中,板会被物理添加或拆除.
另请参阅"逻辑DR".
占有者占用DR插座或插槽的硬件资源,如系统板或磁盘驱动器等.
状态插座(插槽)或占有者(板)的操作状态.
136SunFire入门级中型系统管理指南2004年10月137索引英文字母addcodlicense命令,79auto-bootOpenBoot变量,53bootmode命令,52,55cfgadm命令,115,122COD(即需即用),76必要条件,78即时访问CPU(冗余),77使用权(RTU)许可证,76,77,79密钥,80资源CPU状态,85,86监控,78,83配置,82CPU/内存板,更换,115CPU/内存映射,89deletecodlicense命令,80diag-levelOpenBoot变量,52disablecomponent命令,97enablecomponent命令,97error-levelOpenBoot变量,52error-reset-recoveryOpenBoot变量,53flashupdate命令,105I/O部件映射,90interleave-modeOpenBoot变量,53interleave-scopeOpenBoot变量,53LOM换码序列,更改,48监控系统,40-47联机文档,41设置警报,48事件日志示例,42lom-A命令,48lom-E命令,49lom-f命令,43lom-G命令,109lom-l命令,41lom-t命令,46lom-v命令,43lom-X命令,48LOM串行端口,49停止事件报告,49LOM提示符访问,34On/Standby开关,10OpenBootPROM变量,51OpenBoot提示符,访问,35password命令,17POST,51OpenBootPROM变量,51控制,51,55poweroff命令,14poweron命令,12printenv命令,52138SunFire入门级中型系统管理指南2004年10月RAS,5reboot-on-errorOpenBoot变量,53restartssh命令,73RTU(使用权)许可证,76SCPOST,控制,55SecureShell(SSH)协议SSHv2服务器,71主机密钥,73setdate命令,16setenv命令,52setkeyswitchon命令,86setupnetwork命令,17setupsc命令,56showcodlicense命令,80showcodusage命令,84showcomponent命令,66,86,97showenvironment命令,101showlogs命令,64,87shutdown命令,13SNMP,70Solaris控制台访问,34Solaris,安装和引导,18ssh-keygen命令,73suspend-safe设备,116suspend-unsafe设备,116use-nvramrcOpenBoot变量,53verbosity-levelOpenBoot变量,52A安全其它注意事项,73用户和密码,69B板插座状态,118情况,119显示状态,122占有者状态,119板状态,详细,123D打开硬件电源,15待机关闭电源,12电压传感器,43电源设备,103动态重配置,115F非永久内存,121分配,77风扇,检查状态,43附着点,117G故障LED,远程检查状态,41故障,查明原因,104故障,系统,94故障排除,89固件,升级,105挂起,查明原因,104挂起恢复,61挂起系统恢复,99挂起系统,恢复,99关闭电源,12待机模式,12H环境监控,4恢复控制,63恢复硬挂起系统,99获得,79J机箱主机ID,79监控COD资源,83挂起的域,61环境条件,4节点映射,89索引139禁用组件,97警报,检查状态,41警报,设置,48静止,116K可靠性,5可维修性,7可用性,7控制台POST输出,4L列入黑名单手动,97组件,97逻辑附着点,117M密码设置,17用户和安全,69密钥,79N内部电压传感器,43内部温度,检查,46内存非永久,121交叉存储,121永久,121重新配置,121Q强化系统,69切换过程,25情况,组件,118R热备用,78热插拔设备,118日期和时间,设置,16S设备路径名到物理系统设备,89设备名称映射,89事件报告,49手动列入黑名单,97T通电自测,参阅POSTW网络参数,设置,17维护,105温度,101温度过高,101物理附着点,117X系统强化,69硬挂起,恢复,99系统,挂起,恢复,99系统故障,94系统控制器POST,参阅SCPOST系统身份信息,移动,100消息事件,64Y硬挂起系统,恢复,99硬件,打开电源,15映射,89CPU/内存,89I/O部件,90节点,89永久内存,121域传统定义,59最小化,74远程(网络)连接SSH,71140SunFire入门级中型系统管理指南2004年10月Z诊断信息显示,104自动诊断,60证书,76终端,连接,26主机密钥,SSH,73状态,组件,118自动恢复,61自动诊断(AD)引擎,59组件插座状态,120禁用,97类型,121列入黑名单,97情况,120占有者状态,120状态,120组件运行状况(CHS),60最小化,域,74

ucloud国内云服务器2元/月起;香港云服务器4元/首月;台湾云服务器3元/首月

ucloud云服务器怎么样?ucloud为了扩大云服务器市场份额,给出了超低价云服务器的促销活动,活动仍然是此前的Ucloud全球大促活动页面。目前,ucloud国内云服务器2元/月起;香港云服务器4元/首月;台湾云服务器3元/首月。相当于2-4元就可以试用国内、中国香港、中国台湾这三个地域的云服务器1个月了。ucloud全球大促仅限新用户,国内云服务器个人用户低至56元/年起,香港云服务器也仅8...

Virmach:1核/512M1核M1核512M/夏季美国vps促销,年付$7.2,9月更换AMD平台

virmach怎么样?virmach家这几年非常火,从商家的黑五闪购开始,以超低的价格吸引了大批的国人客户,而且商家的机器还是非常稳定的,站长手里的4.75刀年付已经用了两年了,非常稳定,不过商家到国内的线路一般,目前商家新上了夏季优惠促销,价格低到发指,年付7.2美元起,商家反馈将在9月开始更换AMD+NVMe平台,这个消息从年初就有了,不过一直没有更换,目前这个时间也不确定是否准确。点击进入:...

华纳云CN2高防1810M带宽独享,三网直cn218元/月,2M带宽;独服/高防6折购

华纳云怎么样?华纳云是香港老牌的IDC服务商,成立于2015年,主要提供中国香港/美国节点的服务器及网络安全产品、比如,香港服务器、香港云服务器、香港高防服务器、香港高防IP、美国云服务器、机柜出租以及云虚拟主机等。以极速 BGP 冗余网络、CN2 GIA 回国专线以及多年技能经验,帮助全球数十万家企业实现业务转型攀升。华纳云针对618返场活动,华纳云推出一系列热销产品活动,香港云服务器低至3折,...

lw8为你推荐
推广方法现在最常用的推广方式有哪几种金山杀毒怎么样金山杀毒好吗?如何建立一个网站如何建立一个网站神雕侠侣礼包大全神雕侠侣先手礼包在哪领数据库损坏数据库损坏是怎么回事啊?创维云电视功能什么是创维云电视啊?创维云电视是什么意思?人人逛街人人都喜欢逛街吗安装迅雷看看播放器如何用手机安装迅雷看看播放器mate8价格现在买华为mate8高配划算吗ios系统ios系统和安卓系统对比起来有什么优点和缺点?
上海虚拟主机 购买域名 日本vps 高防直连vps 如何注册网站域名 怎样申请域名 科迈动态域名 华为云服务 hostmonster wavecom 特价空间 全能主机 网盘申请 毫秒英文 炎黄盛世 如何用qq邮箱发邮件 免费智能解析 我的世界服务器ip 免费asp空间 主机管理系统 更多