IT Technology/Cisco

Cisco Switch Crashinfo 확인방법

by빵수 2021. 5. 9. 17:46
728x90
반응형

Cisco Switch Crashinfo 란 ?

 

  • Cisco Catalyst Serise Switch 에서 발생되는 문제로 Supervisor 모듈에 복구할 수 없는 오류가 감지되어 시스템을 다시 시작하는 상황을 의미한다.
  • 크래시의 원인이 되는 오류는 일반적으로 ROM monitor에서 자동으로 특정 오류 처리 코드로 분기하는 프로세서 하드웨어에 의해 감지된다.
  • ROM monitor는 오류 확인, 메시지 인쇄 및 결함 정보를 저장하고 시스템을 다시 시작한다.

 

이와 같이 Cisco Catalyst Serise Switch에서 어떠한 문제가 발생 시에는 다음의 조치 순서를 따라 해 보자

 

 

1. Crashinfo 확인

 

Supervisor 모듈의 경우 Active, Standby 이중화 구성에 많이 사용되고 있다.

 

Command

Switch#dir all-

Switch#dir bootflash:

 

Directory of sup-bootdisk:/  (Active Module)

 

    1  -rw-   118701412   Sep 8 2012 00:34:40 +09:00  s72033-adventerprisek9_wan-mz.122-33.SXI9.bin

    2  -rw-    33554432   Sep 9 2012 05:57:46 +09:00 sea_log.dat

    3  -rw-    33554432   Sep 9 2012 05:58:22 +09:00 sea_console.dat

    4  -rw-    82522660  Feb 22 2007 20:30:04 +09:00  s72033-advipservicesk9_wan-mz.122-18.SXF7.bin

    5  -rw-    80941636  Dec 18 2009 16:54:56 +09:00  s72033-adventerprisek9_wan-mz.122-18.SXF17.bin

 

 

Directory of slavesup-bootdisk:/ (Standby Module)

    1  -rw-   118701412   Sep 8 2012 00:34:40 +09:00  s72033-adventerprisek9_wan-mz.122-33.SXI9.bin

    2  -rw-    33554432   Sep 9 2012 05:57:46 +09:00 sea_log.dat

    3  -rw-    33554432   Sep 9 2012 05:58:22 +09:00 sea_console.dat

    4  -rw-      432061  Jan 21 2015 07:44:48 +09:00  crashinfo_20150121-074448-KOR

    5  -rw-    82522660  Feb 22 2007 20:30:04 +09:00  s72033-advipservicesk9_wan-mz.122-18.SXF7.bin

    6  -rw-    80941636  Dec 18 2009 16:54:56 +09:00  s72033-adventerprisek9_wan-mz.122-18.SXF17.bin

 

 

만일 flash memory가 가득 차서 crashinfo가 최근 날짜로 생성이 안될 경우

flash memory의 공간을 차지하고 있는 파일 중 쓸모없는 파일(예를 들어 아주 오래전에 생성된 crashinfo 파일 등)을 

delete 시킨 후, squeeze 명령으로 깨끗이 삭제 후 공간을 확보한다.

 

 

 

2. Crashinfo 파일 세부 확인

 

Switch#more slavesup-bootdisk:crashinfo_20150121-074448-KOR

Jan 21 07:44:48: %SYSTEM_CONTROLLER-SP-3-ERROR: Error condition detected: TM_DATA_PARITY_ERROR
Jan 21 07:44:48: %SYSTEM_CONTROLLER-SP-3-FATAL: An unrecoverable error has been detected. The system is being reset.

 

 

또는 show vesion에 표시된 마지막 재부팅 원인 또한 확인한다.

 

 

Switch uptime is 45 weeks, 2 days, 18 hours, 1 minute
System returned to ROM by power-on
System restarted at 20:40:53 KST Sat Mar 21 2020

System image file is adventerprisek9_wan-mz.122-18.SXF17.bin
Last reload reason: Unknown reason

 

3. redundancy, bootvar 상태 확인

 

Switch#show redundancy
Switch#show bootvar

 

4. Crashinfo 파일에서 발생된 parrity 오류 모듈 확인

 

 ㄱ. LTL parity check request for 0x76C7 로그 확인 -> 10진수 변환-> 30407
 ㄴ. show diagnostic result module all detail -> 30407 이 어느모듈인지 확인 

 

 

 

5. Cisco TAC Support 지원을 받기 위한 자료 수집

 

 - TFTP로 Crashinfo 파일을 업로드 하여 메일로 발송하기

 

Switch#copy slavebootflash: crashinfo_20150121-074448-KOR  tftp:// 192.168.100.10

 

 - TAC tech-support log를 수집한다.

 

Switch#show tech-support

 

 

준비된 첨부파일들을 Case Open시 함께 첨부하여 Cisco TAC Support를 받는다.

 

 

 

반응형