Hướng dẫn sử dụng Kdump để tìm nguyên nhân lỗi Kernel Panic trên CentOS 7
Bạn không sử dụng CentOS 7?
Xem bài viết cho các distro khácGiới thiệu
Khi máy chủ bị lỗi lỗi kernel panic, hệ điều hành sẽ bị crash đột ngột. Lúc này việc kiểm tra trạng thái lúc máy chủ gặp sự cố rất khó khăn bởi máy chủ đã bị crash và không thao tác được, hoặc phải reboot.
Kdump là gì?
Kdump là tính năng của kernel Linux được sử dụng để chụp lại trạng thái của hệ thống khi kernel bị crash. Để bật kdump, chúng ta cần cấp cho nó một lượng RAM vật lý cố định, nó sẽ dùng để chứa các thông tin khi kernel bị panic hoặc crash.
Khi kernel bị crash hoặc panic, nó sẽ gọi kexec(kdump kernel), các thông tin về các vùng nhớ RAM
, SWAP
đang sử dụng sẽ được copy vào file vmcore , được lưu vào ổ đĩa của máy chủ hoặc lưu qua mạng tùy vào cấu hình kdump mà chúng ta chỉ định.
Bằng cách phân tích các file dump này, chúng ta có thể tìm ra nguyên nhân dẫn đến kernel bị panic hoặc crash. Hoặc chúng ta cũng có thể gởi file dump này cho các chuyên gia để họ phân tích lỗi.
Bài viết này sẽ hướng dẫn các bạn cài đặt và cấu hình kdump trên CentOS 7
Yêu cầu
Bạn cần phải đáp ứng các yêu cầu sau trước khi thực hiện:
Có quyền root trên máy chủ
Nên thực hiện ở máy chủ testing trước khi áp dụng vào production
Bước 1: Cài đặt kexec-tools
Sử dụng lệnh yum để cài đặt với quyền root:
Bước 2: khai báo RAM sử dụng cho Kdump kernel
Sửa file /etc/default/grub
, tại dòng crashkernel=<RAM_CAN_KHAI_BAO>
. Tại đây khai báo là 128M
Chạy lệnh sau để hệ thống tải lại file grub2
Reboot lại máy chủ
Bước 3: Khởi động dịch vụ kdump
Sử dụng các lệnh sau
Khởi động kdump
Cấu hình để dịch vụ kdump khởi động kèm với máy chủ
Bước 4: Kiểm tra hoạt động của kdump
Bước này sẽ thử làm crash hệ thống, tuy nhiên trước khi thực hiện, cần kiểm tra kdump có hoạt động hay chưa:
Hoặc lệnh
Nguy hiểm: Thao tác sau sẽ làm crash hệ thống, máy chủ của bạn sẽ bị crash để test kdump và reboot. Vì vậy bạn không nên thực hiện thao tác sau ở các máy chủ production.
Để làm hệ thống crash, thực hiện lệnh sau:
Sau khi hệ thống crash và khởi động lại, chúng ta sẽ thấy file dump tại /var/crash/
Chúc các bạn thành công.
Tính năng đang được phát triển