Q:
Làm thế nào để các công ty tối đa hóa thời gian hoạt động?
A:Giữ cho các dịch vụ CNTT luôn hoạt động là điều quan trọng. Các nhà sản xuất hệ thống đã đưa ra rất nhiều suy nghĩ cho chủ đề này. Một số máy tính tài chính quan trọng đã chạy liên tục trong nhiều năm. Có một câu chuyện trên internet về một máy tính Novell Netware 3 cuối cùng đã ngừng hoạt động sau 16 năm. Khi xem xét thời gian hoạt động của mạng, tiêu chuẩn dành cho "Năm 9 giây", hoặc tính khả dụng 99, 999%. Đạt được thời gian hoạt động tối đa là một cân nhắc quan trọng cho bất kỳ dịch vụ CNTT nào.
Làm thế nào là thời gian hoạt động tối đa đạt được? Quản lý tốt là chìa khóa. Tổ chức Tiêu chuẩn hóa Quốc tế (ISO) đã tạo ra một khung quản lý mạng được gọi là FCAPS, viết tắt của:
- Quản lý lỗi
- Quản lý cấu hình
- Quản lý kế toán
- Quản lý hiệu suất
- Quản lý an ninh
Các vấn đề với các thành phần mạng riêng lẻ được xử lý chủ động và phản ứng bằng mô hình này. Lỗi được theo dõi bằng cách sử dụng báo động và thông báo sự kiện. Chúng được thu thập bởi các tác nhân của các giao thức như SNMP (giao thức quản lý mạng hệ thống) hoặc một số giải pháp độc quyền khác. Ngưỡng tùy chỉnh có thể kích hoạt báo động và thậm chí tự động tạo ra các vé kết thúc trong hàng đợi của nhân viên giám sát trong các trung tâm dữ liệu. Các mạng di động lớn có thể có các bộ phận riêng biệt để đối phó với các lớp lõi, phân phối hoặc truy cập của mạng. Phân tích nguyên nhân gốc rễ cố gắng cô lập và xác định các vấn đề quan trọng sau một sự kiện lớn.
Các quy trình tương tự được sử dụng để quản lý hệ thống. Các nhà cung cấp dịch vụ Internet (ISP) và các trung tâm lưu trữ được quản lý sử dụng quản trị viên hệ thống để giám sát và quản lý khả năng tồn tại của máy chủ, hệ thống lưu trữ hoặc các thiết bị khác. Chẳng hạn, các quy trình riêng lẻ trên máy Windows hoặc Linux có thể được xem và kiểm soát thông qua các chương trình quản lý giao diện người dùng đồ họa (GUI) giống như các giao thức mạng.
Giám sát và cấu hình từ xa các thành phần và hệ thống mạng cung cấp khả năng thời gian thực để tối đa hóa thời gian hoạt động của hệ thống. Điều đó mở rộng đến các thay đổi cấu hình, thu thập các chỉ số hiệu suất chính hoặc thực hiện các cải tiến bảo mật.
Một cách để xem xét thời gian hoạt động và sự mạnh mẽ của bất kỳ hệ thống nào là với mô hình mà IBM gọi là RAS: độ tin cậy, tính sẵn sàng và khả năng phục vụ. Để đảm bảo RAS, nhiều phương pháp đã được phát triển. Chúng bao gồm dự phòng, sao lưu dữ liệu, cung cấp điện liên tục (UPS), các thành phần có thể thay thế nóng và cập nhật tự động. Thay đổi theo kế hoạch và cửa sổ bảo trì cung cấp cơ hội để sửa chữa hoặc cải thiện các sự cố đã biết mà không làm phiền người dùng.
Cuối cùng, hệ thống và mạng sẽ thất bại. Dự phòng là một trong những chìa khóa cho khả năng phục hồi của hệ thống. Điều này có thể áp dụng cho phần cứng, phần mềm hoặc dữ liệu. Những người chịu trách nhiệm đảm bảo độ tin cậy trong mạng hoặc hệ thống phần mềm sẽ tìm kiếm những gì có thể được coi là một điểm lỗi duy nhất (SPOF). Toàn bộ mạng có chảy qua một công tắc hoặc cáp không? Có phải tất cả các quá trình diễn ra trên một máy chủ đơn độc? Có phải chỉ có một bản sao của một tập dữ liệu quan trọng? Không có sự dư thừa, một công ty có thể - ngay lập tức - mất đi những gì có thể mất nhiều năm để phát triển.
Tối đa hóa thời gian hoạt động là một nỗ lực hết sức của người Viking. Thực tiễn tốt nhất đã được phát triển qua nhiều thập kỷ kinh nghiệm và hợp tác. Các giải pháp mới liên tục được đưa ra, như mạng tự phục hồi, ảo hóa, phân tích dữ liệu và kiến trúc được cải thiện. Không có phương pháp duy nhất sẽ trả lời tất cả các vấn đề phát sinh trong các hệ thống phức tạp. Mọi công ty đều cố gắng tận dụng tốt nhất các nguồn lực CNTT của mình một cách hiệu quả nhất có thể trong vòng đời của thiết bị theo ý của mình.