Một mắt xích nhỏ lỗi, cả hệ thống hỗn loạn
Sáng sớm 19/7, một bản cập nhật từ hãng an ninh mạng CrowdStrike đã bị lỗi khiến hàng loạt máy tính sử dụng hệ điều hành Windows trên khắp thế giới gặp sự cố.
Tình trạng hỗn loạn tại một sân bay do sự cố CrowdStrike.
CrowdStrike là một trong những hãng an ninh mạng lớn nhất thế giới với sản phẩm chủ chốt là phần mềm chống tin tặc Falcon. Phần mềm này được phép can thiệp đến cấp độ sâu nhất của một hệ thống máy tính để có thể phát hiện và xử lý nguy cơ tấn công trong hạ tầng mạng của doanh nghiệp.
Microsoft tuyên bố khoảng 8,5 triệu máy tính Windows gặp sự cố CrowdStrike. Con số này tương đương với hơn 1% tổng số máy tính chạy Windows của hãng.
Falcon phải liên tục cập nhật các bản vá bảo mật. Sự cố xảy ra khi bản cập nhật đêm 18, sáng 19/7 của họ chứa mã nguồn lỗi khiến các máy tính dùng phần mềm này liên tục khởi động lại.
Đối với ngành hàng không, sự cố này gây ra tình trạng hỗn loạn ở quy mô thường thấy khi gặp điều kiện thời tiết bất thường hoặc thảm họa thiên tai.
Theo trang Wired, sự cố CrowdStrike đã hé lộ một vấn đề trong ngành hàng không. Đó là hệ thống máy tính phức tạp dùng để kiểm soát hành khách check in/out vốn được tối ưu hóa nhằm mục đích để tăng hiệu quả và lợi nhuận, giảm giá vé, một khi bị lỗi sẽ khiến toàn bộ ngành hàng không tê liệt.
Tại Mỹ, vì sự việc trên mà cả ba hãng hàng không lớn nhất của nước này là Delta Air Lines, American Airlines và United Airlines đồng loạt phải hoãn hoặc hủy các chuyến bay trong hàng giờ.
Trên thế giới, tình trạng hoãn, hủy chuyến bay xảy ra rộng khắp và tại các sân bay lớn như: London Gatwick, Heathrow, Manchester và Belfast tại Anh hay Hong Kong, Ấn Độ, Indonesia, Singapore, Hàn Quốc và Thái Lan… Hành khách phải thực hiện thủ tục check-in thủ công và có mặt tại cửa máy bay nhiều giờ trước thời gian cất cánh.
Theo trang web chuyên theo dõi các chuyến bay FlightAware, đến chiều 19/7, có hơn 4.000 chuyến bay bị hủy và 35.5000 chuyến bay bị hoãn trên toàn cầu.
Cổ phiếu của United Airlines và Delta Air Lines đã tuột dốc nhanh chóng và chỉ mới dần phục hồi sau khi sự cố được khắc phục.
Mặt trái của tự động hóa
Đáng nói là Delta Air Lines, American Airlines và United Airlines phải hủy nhiều chuyến bay hơn đa phần hãng hàng không khác như: EasyJet, Allegiant Air và Southwest. Lý do là bởi họ sử dụng mô hình Hub and Spoke (Trục bánh xe và nan hoa).
Hành lý chất đống bên ngoài quầy làm thủ tục lên máy bay ở cửa C sân bay quốc tế Newark sau sự cố CrowdStrike.
Mô hình Hub and Spoke tập trung chủ yếu vào các chuyến bay và phi hành đoàn ở một vài đầu mối chính (trục bánh xe) và những hành khách sử dụng dịch vụ ở những nơi nằm ngoài các đầu mối đó (được ví như các nan hoa) sẽ phải kết nối với các đầu mối chính.
Cách làm này cho phép 3 hãng có thể mang lại nhiều lựa chọn bay cho hành khách. Đồng thời, các hãng hàng không chỉ cần tập trung vào quá trình duy tu, bảo dưỡng máy bay, dịch vụ mặt đất tại những đầu mối chính thay vì dàn trải khắp nơi, giúp tiết kiệm đáng kể chi phí.
Song quá trình này đòi hỏi hãng phải dựa vào tự động hóa rất cao. Một khi máy tính tại bất kỳ một sân bay nào đó bị lỗi, tác động sẽ lan rộng nhanh chóng. Những vụ hủy chuyến bay sẽ chất chồng. Nếu sự cố xảy ra tại sân bay đầu mối chính, tình hình càng nghiêm trọng hơn với toàn bộ hệ thống điều hành.
Tác động dây chuyền
Trên quy mô lớn hơn, sự cố lỗi phần mềm này còn tác động tới hàng loạt dịch vụ mặt đất khác.
Hành khách đợi chuyến bay do sự cố CrowdStrike gây ra tại sân bay quốc tế Newark, Mỹ.
Các sân bay đôi khi được ví như những thành phố thu nhỏ. Bên cạnh đông đảo các hãng hàng không còn có rất nhiều doanh nghiệp khác cũng tham gia vào quá trình vận hành và không ít trong số đó dùng phần mềm của CrowdStrike.
Unifi Aviation là một trong những công ty dịch vụ mặt đất lớn nhất tại Mỹ, có hợp đồng với các hãng hàng không để thực hiện tất cả các dịch vụ vận hành, bao gồm nhân viên mặt đất, lau dọn khoang lái, thu gom hành lý khách hàng.
CEO Unifi Aviation Gautam Thakkar cho biết, hệ thống của họ cũng bị sập vào sáng 19/7 khiến công ty không thể hướng dẫn những người lau dọn buồng lái máy bay phải đi đến đâu, hay có cần chuẩn bị sẵn xe lăn cho hành khách cần khi lên xuống máy bay hay không.
Rất may vào thời điểm sự cố xảy ra, Unifi Aviation không bị tác động nhiều bởi các hãng hàng không mà họ đang hợp tác không có chuyến bay.
Nhận định về mức độ tác động của sự cố CrowdStrike đối với ngành hàng không, người điều phối chương trình Quản lý không lưu tại Đại học hàng không Embry-Riddle, ông Michael McCormick nhận định, thời gian khôi phục có thể kéo dài tới vài ngày, ngay cả khi các doanh nghiệp liên quan đã nâng cấp xong hệ thống máy tính.
Bởi các hãng hàng không bị ảnh hưởng đều có thành viên phi hành đoàn, các phi công, hành lý và máy bay rải rác trên khắp nước Mỹ nên thời gian để thiết lập lại trật tự ban đầu sẽ phải tính bằng nhiều ngày chứ không chỉ vài giờ.
Theo trang web theo dõi chuyến bay FlightRadar24, đến chiều 19/7, tại Bờ Đông nước Mỹ, dù hầu hết các hãng hàng không quốc tế đã bắt đầu khởi động lại nhưng do ảnh hưởng dây chuyền nên vẫn có tới hơn 1/3 số chuyến bay dự định rời khỏi sân bay quốc tế Hartsfield-Jackson ở Atlanta bị hủy. Có tới 60% số chuyến bay khác bị lùi chuyến với thời gian hoãn trung bình là 111 phút.
Bình luận bài viết (0)
Gửi bình luận