Giriş
Görevli olduğunuz platformu veya hizmeti 360 derece alan hakimiyeti mottosuyla izliyorsunuz varsayalım. Bu yapı için, platform metriklerini, günlüklerini, uygulama performans metriklerini çeşitli araçlar aracılığıyla topladığınızdan eminim ve buradan alarmlar çıkarıyorsunuz. Şimdi gelen alarmların yönetim sürecine geçelim. . .
Alarm Yönetimi
Alarmları gönderdiğiniz iletişim kanalları genellikle çok gürültülü olabilir. Başka bir deyişle, çok fazla gereksiz alarm çıkartırsanız, bir süre sonra bu sizin için körlük yaratacak ve muhtemelen aralarında meydana gelen gerçek bir problemi atlayacaksınız. Öncelikle, bu alanı doğru eşik değerleriyle ayarlamanız gerekiyor. Bu süreç aynı zamanda biraz disiplin bağımlıdır. Eğer bir şekilde çağrılmıyorsanız (Noc hizmetleri veya çağrı araçlarıyla), muhtemelen bu alanı ayarlamak önceliğiniz olmayacaktır. Bu nedenle, ilk tavsiyem, alarmları aldığınızda çağrılma yöntemine sahip olmak ve ardından bu alarm gerçekten gelmeli mi? Yanlış pozitif mi? Eşik doğru mu? gibi sorular sorarak bu alanı ayarlamaktır. Diğer tavsiyem ise, eğer scrum, kanban gibi bir süreciniz varsa, bir geri bildirim listesi oluşturmak ve bu işi parçalara ayırmaktır.
Çağrı Yönetimi
Alarm yönetim sürecini çözmüşsünüz. Bir sonraki adım doğru yükseltme politikalarını oluşturmak ve bir çağrı yapısına karar vermek olacaktır. Öncelikle, yükseltme seviyelerini belirlemeniz gerekir. Seviye 1 ne yapar? Ne kadarını çözüme kavuşturabilir? Aynı şekilde Seviye 2, Seviye 3 ve Seviye 4 için de. Ayrıca, bir alarmın yanıtlanmamış kalabileceği süreyi ve hangi durumdayken bir sonraki seviyeye yükseltileceği ile ilgili kurallar koymanız gerekir. Yükseltme kurallarınızı belirledikten sonra, çağrı listesini oluşturmaya geçelim. Bunun için çeşitli algoritmalar mevcuttur. En popüler olanı Panama vardiyasıdır (bkz. https://en.wikipedia.org/wiki/Shift_plan)..) Genel olarak, çağrıda bulunan mühendisimizin bu görevde zamanının en fazla %25'ini harcamasını isteriz. Eğer günde iki vardiya dönerse, bu değerleri sekiz kişilik bir çağrı ekibiyle elde edebilirsiniz. Buradaki önemli nokta, görevde olan kişinin ulaşılabilir olması ve bilgisayarının yanında olmasıdır. Bilgisayar başında 24/7 olmanın gerekli olduğunu düşünmüyorum. Bir problem durumunda, zaten çağrı yönetim yapıları aracılığıyla telefonla bilgilendirilirsiniz. Zamanınızı %25 oranında da en verimli şekilde kullanabilirsiniz.

Panama Vardiyası
Sonuç
Makalenin başında söylediğim gibi, çağrı yönetimi platformlarınızın ve hizmetlerinizin yüksek erişilebilirliğini sürdürmekte büyük bir öneme sahiptir. Yukarıda bahsettiğim yaklaşımı operasyon ekipleriniz için bir rehber olarak görebilir ve sürdürülebilir ve yönetilebilir bir yapı oluşturmak için modelinize uyarlayabilirsiniz.