Data science

เหตุใดระบบไอทีจึงขัดข้อง – และต้องทำอย่างไรกับปัญหาเหล่านี้

นิ้วอ้วน ไฟฟ้าขัดข้อง และก็อตซิล่ามีอะไรที่เหมือนกัน? คำตอบ: พวกเขาทั้งหมดต้องรับผิดชอบต่อการหยุดทำงานของไอที ​​ซึ่งถึงแม้จะไม่ได้เกิดจาก Godzilla แต่ก็สามารถทำให้เกิดช่องโหว่ด้านงบประมาณขนาดมหึมาสำหรับบริษัทต่างๆ ได้ ขนาดมอนสเตอร์? รายงาน Rand Organisation ระบุว่าตาม 98% ขององค์กร เหตุขัดข้องด้านไอทีทำให้พวกเขาต้องเสียเงินจำนวนมากถึง $100,000 หนึ่งชั่วโมง. จากการศึกษาของมหาวิทยาลัยชิคาโกกล่าวว่าการหยุดทำงานเหล่านี้รับประกันได้ในทางปฏิบัติ ไม่ใช่แค่การสูญเสียโดยตรงเนื่องจากการหยุดทำงานเท่านั้น หากบริษัทไม่สามารถรักษาบริการได้ บริษัทอาจสูญเสียลูกค้าและชื่อเสียงในอุตสาหกรรมก็จะแย่ลง การหยุดทำงานมักเป็นประเด็นร้อนในโซเชียลมีเดีย และข้อความเหล่านั้นมักจะติดอยู่เป็นเวลานาน ด้วยตัวเลขดังกล่าว แน่นอนว่าบริษัทต่างๆ จะต้องเตรียมพร้อมและหลีกเลี่ยงไม่ได้ ดังนั้นบริษัทต่างๆ จึงลงทุนอย่างมากในด้านความซ้ำซ้อนและเทคโนโลยีความพร้อมใช้งานสูง (HA) พวกเขามีความพร้อมใช้งานอย่างต่อเนื่องและสถาปัตยกรรมและระบบความยืดหยุ่นเพื่อให้แน่ใจว่าพวกเขาสามารถกู้คืนบริการโดยเร็วในกรณีที่เกิดไฟดับและให้แน่ใจว่าตรงตามเวลา 100% แม้จะมีการลงทุนเหล่านั้น เรายังคงเห็นการหยุดชะงักครั้งใหญ่ที่ส่งผลกระทบต่อผู้คนนับล้าน โดยกินเวลานานหลายชั่วโมงในแต่ละครั้ง อาจมีคนคิดว่าอย่างน้อยหนึ่งในแผนการลงทุนจำนวนมากเหล่านี้จะได้ผล – ว่าองค์กรแผนความยืดหยุ่นจะช่วยให้พวกเขาแก้ไขปัญหาได้อย่างรวดเร็ว หรือไม่สำเร็จ พวกเขาสามารถกลับมาออนไลน์ได้ทันทีด้วยความซ้ำซาก แผน แต่เราเห็นว่าไม่เป็นเช่นนั้น แม้จะดูเหมือนพร้อม แต่บริษัทต่างๆ ก็ต้องเผชิญกับการหยุดทำงานอย่างต่อเนื่องและเกิดขึ้นซ้ำๆ เห็นได้ชัดว่าแผนงานที่บริษัทดำเนินการนั้นไม่ได้ขึ้นอยู่กับความท้าทายในด้านไอทีที่ทำให้เกิดการหยุดทำงาน นี่คือสาเหตุบางประการ: ความซับซ้อน – สภาพแวดล้อมแบบไฮบริด / มัลติคลาวด์เป็นเรื่องปกติใหม่ สภาพแวดล้อมแบบหลายชั้น ซับซ้อน และไดนามิกที่เกี่ยวข้องกับระบบโลคัลและรีโมตมีการพึ่งพาที่ซับซ้อนและติดตามได้ยาก การค้นหาข้อผิดพลาดที่อาจทำให้เกิดการหยุดทำงานเป็นเรื่องยากมาก เนื่องจากมีหลายจุดที่อาจเกิดความล้มเหลวได้ การเปลี่ยนแปลงอย่างต่อเนื่อง – การปรับปรุงใหม่ ฟีเจอร์ที่เป็นนวัตกรรม ความสามารถ และบริการกำลังเปิดตัวในแบบที่เราไม่เคยเห็นมาก่อน บริษัทจำเป็นต้องรวมบริการใหม่เหล่านี้เข้ากับโครงสร้างพื้นฐานด้านไอทีที่มีอยู่ และการเปลี่ยนแปลงเหล่านั้นจะมีผลกระทบต่อสภาพแวดล้อมไอทีที่มีอยู่เสมอ แทบเป็นไปไม่ได้เลยที่จะทราบล่วงหน้าว่าการเพิ่มเติมใหม่เหล่านี้จะมีผลกระทบอย่างไร ซึ่งนำไปสู่โอกาสที่ไฟดับ ช่องว่างความรู้ – การปรับปรุง คุณลักษณะ และบริการใหม่ๆ เหล่านี้นำมาซึ่งแนวทางปฏิบัติที่ดีที่สุดใหม่ๆ ที่จำเป็นต้องนำมาใช้เพื่อรวมเข้ากับระบบไอทีที่มีอยู่ นอกเหนือจากแนวทางปฏิบัติที่ดีที่สุดและกฎเกณฑ์ที่มีอยู่แล้วซึ่งระบบไอทีอยู่ภายใต้ – และได้รับการอัปเดตอย่างต่อเนื่องเมื่อมีเวอร์ชันใหม่ออกมา โอกาสที่แนวทางปฏิบัติที่ดีที่สุดสำหรับระบบหนึ่งจะไม่ใช่การเริ่มต้นสำหรับอีกระบบหนึ่งจะเพิ่มขึ้นแบบทวีคูณ การควบคุมไม่เพียงพอ – ระบบไอทีได้รับการปรับปรุงอย่างต่อเนื่องและมีการแนะนำระบบใหม่เป็นประจำ นำไปสู่สถานการณ์ที่ทำให้ยากที่จะตามให้ทันการเปลี่ยนแปลงและการนำแนวปฏิบัติที่ดีที่สุดไปใช้อย่างเหมาะสม ตามหลักการแล้ว การเปลี่ยนแปลงใดๆ ควรได้รับการทดสอบก่อนที่จะนำไปใช้ในระบบการทำงาน แต่ความเร็วของการทำงานและความจำเป็นในการติดตามการเปลี่ยนแปลงไม่ได้ให้เวลากับองค์กรเสมอไป ดังนั้น การเปลี่ยนแปลงจะดำเนินการโดยไม่มีการควบคุมที่เพียงพอ – เพิ่มความเสี่ยงที่อาจเกิดข้อผิดพลาด นอกจากนี้ ระบบมักจะได้รับการอัปเดตโดยอัตโนมัติโดยผู้ขาย โดยมีการเปลี่ยนแปลงไฟล์การกำหนดค่า การขึ้นต่อกัน ฯลฯ การเปลี่ยนแปลงเหล่านั้น ซึ่งทีมไอทีมักไม่ทราบด้วยซ้ำจนกว่าจะมีการใช้งาน อาจเป็นสาเหตุของการหยุดทำงาน แม้ว่าอาจปรับปรุงประสิทธิภาพของแต่ละระบบ แต่การเปลี่ยนแปลงเหล่านั้นอาจเป็นสาเหตุของปัญหาโดยรวม สิ่งเหล่านี้มีส่วนทำให้เกิดความเป็นไปได้ที่จะเกิดไฟฟ้าดับ และทำให้ทีมไอทีสร้างแผนความยืดหยุ่นที่มีประสิทธิภาพได้ยาก และถึงแม้จะใช้แผนสำรอง แต่ก็ไม่ได้แก้ไขสาเหตุของการหยุดทำงานตั้งแต่แรก ซึ่งหากไม่จัดการก็มีแนวโน้มที่จะเกิดขึ้นซ้ำอีก และด้วยความท้าทายที่น่ากลัวที่ทีมไอทีต้องเผชิญ โอกาสนั้นจึงสูงมาก มีวิธีใดในการลดโอกาสนั้นหรือไม่? สิ่งแรกที่ทีมไอทีต้องทำคือตระหนักว่าการติดตามการเปลี่ยนแปลงการกำหนดค่าทั้งหมดและจุดที่อาจเกิดความล้มเหลวนั้นเป็นไปไม่ได้ มีข้อมูลมากเกินไปที่จะติดตาม จุดข้อมูลมากเกินไปที่จะจัดการและเปลี่ยนแปลงอยู่เสมอ คำแนะนำที่เหมาะสมที่สุดในการจัดการกับสิ่งนี้คือการตรวจสอบการกำหนดค่า การตั้งค่า และการพึ่งพา IT เหล่านั้น และตรวจสอบให้แน่ใจว่าได้รับการตั้งค่าตามแนวทางปฏิบัติที่ดีที่สุดสำหรับความยืดหยุ่นของผู้จำหน่าย การเปลี่ยนแปลงในแผนผังการกำหนดค่าอาจบ่งชี้ว่ามีปัญหาอยู่ระหว่างการดำเนินการ ดังนั้นการแจ้งเตือนที่ออกหลังจากการเปลี่ยนแปลงอาจทำให้ทีมไอทีสามารถเข้าไปแทรกแซงเพื่อป้องกันปัญหาใหญ่ได้ทันเวลา ด้วยระบบไอทีที่ซับซ้อนซึ่งบริษัทต่างๆ ใช้งานอยู่ในปัจจุบัน ความเสี่ยงจากการหยุดทำงานจึงสูงมาก และค่าใช้จ่ายก็มหาศาล บริษัทต่างๆ จำเป็นต้องทำทุกอย่างที่ทำได้เพื่อหลีกเลี่ยงการหยุดทำงาน และตรวจสอบให้แน่ใจว่าพวกเขาไม่ต้องเสียค่าใช้จ่ายเหล่านั้น

  • บ้าน
  • Business
  • Data science
  • Marketing
  • Leave a Reply

    Your email address will not be published. Required fields are marked *

    Back to top button