Data science

ทำไมกว่าหนึ่งในสามของโครงการ AI และ Analytics ในระบบคลาวด์จึงล้มเหลว

องค์กรต่างๆ จัดการกับการเปลี่ยนแปลงอย่างรวดเร็วของข้อมูลไปยังระบบคลาวด์อย่างไร อะไรคืออุปสรรคในการทำความสะอาดข้อมูลสำหรับการวิเคราะห์และข้อจำกัดด้านเวลาที่บริษัทต้องเผชิญเมื่อเตรียมข้อมูลสำหรับความคิดริเริ่มด้านการวิเคราะห์, AI และ Machine Learning (ML) ต่อไปนี้คือข้อมูลเชิงลึกบางส่วนจากรายงานล่าสุดของ Trifacta ที่ตอบคำถามเหล่านี้ ข้อมูลได้กลายเป็นองค์ประกอบที่สำคัญในเกือบทุกด้านของธุรกิจมากขึ้นเรื่อยๆ และปริมาณข้อมูลก็พุ่งสูงขึ้นอย่างรวดเร็ว อันที่จริง 80% ของข้อมูลของโลกถูกสร้างขึ้นในช่วงสองปีที่ผ่านมาและคาดว่าภายใน 646 463 ข้อมูลขนาดเอ็กซาไบต์จะถูกสร้างขึ้นทุกวันจากอุปกรณ์สวมใส่ เครือข่ายโซเชียลมีเดีย การสื่อสาร (ธุรกิจและผู้บริโภค) ธุรกรรม และอุปกรณ์ที่เชื่อมต่อ ในขณะที่ปริมาณที่เพิ่มขึ้นและที่สำคัญกว่านั้นคือความหลากหลายของข้อมูลเป็นเครื่องมือในการสนับสนุนอนาคตของปัญญาประดิษฐ์ (AI) และเร่งความเร็วอัตโนมัติของการวิเคราะห์ข้อมูล แต่ก็สร้างอุปสรรคที่องค์กรต่างๆ เผชิญอยู่ในปัจจุบันในการนำ AI ไปใช้ ส่วนใหญ่เชื่อว่ามีศักยภาพที่ดีที่จะได้รับประสิทธิภาพและปรับปรุงการตัดสินใจที่ขับเคลื่อนด้วยข้อมูล แต่เมื่อกรณีการใช้งานของพวกเขาเพิ่มขึ้นอย่างต่อเนื่อง ยังมีช่องว่างอีกมากสำหรับการปรับปรุงเพื่อขจัดอุปสรรคในการนำไปใช้ รายงานล่าสุดโดย Trifacta เปิดเผยว่าความท้าทายเหล่านี้ขัดขวางความสำเร็จโดยรวมของโครงการเหล่านี้และความสามารถในการปรับปรุงประสิทธิภาพเมื่อทำงานกับข้อมูลเพื่อเร่งการตัดสินใจได้อย่างไร นี่คือลักษณะที่ปรากฏ: ความไม่ถูกต้องของข้อมูลกำลังขัดขวางโครงการ AI ลักษณะการเตรียมข้อมูลที่ใช้เวลานานเป็นอันตรายต่อองค์กร: นักวิทยาศาสตร์ข้อมูลใช้เวลามากเกินไปในการเตรียมข้อมูลและไม่มีเวลาเพียงพอในการวิเคราะห์ เกือบครึ่ง (34%) ของผู้ตอบแบบสอบถามรายงานว่าใช้จ่ายเกิน 10 ชั่วโมงเตรียมข้อมูลอย่างเหมาะสมสำหรับการวิเคราะห์และความคิดริเริ่ม AI/ML ในขณะที่คนอื่นใช้จ่ายมากกว่า 40 ชั่วโมงในกระบวนการเตรียมข้อมูลเพียงอย่างเดียวทุกสัปดาห์ แม้ว่าการเตรียมข้อมูลจะเป็นกระบวนการที่ใช้เวลานานและไม่มีประสิทธิภาพ แต่ก็มีความสำคัญอย่างยิ่งต่อความสำเร็จของโครงการวิเคราะห์ทุกโครงการ นัยสำคัญบางประการของความไม่ถูกต้องของข้อมูลเป็นผลมาจากการคำนวณความต้องการผิด (59%) และการกำหนดเป้าหมายไปยังผู้มีแนวโน้มจะเป็นลูกค้าที่ไม่ถูกต้อง (%). การตัดสินใจจากข้อมูลจะดีขึ้นหากองค์กรสามารถรวมชุดข้อมูลที่กว้างขึ้นในการวิเคราะห์ได้ เช่น ข้อมูลบุคคลที่สามที่ไม่มีโครงสร้างจากลูกค้า ข้อมูลกึ่งโครงสร้าง หรือข้อมูลจากฐานข้อมูลเชิงสัมพันธ์ C-Suite Has Taken Notice พูดง่ายๆ ก็คือ ถ้าคุณภาพของข้อมูลไม่ดี การวิเคราะห์และ AI/ML จะไม่มีประโยชน์ ในขณะที่ 51% ของผู้ตอบแบบสำรวจ C-suite ระบุว่าบริษัทของพวกเขามักใช้ประโยชน์จากการวิเคราะห์ข้อมูลเพื่อขับเคลื่อนการตัดสินใจทางธุรกิจในอนาคต 75% ไม่มั่นใจในคุณภาพของข้อมูล คุณภาพของข้อมูลที่ไม่ดีประมาณหนึ่งในสามทำให้โครงการวิเคราะห์และ AI/ML ใช้เวลานานขึ้น (38% ) เสียค่าใช้จ่ายมากขึ้น (33%) หรือล้มเหลวในการบรรลุผลตามที่คาดไว้ (33%). ด้วย 71% ขององค์กรที่อาศัยการวิเคราะห์ข้อมูลเพื่อขับเคลื่อนการตัดสินใจทางธุรกิจในอนาคต ความไร้ประสิทธิภาพเหล่านี้ทำให้ทรัพยากรสิ้นเปลืองและขัดขวางความสามารถในการรวบรวมข้อมูลเชิงลึกที่สำคัญต่อ การเติบโตของธุรกิจโดยรวม การเพิ่มขึ้นของการนำ AI และ ML Push Cloud มาใช้ ประโยชน์ของระบบคลาวด์นั้นยากที่จะประเมินค่าสูงไปโดยเฉพาะอย่างยิ่ง เนื่องจากเกี่ยวข้องกับความสามารถในการปรับขนาดการวิเคราะห์อย่างรวดเร็วและการริเริ่ม AI/ML ซึ่งนำเสนอความท้าทายสำหรับกระบวนการล้างข้อมูลแบบแยกส่วนในปัจจุบัน มีหลายสาเหตุในการโยกย้ายระบบคลาวด์อย่างกว้างขวางโดยมี 51% ของผู้ตอบแบบสอบถามระบุว่าการวิเคราะห์และ AI/ML ทั้งหมดหรือเกือบทั้งหมดของพวกเขากำลังทำงานอยู่ ในระบบคลาวด์ 69% ของผู้ตอบแบบสอบถามรายงานการใช้โครงสร้างพื้นฐานระบบคลาวด์ขององค์กรเพื่อการจัดการข้อมูล และ 51% ของผู้เชี่ยวชาญด้าน IT ที่ใช้ระบบคลาวด์เพื่อจัดเก็บข้อมูลของตนมากขึ้นหรือทั้งหมด — แนวโน้มที่จะเติบโตเท่านั้น ในอีก 2 ปีข้างหน้า 71% ของผู้เชี่ยวชาญด้านไอทีคาดการณ์ว่าข้อมูลทั้งหมดหรือเกือบทั้งหมดจะถูกจัดเก็บไว้ในระบบคลาวด์ “การเติบโตของคลาวด์คอมพิวติ้งเป็นพื้นฐานสำหรับอนาคตของ AI, การวิเคราะห์ และความคิดริเริ่มของแมชชีนเลิร์นนิง น่าเสียดายที่ความเร็วและขนาดที่การเติบโตนี้เกิดขึ้นได้ตอกย้ำถึงความจำเป็นในการเตรียมข้อมูลที่มีการประสานงานกัน เนื่องจากคุณภาพของข้อมูลยังคงเป็นอุปสรรคที่ใหญ่ที่สุดในทุกองค์กรในความพยายามปรับปรุงกระบวนการวิเคราะห์ในระบบคลาวด์ให้ทันสมัย” อดัม วิลสัน ซีอีโอ Trifacta ข้อมูล: องค์กรเพื่อนที่ดีที่สุดและศัตรูที่ใหญ่ที่สุดของ AI ตระหนักได้อย่างรวดเร็วว่าความคิดริเริ่มของ AI นั้นไร้ประโยชน์ และในบางกรณีก็เป็นอันตราย หากไม่มีข้อมูลที่สะอาดในการป้อนอัลกอริทึม บ่อยครั้งที่ความถูกต้องของข้อมูลจะเพิ่มขึ้นหากองค์กรสามารถวิเคราะห์ข้อมูลของบุคคลที่สามจากลูกค้า ข้อมูลกึ่งโครงสร้าง หรือข้อมูลจากฐานข้อมูลเชิงสัมพันธ์ อย่างไรก็ตาม อุปสรรคทั่วไปในการเข้าถึงรวมถึงข้อมูลที่มีอยู่ในระบบต่างๆ (26 %) หรือต้องการการรวมจากแหล่งต่างๆ (27%) หรือความต้องการ การจัดรูปแบบใหม่ (%) แหล่งข้อมูลที่ต้องการ ได้แก่ ข้อมูลลูกค้า (34%) ข้อมูลทางการเงิน (34%) ข้อมูลพนักงาน (26%) และธุรกรรมการขาย (26%). นอกจากนี้ ข้อมูลจากบุคคลที่สามและข้อมูลรองนำเสนอชุดความท้าทายของตนเอง โดยประมาณครึ่งหนึ่งของผู้ตอบแบบสอบถามอ้างถึงการผสมผสานข้อมูล การเคลื่อนย้ายข้อมูล และการล้างข้อมูลเป็นอุปสรรคบ่อยครั้ง ความถูกต้องของข้อมูลเป็นหนทางเดียวที่องค์กรจะส่งต่อองค์กรไม่สามารถพึ่งพาการบูรณาการข้อมูลแบบเดิมที่มีการแบ่งส่วนเพื่อจัดการกับความเร็ว ขนาด และความหลากหลายของข้อมูลในปัจจุบันได้อีกต่อไป การล้างข้อมูลและการเตรียมข้อมูลไม่เพียงพอมักทำให้ความไม่ถูกต้องหลุดลอดผ่านรอยแตกได้ นี่ไม่ใช่ความผิดของนักพัฒนา ETL แต่เป็นอาการของปัญหาที่ใหญ่กว่ามากของการล้างข้อมูลแบบแมนนวลและแบบแบ่งพาร์ติชั่นและการเตรียมข้อมูล จากรายงานของ Harvard Business Review “คุณภาพของข้อมูลที่ไม่ดีคือศัตรูหมายเลขหนึ่งต่อการใช้ Machine Learning ที่ทำกำไรอย่างแพร่หลาย” ชุดข้อมูลที่สะอาดเป็นสิ่งสำคัญสำหรับโปรเจ็กต์ AI และ ML แต่เมื่อแหล่งข้อมูลเพิ่มขึ้น ทั้งในคลาวด์และในองค์กร องค์กรต่างๆ จะต่อสู้กับปัญหาที่เกิดจากความไม่สอดคล้องกันของข้อมูลและความไม่ถูกต้องของข้อมูลได้ยาก เทคโนโลยีการเตรียมข้อมูลที่เป็นนวัตกรรมใหม่สามารถช่วยให้องค์กรปรับปรุงคุณภาพและความถูกต้องของข้อมูลสำหรับโครงการริเริ่ม AI/ML และอื่นๆ ในขณะเดียวกันก็เพิ่มความเร็วและขนาดของความพยายามเหล่านี้ ความกังวลและลำดับความสำคัญของผู้ตอบแบบสำรวจสำหรับอนาคตจะกล่าวถึงว่าโซลูชันใหม่เหล่านี้มีความสำคัญเพียงใด เนื่องจากองค์กรต่างๆ พึ่งพาการวิเคราะห์ข้อมูลเพื่อขับเคลื่อนการตัดสินใจทางธุรกิจมากขึ้น โอกาสในการเปลี่ยนแปลงที่เกิดขึ้นจากการถือกำเนิดของ AI และการประมวลผลแบบคลาวด์จะมีให้เฉพาะในขอบเขตที่องค์กรสามารถทำให้ข้อมูลของตนใช้งานได้ หลังจากการเตรียมและทำความสะอาด ความถูกต้องของข้อมูลจะเพิ่มขึ้นเป็น 80% (โดยสมบูรณ์ = 29% แม่นยำมาก = 51%) การขจัดข้อมูลซ้ำซ้อน (%) การตรวจสอบข้อมูล (21%) และการวิเคราะห์ความสัมพันธ์ระหว่างฟิลด์ (20%) เป็นขั้นตอนที่มีแนวโน้มมากที่สุดในการปรับปรุงความถูกต้องของข้อมูล เมื่อมองไปข้างหน้า เมื่อพิจารณาถึงความไม่ถูกต้องของข้อมูลและคุณภาพของข้อมูล องค์กรจะได้รับประโยชน์จากเครื่องมือการเตรียมข้อมูลที่ทันสมัย ​​เพื่อให้แน่ใจว่าข้อมูลที่สะอาดและมีการจัดเตรียมมาอย่างดีจะพร้อมใช้งานเสมอ เพื่อรองรับระบบธุรกิจอัจฉริยะ การวิเคราะห์ และการริเริ่ม AI/ML ทั่วทั้งองค์กร การล้างข้อมูลอาจเป็นเรื่องยาก แต่โซลูชันไม่จำเป็นต้องเป็นอย่างนั้น เครื่องมือเตรียมข้อมูลแบบบริการตนเองกำลังแก้ปัญหาเหล่านี้ และช่วยให้องค์กรได้รับประโยชน์สูงสุดจากข้อมูลด้วยการล้างข้อมูลอย่างเหมาะสม หมายเหตุ: เนื้อหาของบทความนี้มาจากรายงานเรื่อง “อุปสรรคต่อการนำ AI และการวิเคราะห์มาใช้ในคลาวด์” โดย Trifacta ซึ่งใช้ประโยชน์จากการวิจัยเชิงนวัตกรรมหลายทศวรรษในการปฏิสัมพันธ์ระหว่างมนุษย์กับคอมพิวเตอร์ การจัดการข้อมูลที่ปรับขนาดได้ และการเรียนรู้ของเครื่อง เพื่อทำให้กระบวนการเตรียมข้อมูล เร็วขึ้นและใช้งานง่ายขึ้น Trifacta ดำเนินการศึกษาทั่วโลกของ 646 บุคคลที่เตรียมข้อมูล การสำรวจได้ดำเนินการระหว่างเดือนสิงหาคม , 2019 และ ส.ค. 28 , 2019 ร่วมกับ ResearchScape International

  • บ้าน
  • Business
  • Data science
  • Marketing
  • Leave a Reply

    Your email address will not be published. Required fields are marked *

    Back to top button