Data science

การลงทุนด้านการจัดการข้อมูลมักจะสะดุด การสำรวจพบว่า

การลงทุนจำนวนมากในแพลตฟอร์มการจัดการข้อมูลจนถึงขณะนี้ยังไม่ได้ใช้เงินอย่างคุ้มค่า ตามรายงาน Data Value Scorecard ที่เผยแพร่ในวันนี้โดย Dremio แพลตฟอร์ม Data Lake ตารางสรุปสถิติพบเพียง 22% ของผู้นำข้อมูลที่สำรวจกล่าวว่าพวกเขาได้ตระหนักถึงผลตอบแทนจากการลงทุน (ROI) ในการจัดการข้อมูลอย่างเต็มที่ในช่วงสองปีที่ผ่านมา . ผู้ตอบแบบสอบถามกว่าครึ่ง (22) ยอมรับว่าอาจมีปัญหามากขึ้น ยอมรับว่าในการจัดการข้อมูล พวกเขาไม่มีทางวัด ROI อย่างสม่ำเสมอได้อย่างแท้จริง ตารางสรุปสถิติอ้างอิงจากการสำรวจ 500 ผู้นำด้านข้อมูลและการวิเคราะห์ที่องค์กรไอทีระดับองค์กรในสหรัฐอเมริกา สหราชอาณาจักร เยอรมนี เดนมาร์ก สวีเดน นอร์เวย์ ออสเตรเลีย ฮ่องกง และสิงคโปร์ การเข้าถึงข้อมูล การสำรวจซึ่งดำเนินการร่วมกับ Wakefield Research ระบุว่าผู้ตอบแบบสอบถามมากกว่าสามในสี่ (76%) ถูกล็อกอยู่ในระบบปิดอย่างน้อยหนึ่งระบบ Billy Bosworth ซีอีโอของ Dremio ตั้งข้อสังเกตว่า แพลตฟอร์มที่เป็นกรรมสิทธิ์เหล่านี้ทำให้นักวิเคราะห์เข้าถึงข้อมูลที่เกี่ยวข้องทั้งหมดที่ต้องการได้ยากในเวลาที่เหมาะสม ร้อยละแปดสิบสี่ของผู้นำข้อมูลที่ทำการสำรวจกล่าวว่าเป็นเรื่องปกติที่นักวิเคราะห์ข้อมูลในบริษัทจะทำงานกับชุดข้อมูลบางส่วน มีเพียง 10% เท่านั้นที่กล่าวว่าพวกเขาคาดหวังให้แพลตฟอร์มการจัดการข้อมูลที่พวกเขาใช้เพื่อทำให้ข้อมูลใหม่พร้อมใช้งานในเวลาไม่กี่ชั่วโมงหรือหลายนาที มากกว่าครึ่ง (22%) กล่าวว่าองค์กรต้องใช้เวลาหลายสัปดาห์ในการอัปเดตข้อมูลที่จัดเก็บไว้ในแพลตฟอร์มปัจจุบัน ปัญหานี้เป็นปัญหาอย่างยิ่งเนื่องจากกระบวนการทางธุรกิจดิจิทัลส่วนใหญ่จำเป็นต้องเกิดขึ้นในเวลาที่เกือบจะเรียลไทม์ บอสเวิร์ธกล่าวเสริม ทั้งหมด 79% ของผู้ตอบแบบสอบถามยังตั้งข้อสังเกตว่าพวกเขามีความกังวลเกี่ยวกับระดับของขนาดที่สามารถทำได้โดยใช้แพลตฟอร์มปัจจุบันของพวกเขา ปัญหาการจัดการข้อมูล สุดท้าย แบบสำรวจทำให้เห็นชัดเจนว่าองค์กรต่างๆ กำลังดิ้นรนกับการจัดการข้อมูล ผู้ตอบแบบสำรวจโดยเฉลี่ยกล่าวว่าพวกเขาทำสำเนาข้อมูล เพื่อให้แน่ใจว่ามีให้สำหรับผู้ใช้ทุกคน ทั้งหมด 51% รายงานว่าบริษัทของตนมีมากกว่า สำเนาของข้อมูลดังกล่าว % เต็ม 82 กล่าวว่าผู้ใช้ปลายทางใช้ชุดข้อมูลเดียวกันในเวอร์ชันที่ไม่สอดคล้องกันในเวลาเดียวกัน เนื่องจากกระบวนการแปลงและโหลด (ETL) การแยกไฟล์ที่ยุ่งยากซึ่งจำเป็นในการย้ายข้อมูลเข้า แพลตฟอร์มการจัดการข้อมูล โดยรวม ตารางสรุปสถิติแนะนำเฉพาะเกี่ยวกับ 20% ขององค์กรที่จัดการข้อมูลได้สำเร็จด้วย 28% ของผู้ตอบแบบสอบถามอ้างว่า “ง่ายมาก” สำหรับผู้ใช้ปลายทางในการเข้าถึงข้อมูลและพัฒนาข้อมูลเชิงลึก มีเพียง 20% เท่านั้นที่กล่าวว่าไทม์ไลน์สำหรับโครงการ ETL นั้น “น้อยครั้งหรือไม่เคยเลย” ที่ประเมินต่ำไป ในขณะที่เปอร์เซ็นต์ที่เท่ากันกล่าวว่าบริษัทของพวกเขามีข้อจำกัด “เพียงเล็กน้อยหรือไม่มีเลย” ในการเข้าถึงข้อมูลเพื่อการกำกับดูแล ความจริงที่ว่าหลายองค์กรจัดการข้อมูลได้ไม่ดีเป็นหนึ่งในความลับเล็กๆ น้อยๆ ที่ผู้นำไอทีขององค์กรไม่ต้องการรับทราบ ข้อมูลส่วนใหญ่สร้างขึ้นในบริบทของแอปพลิเคชันที่ใช้ในสายธุรกิจ ข้อมูลที่สร้างโดยแต่ละแอปพลิเคชันเหล่านั้นมักขัดแย้งและไม่สอดคล้องกัน ปัญหานี้กำลังมาถึงแล้ว เนื่องจากความคิดริเริ่มในการเปลี่ยนแปลงธุรกิจดิจิทัลที่อาศัยการวิเคราะห์และปัญญาประดิษฐ์ (AI) จำเป็นต้องเข้าถึงข้อมูลที่เชื่อถือได้เพื่อทำให้กระบวนการเป็นอัตโนมัติได้อย่างแม่นยำ การล้างข้อมูลให้ยุ่งเหยิงนั้นสร้างโอกาสให้ทีมไอทีแบบรวมศูนย์มีความเกี่ยวข้องมากขึ้น ไม่มีกลุ่มธุรกิจใดที่สามารถรวบรวมข้อมูลทั้งหมดที่จำเป็นในการขับเคลื่อนกระบวนการดิจิทัลด้วยตัวเองได้ Bosworth กล่าว “องค์กรส่วนใหญ่ได้ตระหนักถึงเรื่องนี้แล้ว” เขากล่าว การจัดเก็บข้อมูล Dremio กำลังสร้างกรณีสำหรับการแทนที่คลังข้อมูลที่ทำงานในองค์กรหรือในระบบคลาวด์ด้วย Data Lake ที่ใช้ประโยชน์จากที่เก็บข้อมูลบนคลาวด์ราคาไม่แพง เพื่อทำให้ข้อมูลจำนวนเพตะไบต์พร้อมใช้งานผ่านการสืบค้น SQL Bosworth โต้แย้งว่าเมื่อมีการจัดเก็บข้อมูลในระบบคลาวด์มากขึ้น องค์กรไอทีจำเป็นต้องจัดการข้อมูลโดยไม่ขึ้นกับทั้งแอปพลิเคชันที่ใช้ในการสร้างและโครงสร้างพื้นฐานที่ใช้ในการจัดเก็บ การบรรลุเป้าหมายนั้นจะง่ายขึ้นเมื่อมีการจัดเก็บข้อมูล ตัวอย่างเช่น ในบริการจัดเก็บข้อมูลบนคลาวด์แบบเปิดที่ช่วยให้องค์กรด้านไอทีสามารถใช้ประโยชน์จากแพลตฟอร์มดาต้าเลคที่มีการจัดการจากส่วนกลางเพื่อระบุและจัดการข้อมูลในลักษณะที่สอดคล้องกันมากขึ้น Bosworth กล่าว การใช้ data lake เป็นทางเลือกแทนคลังข้อมูลไม่ใช่แนวคิดใหม่ หลายองค์กรพยายามสร้าง Data Lake โดยใช้แพลตฟอร์ม Hadoop แบบโอเพนซอร์ส แต่ความพยายามเหล่านั้นมักส่งผลให้เกิดการสร้างแหล่งข้อมูล เพียงเพราะองค์กรขาดเครื่องมือและกระบวนการในการจัดการข้อมูลจำนวนเทราไบต์อย่างมีประสิทธิภาพ ด้วยเหตุนี้ หลายองค์กรในปัจจุบันจึงมักไม่เต็มใจที่จะเปิดตัวโครงการ Data Lake แบบอื่น ในแง่ของการจัดการข้อมูลโดยรวม ไม่มีองค์กรไอทีระดับองค์กรสองแห่งที่เหมือนกัน อย่างไรก็ตาม มีความชัดเจนมากขึ้นว่าความสามารถขององค์กรใดๆ ในการแข่งขันในโลกที่ขึ้นอยู่กับกระบวนการทางดิจิทัล จะขึ้นอยู่กับว่าพวกเขาจัดการข้อมูลที่ขับเคลื่อนกระบวนการเหล่านั้นได้ดีเพียงใด บทความนี้เผยแพร่ครั้งแรกที่ VentureBeat และทำซ้ำโดยได้รับอนุญาต

  • บ้าน
  • Business
  • Data science
  • Marketing
  • Leave a Reply

    Your email address will not be published. Required fields are marked *

    Back to top button