Data science

เหตุใดจึงถึงเวลาที่จะโอบกอด Data Lakes

ในคุณสมบัติพิเศษของแขกนี้ Craig Kelly รองประธานฝ่าย Analytics ที่ Syntax อภิปรายว่า data Lake สามารถช่วยให้บริษัทต่างๆ วิเคราะห์และใช้กองข้อมูลที่จัดเก็บอยู่แล้วได้ดียิ่งขึ้นได้อย่างไร Craig เป็นหัวหน้าบริการระดับมืออาชีพและการจัดการเกี่ยวกับการวิเคราะห์และการพัฒนาผลิตภัณฑ์และแอปพลิเคชันสำหรับแนวปฏิบัติด้านการวิเคราะห์ ก่อนที่จะทำงานที่ Syntax Craig เป็นผู้ร่วมก่อตั้ง EmeraldCube Solutions เขาอยู่ในพื้นที่การวิเคราะห์ในช่วงหลายปีที่ผ่านมา 20 โดยทำงานร่วมกับ IBM Cognos, Oracle BI, เครื่องมือ GoodData เพื่อสร้างโซลูชันสำหรับลูกค้า ERP Craig และทีมของเขามุ่งเน้นไปที่การวิเคราะห์ของ AWS เป็นหลัก โดยผสานรวมคลังข้อมูลแบบดั้งเดิมและ BI เข้ากับ ML ที่มองไปข้างหน้าและความสามารถในการคาดการณ์ ปีที่แล้ว เกือบครึ่งของผู้นำด้านไอที (42%) ลดความสำคัญของการวิเคราะห์ข้อมูลและความคิดริเริ่มทางธุรกิจ (BI) เนื่องจากการจัดลำดับความสำคัญที่เปลี่ยนไป ตอนนี้ธุรกิจต่างๆ ได้ปรับตัวแล้ว การวิเคราะห์ข้อมูลและ BI กำลังกลับมาอยู่ในอันดับต้นๆ ของรายการลำดับความสำคัญ 60% ของธุรกิจวางแผนที่จะลงทุนในการวิเคราะห์ข้อมูลและเทคโนโลยีธุรกิจอัจฉริยะในปีนี้ เนื่องจากบริษัทต่าง ๆ พยายามที่จะขับเคลื่อนด้วยข้อมูลมากขึ้น พวกเขาจึงต้องมีกลยุทธ์ตั้งแต่เริ่มต้น หากองค์กรของคุณไม่ตั้งใจเกี่ยวกับวิธีการจัดเก็บและวิเคราะห์ข้อมูล คุณจะไม่สร้างข้อมูลเชิงลึกที่ช่วยให้คุณทำผลงานได้ดีกว่าคู่แข่ง เทคโนโลยี Data Lake ช่วยให้องค์กรล้ำสมัยสามารถควบคุมและสร้างมูลค่าจากข้อมูลของตนได้ ข้อมูลมีการเติบโต แต่ไม่ได้หมายความว่าข้อมูลเชิงลึกที่ผู้นำด้านไอทีทุกคนรู้ว่าข้อมูลที่เราผลิตและรวบรวมมีการเติบโตแบบทวีคูณ โดย 2025 เกือบ 60% ของข้อมูลจะถูกสร้างและจัดการโดยองค์กร — เพิ่มเป็นสองเท่าของจำนวนที่สร้างจาก 2015. ปัจจุบันบริษัททั่วไปจัดการ 33 แหล่งข้อมูลที่ไม่ซ้ำ ปริมาณข้อมูลและแหล่งข้อมูลทำให้บริษัทไม่ต้องพึ่งพาการจัดเก็บและการวิเคราะห์ที่ขับเคลื่อนด้วยสเปรดชีตอีกต่อไป สเปรดชีตมีการตรวจสอบข้อมูลของคุณแบบจำกัดและดูย้อนหลังได้ มีแนวโน้มที่จะมีความไม่ถูกต้อง และใช้เวลานานในการบำรุงรักษา ทุกธุรกิจอ้างว่าพวกเขาต้องการขับเคลื่อนด้วยข้อมูล แต่เนื่องจากความยุ่งยากที่รับรู้ได้ หลายธุรกิจจึงล้มเหลวในการไปไกลกว่าการรวบรวมและการจัดเก็บ ระหว่าง 60% และ 73% ของข้อมูลทั้งหมดในองค์กรจะไม่ถูกวิเคราะห์ จะมัวเสียเวลาและเก็บเงินไปทำไมในเมื่อจะไม่ใช้มันล่ะ? ข้อมูลที่ไม่ถูกแตะต้องถือเป็นโอกาสที่พลาดไปในการขับเคลื่อนผลกำไร ประสิทธิภาพการดำเนินงาน และการเปลี่ยนแปลงทางธุรกิจ ด้วยข้อมูลที่มาจากแหล่งที่แตกต่างกันมากกว่าที่เคย องค์กรต่างๆ ต้องการวิธีที่ชาญฉลาดกว่าและมีประสิทธิภาพมากขึ้นในการจัดการข้อมูลที่รวบรวม 4 วิธีที่ Data Lake สามารถช่วยให้คุณกลายเป็นผู้นำด้านไอทีที่ขับเคลื่อนด้วยข้อมูลมากขึ้น ควรพิจารณา Data Lake เป็นโซลูชันที่เป็นไปได้สำหรับทั้งการจัดการและวิเคราะห์ข้อมูล Data Lake คือพื้นที่จัดเก็บข้อมูลบนคลาวด์แบบรวมศูนย์ที่สามารถเก็บข้อมูลดิบจำนวนมากในรูปแบบดั้งเดิมและจากหลายแหล่ง อเบอร์ดีนพบว่าองค์กรที่มีแนวทางปฏิบัติด้าน data lake ที่เหนือกว่านั้นมีรายได้เพิ่มขึ้น 9% ประโยชน์ของ Data Lake ได้แก่ 1. ที่เก็บแบบรวมศูนย์: การวิเคราะห์ข้อมูลจากแหล่งข้อมูลเพียงไม่กี่แหล่งจะจำกัดข้อมูลเชิงลึกที่คุณสามารถพัฒนาได้ บริษัทโดยเฉลี่ยเติบโตแหล่งข้อมูลโดย 20% ในแต่ละปี และธุรกิจที่มีการแข่งขันสูงที่สุดกำลังใช้ข้อมูลจำนวนมากนี้ให้เกิดประโยชน์ Data Lake รวบรวมข้อมูลจากแหล่งต่างๆ ทั่วทั้งธุรกิจ เช่น ERP, CRM, ระบบ HR หรืออุปกรณ์ IoT ไม่ว่าจะจัดเก็บไว้ในระบบคลาวด์หรือในองค์กรก็ตาม การรวมศูนย์ข้อมูลช่วยเพิ่มความถูกต้องของข้อมูล ลดไซโลข้อมูล และขจัดการป้อนข้อมูลด้วยตนเอง ทำให้ทีมของคุณใช้เวลามากขึ้นกับกิจกรรมเพิ่มมูลค่า เช่น การวิเคราะห์ 2. การเข้าถึงที่สะดวก: ประโยชน์ที่น่าสนใจที่สุดประการหนึ่งของ Data Lake คือความสามารถในการช่วยให้ผู้ใช้วิเคราะห์ข้อมูลจำนวนมากได้อย่างรวดเร็วและสะดวก ธุรกิจที่มีแนวทางปฏิบัติใน Data Lake ชั้นนำมีแนวโน้มที่จะรายงานกระบวนการออกสู่ตลาดที่ “แข็งแกร่ง” หรือ “มีประสิทธิภาพสูง” ถึงสามเท่า เนื่องจากข้อมูลถูกจัดเก็บในรูปแบบดั้งเดิม การเตรียมข้อมูล การดึงข้อมูล และการวิเคราะห์จึงสร้างภาระให้กับ Data Lake น้อยกว่ามาก มีความจำเป็นเพียงเล็กน้อยในการเตรียมข้อมูล ซึ่งต่างจากสเปรดชีตหรือคลังข้อมูลซึ่งข้อมูลที่ป้อนต้องมีมาตรฐาน การดึงข้อมูลไม่ต้องการพารามิเตอร์ที่กำหนดไว้ล่วงหน้าสำหรับการค้นหา ทำให้เข้าถึงและดึงข้อมูลได้ง่ายขึ้น 3. คุ้มค่า: ตรงกันข้ามกับคลังข้อมูลซึ่งจัดเก็บข้อมูลในลักษณะลำดับชั้นผ่านไฟล์หรือโฟลเดอร์ Data Lake ใช้สถาปัตยกรรมแบบเรียบ องค์กรต่างๆ สามารถปรับขนาดพื้นที่จัดเก็บข้อมูลได้เมื่อเติบโตขึ้น ซึ่งคุ้มค่ากว่าและง่ายต่อการใช้งาน ซึ่งหมายความว่าไม่ต้องใช้เงินลงทุนจำนวนมากและไม่ต้องรอนานหลายเดือนสำหรับการพัฒนา การเพิ่มเทคโนโลยี Data Lake ให้กับระบบนิเวศของคุณยังช่วยปรับปรุงการทำงานของระบบเดิมที่มีอยู่ด้วยการลดความจุ สิ่งนี้น่าสนใจเป็นพิเศษสำหรับองค์กรขนาดใหญ่และเป็นที่ยอมรับมากกว่าที่เคยลงทุนอย่างมีนัยสำคัญในคลังข้อมูลและเทคโนโลยีเมนเฟรม 4. ความสามารถที่ทันสมัย: Data Lake ช่วยให้องค์กรต่างๆ ใช้เทคนิคการวิเคราะห์ขั้นสูงและซับซ้อนยิ่งขึ้น องค์กรสามารถใช้แมชชีนเลิร์นนิงและ AI เพื่อล้างและเพิ่มข้อมูลที่เข้ามา เรียกใช้อัลกอริธึมที่ซับซ้อนเพื่อเชื่อมโยงแหล่งข้อมูลต่างๆ หรือใช้การวิเคราะห์เชิงคาดการณ์ ข้อมูลเชิงลึกจะมีความเป็นผู้ใหญ่มากขึ้น โดยให้คุณค่าแก่องค์กรของคุณมากยิ่งขึ้นเมื่อเวลาผ่านไป แต่พึงระวังว่าหากไม่มีการกำกับดูแลและกระบวนการที่เหมาะสม Data Lake ก็มีโอกาสที่จะกลายเป็น Data Swamp หากปล่อยไว้โดยไม่มีการจัดการ Data Lake อาจเสื่อมลงจนถึงจุดที่ผู้ใช้ปลายทางไม่สามารถเข้าถึงได้ ทำงานร่วมกับที่ปรึกษาที่เชื่อถือได้เพื่อให้แน่ใจว่ามีการกำหนดระเบียบการและความรับผิดชอบที่ชัดเจนตั้งแต่ต้น ส่งเสริมการตัดสินใจและการเติบโตที่ดีขึ้น ในขณะที่ธุรกิจต่างๆ กำลังสร้างข้อมูลดิจิทัลที่สมบูรณ์ยิ่งขึ้นกว่าที่เคย เพียงแค่มีข้อมูลไม่เท่ากับการเติบโต องค์กรจำเป็นต้องใช้ประโยชน์จากความก้าวหน้าในการประมวลผลแบบคลาวด์เพื่ออำนวยความสะดวกในการจัดเก็บและวิเคราะห์ข้อมูลที่มีประสิทธิภาพและซับซ้อนมากขึ้น Data Lake ช่วยให้องค์กรสามารถเก็บรวบรวมข้อมูลจากแหล่งต่างๆ ได้มากขึ้น ในเวลาน้อยลง โดยมีค่าใช้จ่ายเพียงเล็กน้อย ด้วยการใช้งานที่เหมาะสม ระบบจัดเก็บข้อมูลเหล่านี้สามารถให้ผลการวิเคราะห์ธุรกิจที่แข็งแกร่งขึ้นและการตัดสินใจที่รวดเร็วขึ้น ทำให้องค์กรของคุณสามารถขับเคลื่อนด้วยข้อมูลได้อย่างแท้จริง ลงทะเบียนเพื่อรับจดหมายข่าว InsideBIGDATA ฟรี เข้าร่วมกับเราบน Twitter: @InsideBigData1 – https://twitter.com/InsideBigData1

  • บ้าน
  • Business
  • Data science
  • Marketing
  • Leave a Reply

    Your email address will not be published. Required fields are marked *

    Back to top button