Data science

พื้นฐานของการจำลองเสมือนของข้อมูล

เทคโนโลยีข้อมูลที่เป็นนวัตกรรมใหม่ที่เรียกว่า “data virtualization” (DV) ถูกนำมาใช้เพื่อจัดการกับข้อมูลปริมาณมากจากแหล่งต่างๆ การจำลองเสมือนข้อมูลใช้กันอย่างแพร่หลายในการวางแผนทรัพยากรองค์กร (ERP) การจัดการลูกค้าสัมพันธ์ (CRM) และระบบอัตโนมัติของฝ่ายขาย (SFA) เพื่อรวบรวมและรวบรวมข้อมูลจากหลายแหล่ง ตั้งแต่การเก็บข้อมูลจากหลายแหล่งไปจนถึงการวิเคราะห์ขั้นสูง เทคโนโลยีนี้ดูเหมือนจะนำเสนอโซลูชันแบบครบวงจร ประโยชน์ที่ใหญ่ที่สุดของ DV ตามที่เห็นโดยธุรกิจในปัจจุบันคือการมีอยู่ของเลเยอร์เพิ่มเติมนี้บนคลังข้อมูลแบบเดิมเพื่อการเข้าถึงข้อมูลที่รวดเร็วและเชื่อถือได้ ข้อมูลเบื้องต้นเกี่ยวกับการจำลองเสมือนของข้อมูลใน Data Virtualization คืออะไร “data virtualization” ได้รับการอธิบายว่าเป็นคู่มือทีวีซึ่งรวมถึงเนื้อหาของช่องต่างๆ มากมายในที่เดียว พูดง่ายๆ ก็คือ DV ช่วยให้สามารถจัดวางเลเยอร์เพิ่มเติมของการเข้าถึงข้อมูลระหว่างแหล่งที่มาของข้อมูลกับผู้ใช้เพื่อการเข้าถึงที่รวดเร็วยิ่งขึ้น ตัวอย่างของ DV ได้แก่ “คลังข้อมูลเสมือน” และ “คลังข้อมูลเสมือน” ในขั้นต้นมองว่าเป็นวิธีแก้ปัญหาสำหรับ ETL เทคโนโลยีนี้ให้การเข้าถึงข้อมูลที่รวดเร็ว การรวมข้อมูล การล้างข้อมูล และเครื่องมือวิเคราะห์สำหรับผู้ใช้ BI DV ช่วยให้เทคโนโลยีที่จัดตั้งขึ้น เช่น คลาวด์ บิ๊กดาต้า และแพลตฟอร์มการวิเคราะห์ขั้นสูงสามารถทำงานควบคู่กันเพื่อผลิตโซลูชันการจัดการข้อมูลที่เหนือกว่า ซึ่งคลังข้อมูลแบบเดิมไม่สามารถทำได้ การจัดการข้อมูลในยุคของการจำลองข้อมูลเสมือนผ่านแพลตฟอร์ม data virtualization ผู้ขายนำเสนอโซลูชั่นแบบครบวงจรสำหรับการรวบรวมข้อมูล การจัดการ และการส่งมอบบริการข้อมูล จุดแข็งที่สำคัญของ DV ตามที่ระบุไว้ในบล็อกโพสต์ Wipro คือความน่าเชื่อถือและความปลอดภัยของข้อมูลแบบเรียลไทม์อย่างสมบูรณ์ ประโยชน์เดียวนี้ช่วยให้ได้รับผลตอบแทนมหาศาลในรูปแบบของตลาด DV ที่ขยายตัวอย่างรวดเร็ว ในขณะที่ ETL ยังคงให้การเคลื่อนย้ายข้อมูลในปริมาณมาก DV สัญญาว่าจะเข้าถึงข้อมูลได้เร็วมาก ปัจจุบัน แนวโน้มการใช้งานแสดงให้เห็นว่าธุรกิจต่างๆ ใช้ทั้ง DV และ ETL พร้อมกัน ดังนั้น ประโยชน์ที่เห็นได้ชัดที่สุดของการจัดการข้อมูลองค์กรด้วย DV คืออะไร การเข้าถึงที่รวดเร็วในการรักษาความปลอดภัยข้อมูล การลดการจำลองข้อมูลการนำกลับมาใช้ใหม่ของบริการข้อมูลแบบรวมศูนย์ Data Virtualization สำหรับ Big Data Gartner คาดการณ์ว่าผ่าน 2020 60 เปอร์เซ็นต์ของทั้งหมด โครงการข้อมูลขนาดใหญ่จะล้มเหลว การจำลองเสมือนของข้อมูลในขณะที่ไม่สามารถแก้ปัญหาที่เกี่ยวข้องกับข้อมูลขนาดใหญ่ได้ทั้งหมด สามารถทำให้กระบวนการง่ายขึ้นอย่างมากและทำให้โครงการข้อมูลขนาดใหญ่จัดการได้ง่ายขึ้น สำหรับผู้เริ่มต้น เทคโนโลยีนี้สามารถทำให้ข้อมูลขนาดใหญ่พร้อมใช้งานและพร้อมใช้งานบนแพลตฟอร์ม BI หนึ่งในความท้าทายหลักของข้อมูลขนาดใหญ่คือ “ปริมาณ ความหลากหลาย และความเร็ว” ของข้อมูลที่อยู่ในคลังข้อมูลแบบเดิม คลังข้อมูลเชิงตรรกะคือโซลูชันการเก็บข้อมูลและการจัดระเบียบข้อมูลทั่วทั้งองค์กร โดยที่ข้อมูลจะอยู่ในรูปแบบที่มีโครงสร้าง ไม่มีโครงสร้าง แบทช์ หรือแบบเรียลไทม์ การจำลองเสมือนของข้อมูลสามารถลดการรวมข้อมูลได้อย่างมากในขณะที่รักษาประสิทธิภาพไว้ จุดรวมเบื้องหลังการใช้สถาปัตยกรรมการจำลองเสมือนข้อมูลดังกล่าวทำให้สามารถจัดเก็บ “ข้อมูลสด” ในคลังสินค้าและข้อมูลที่ตายแล้วในที่เก็บประเภท Cloudera จากนั้นรวมข้อมูลหลายแหล่งผ่านคลังข้อมูลเชิงตรรกะ Data Virtualization vs. Copy Data Virtualization อธิบายว่าแม้ว่าผู้ใช้มักจะสับสนสองแนวคิดที่แตกต่างกัน แต่ก็มีความแตกต่างที่ชัดเจนระหว่างพวกเขา ข้อมูลจำเป็นต้องเข้าถึงได้เร็วกว่าที่เป็นได้ในการวิเคราะห์ขั้นสูงหรือแพลตฟอร์ม BI ดังนั้นจึงหวังว่า DV จะถูกนำไปใช้มากขึ้นสำหรับการรวมข้อมูลแบบหลายแหล่งทั่วทั้งองค์กร และ “มุมมองข้อมูลแบบรวมศูนย์” จะช่วยให้ผู้ใช้ได้รับข้อมูลที่ถูกต้องเมื่อจำเป็น Data Virtualization is Reshaping Analytics กล่าวถึงข้อดีที่เทคโนโลยีเสนอให้กับการวิเคราะห์ธุรกิจ เทคโนโลยีที่เป็นนวัตกรรมนี้สามารถต่อสู้กับข้อจำกัดตามปกติของการเตรียมข้อมูลและการวิเคราะห์เพื่อให้ได้ผลลัพธ์ที่ดีที่สุด DV เปลี่ยนแปลงภูมิทัศน์ BI แบบดั้งเดิมอย่างไร ด้วยเลเยอร์การนำเสนอและข้อมูลแบบรวมศูนย์ DV ให้ทั้งการเข้าถึงข้อมูลหลายแหล่งอย่างรวดเร็วและมุมมองข้อมูลแบบรวมศูนย์ มุมมองข้อมูลที่ห่อหุ้มไว้ทำให้ผู้ใช้ BI สร้างแดชบอร์ดทันทีพร้อมข้อมูลเชิงลึกอันมีค่าได้ง่าย DV ป้องกันการสูญหายของข้อมูลหรือความไม่สอดคล้องกัน โดยเฉพาะอย่างยิ่งในกรณีที่ข้อมูลมาจากแหล่งสตรีมมิ่ง ต่อไปนี้คือประโยชน์บางประการที่ผู้ใช้ BI ทั่วไปเห็นเมื่อย้ายออกจากคลังข้อมูลไปยังสถาปัตยกรรม DV: เพิ่มความเร็วในการเข้าถึงข้อมูลแบบเรียลไทม์ ข้อกำหนดในการจัดเก็บข้อมูลที่ลดลง ลดความเสี่ยงของข้อมูลสูญหายหรือความไม่สอดคล้องกัน ลดปริมาณงานบนระบบ ปรับปรุงการกำกับดูแลข้อมูลผ่านนโยบาย DV ข้อสังเกตบางประการ ข้อเสีย ได้แก่ ความซับซ้อนในการจัดการการเปลี่ยนแปลง ความต้องการรูปแบบการกำกับดูแลข้อมูลที่เหนือกว่า และความเสี่ยงที่จะส่งผลกระทบต่อเวลาตอบสนองของระบบ แม้จะมีข้อจำกัด DV เหมาะอย่างยิ่งสำหรับ BI ที่คล่องตัวและ BI ข้อมูลขนาดใหญ่ กรณีการใช้งานการจำลองเสมือนของข้อมูล ใช้กรณีที่ 1: ปัจจุบันคลังข้อมูลเสมือนเป็นเทคโนโลยีที่ต้องการเนื่องจากการตั้งค่า VDW เร็วกว่าการตั้งค่าคลังข้อมูลแบบเดิมมาก โซลูชันนี้เหมาะสำหรับการวิเคราะห์ข้อมูลขนาดใหญ่หรือแพลตฟอร์ม BI บนคลาวด์ ใช้กรณีที่ 2: ใน Data Lake เสมือน การรวมข้อมูลในทันทีโดยไม่คำนึงถึงแหล่งที่มาจะมีประโยชน์มาก การเข้าถึงข้อมูลประเภทนี้มีประโยชน์สำหรับผู้ใช้ทางธุรกิจที่หลากหลาย ผู้เชี่ยวชาญของ Cisco เชื่อว่าความท้าทายที่แท้จริงในโลกของข้อมูลบนเครือข่ายไม่ใช่การขาดแคลนข้อมูล แต่เป็นการจัดเก็บข้อมูลในที่เก็บข้อมูลประเภทต่างๆ และการลงทุนด้านเทคโนโลยีไม่คุ้มค่า เว้นแต่ข้อมูลที่เป็นผลจะเป็นมูลค่าเพิ่ม พวกเขาได้เสนอโซลูชัน DV ที่ผู้ขายอ้างว่าสามารถแปลง “ที่เก็บข้อมูลเป็นข้อมูลที่มีค่า” พวกเขาเชื่อว่า DV มีอนาคตในการต่อสู้กับไซโลข้อมูลที่สร้างโดย IoT ทั่วทั้งองค์กร บทนำสู่การจำลองเสมือนของข้อมูลและกรณีการใช้งานให้ตัวอย่างเพิ่มเติม การสำรวจเพิ่มเติมใน DV บทนำสู่การจำลองเสมือนของข้อมูลอธิบายถึงวิธีที่องค์กรสามารถจัดการกับความท้าทายที่เกิดจากการเพิ่มไซโลข้อมูล การเติบโตของข้อมูล และแพลตฟอร์มเทคโนโลยีที่ใหม่กว่า รูปภาพที่ใช้ภายใต้ลิขสิทธิ์จาก Shutterstock.com

  • บ้าน
  • Business
  • Data science
  • Marketing
  • Leave a Reply

    Your email address will not be published. Required fields are marked *

    Back to top button