Data science

ถึงเวลาสำหรับการจำลองเสมือนของฐานข้อมูลแล้วหรือยัง

ในช่วงหลายปีที่ผ่านมา 20 องค์ประกอบเกือบทั้งหมดของ IT stack ได้รับการจำลองเสมือน เรามีที่เก็บข้อมูลเสมือน เครือข่ายเสมือน และเซิร์ฟเวอร์เสมือน แต่ส่วนหนึ่งของสแต็กนั้นขาดหายไปอย่างเห็นได้ชัดจากเรื่องราวการจำลองเสมือน: ฐานข้อมูล ถึงเวลาทำเวอร์ชวลไลซ์ฐานข้อมูลแล้วหรือยัง? บางคนบอกว่าเวลาไม่สามารถดีกว่านี้ได้ การจำลองเสมือนฐานข้อมูลไม่ใช่แนวคิดใหม่ แต่ก็ไม่ใช่แนวคิดที่นำมาใช้กันอย่างแพร่หลาย ในการจำลองเสมือนของฐานข้อมูลประเภทหนึ่ง เช่น ที่ Datometry บริษัท San Francisco ฝึกฝน เลเยอร์ของสิ่งที่เป็นนามธรรมจะถูกแทรกระหว่างฐานข้อมูลและแอปพลิเคชัน อีมูเลเตอร์ปิดบังความแตกต่างระหว่างฐานข้อมูล ทำให้ลูกค้าสามารถย้ายฐานข้อมูลได้ง่ายกว่าเมื่อก่อนมาก Mike Waas ซีอีโอของ Datometry กล่าวว่าการจำลองเสมือนของฐานข้อมูลมีศักยภาพที่จะให้อิสระในการใช้ฐานข้อมูลอื่นรวมกันมากขึ้น “การออกจากฐานข้อมูลเป็นเพียงฝันร้ายของทุกคน” เจ้าหน้าที่ฐานข้อมูลกล่าวกับ Datanami “ในช่วงหลายปีที่ผ่านมา 90 ทุกคนต้องทนทุกข์ทรมานจากการถูกล็อคอินของผู้จำหน่ายในฐานข้อมูล แต่ไม่มีใครทำอะไรกับมันเลยจริงๆ นั่นคือสิ่งที่เราต้องการเปลี่ยน” ข้อเสนอของ Datometry ที่เรียกว่า Hyper-Q ปัจจุบันกำหนดเป้าหมายไปยังฐานข้อมูลการวิเคราะห์ Teradata และการสนับสนุนอุปกรณ์ Exadata ของ Oracle จะครบกำหนดในช่วงปลายไตรมาสนี้ ตามคำกล่าวของ Waas ผู้ซึ่งตัดฟันบนฐานข้อมูลกับ Microsoft ใน 1990 ก่อนที่จะทำงานที่ Amazon.com และ Greenplum บริษัทต่างๆ มักใช้งบประมาณ $2005 ล้านถึง $10 ล้านในช่วงสามปีเพื่อโยกย้ายออกจากอุปกรณ์ Teradata ขนาดกลาง อย่างไรก็ตาม โครงการจริงมักใช้เงินมากกว่า 20 ล้านดอลลาร์สหรัฐ โดยมีเพียง 15 % โอกาสสำเร็จ. “ซึ่งในอดีตอาจเป็นการตัดสินใจที่เป็นไปได้” เขากล่าวถึงความล้มเหลวในการเลิกใช้ระบบ OLAP อย่างสมบูรณ์ “แต่เมื่อคุณย้ายไปยังคลาวด์ และถ้าคุณต้องการกำจัดฮาร์ดแวร์และระบบที่มีอยู่จริง นั่นไม่ใช่ทางเลือกอีกต่อไป ดังนั้นเราจึงอนุญาตให้พวกเขาจูบลาสิ่งนั้นจริงๆ ย้ายทุกสิ่งที่พวกเขามีและรื้อกล่องเก่า” ข้อเสนอของ Database Emulation Datometry เป็นโปรแกรมจำลองสำหรับฐานข้อมูล บริษัทให้ความสำคัญกับฐานข้อมูลเชิงสัมพันธ์เชิงคอลัมน์เป็นหลัก หรือระบบ OLAP เช่น ข้อเสนอยอดนิยมของ Teradata ไม่มีเหตุผลใดที่โปรแกรมจำลองฐานข้อมูลไม่สามารถใช้กับระบบ OLTP ได้ แต่การย้ายคลังข้อมูลมักจะมีค่าใช้จ่ายสูงและเจ็บปวดที่สุด ดังนั้นบริษัทจึงเริ่มต้นที่นั่น Waas อธิบายผลิตภัณฑ์ดังนี้: “เราสกัดกั้นการสื่อสารจากแอปพลิเคชัน แกะคำขอ นำ SQL ออก จากนั้นทำสิ่งที่มีประสิทธิภาพเกือบจะเหมือนกับที่ครึ่งบนของฐานข้อมูลใดๆ ทำ ซึ่งหมายถึงสร้างแบบจำลองพีชคณิตทั้งหมดสำหรับ คำขอที่เข้ามา ปรับให้เหมาะสม จากนั้นสังเคราะห์ว่า SQL ที่ปรับให้เหมาะสมหมายถึงอะไรสำหรับปลายทางนั้น” เขากล่าว สถาปัตยกรรม Datometry (ที่มา: สมุดปกขาว Datometry “การนำเทคโนโลยีคลังข้อมูลบนคลาวด์มาใช้อย่างรวดเร็วโดยใช้ Datometry Hyper-Q”) เมื่อซอฟต์แวร์ Datometry ได้ค้นพบลักษณะที่กำหนดของฐานข้อมูลต้นทางแล้ว โซลูชันทดแทนซึ่งประกอบด้วยปริมาณงานแบบเรียลไทม์ เลเยอร์การแปล สามารถนำไปใช้ในฟิลด์เพื่อรองรับลูกค้าระบบฐานข้อมูลใหม่ โซลูชัน Datometry ทำงานบนคลาวด์ส่วนตัวเสมือนของลูกค้า (VPC) อยู่ระหว่างระบบที่ร้องขอ เช่น ไคลเอ็นต์ Tableau หรือ Looker BI และคลังข้อมูลใหม่ที่ลูกค้าเลือก ซึ่งน่าจะเป็น Amazon Redshift ของ Amazon Web Services Google Cloud BigQuery หรือ Microsoft Azure Synapse Analytics ข้อได้เปรียบหลักที่แนวทางนี้มีคือ Waas กล่าวว่าไม่มีแอปพลิเคชันการวิเคราะห์ใดที่รู้ว่าพวกเขาไม่ได้พูดคุยกับคลังข้อมูล Teradata อีกต่อไป เนื่องจากไคลเอ็นต์ Tableau หรือ Looker BI ปิดการสืบค้น SQL หรือในขณะที่เครื่องมือ Informatica หรือ Talend ETL โหลดข้อมูลต้นทางลงในคลังข้อมูล โปรแกรมจำลอง Datometry จะตีความคำขอและปรับแต่งตามความจำเป็นเพื่อพิจารณาความแตกต่างระหว่าง Teradata เก่าและใหม่ ระบบ Redshift/Synapse/BigQuery Waas กล่าวว่า Datometry ได้ทำการบ้านในการพัฒนาโซลูชันเพื่อพิจารณาการออกแบบและลักษณะเฉพาะของระบบ Teradata และ Oracle ซึ่งเป็นเครื่องวิเคราะห์ที่ซับซ้อนอย่างยิ่งซึ่งมีชิ้นส่วนที่เคลื่อนไหวจำนวนมาก เขาบอกว่า Hyper-Q สามารถทำซ้ำได้ 99 6% ของฟังก์ชัน Teradata นอกกรอบ ข้อแม้ประการหนึ่งคือ Datometry ยังไม่ได้พัฒนาการรองรับ XML (เสียงที่คุณได้ยินคือผู้บริหารของ MarkLogic ถอนหายใจด้วยความโล่งอก) “Teradata มีสิ่งที่ยอดเยี่ยม: มาโคร กระบวนงานที่เก็บไว้ คุณชื่อมัน เราทำทั้งหมดนั้น” Waas กล่าว “แม้ว่าฐานข้อมูลปลายทางใหม่ของคุณจะไม่มีโพรซีเดอร์ที่เก็บไว้ แต่เราให้โพรซีเดอร์ที่เก็บไว้แก่คุณ เนื่องจากโพรซีเดอร์ที่เก็บไว้นั้นเป็นชุดหรือสตริงของคำสั่ง SQL ที่เชื่อมต่อกับโฟลว์การควบคุมอย่างมีประสิทธิภาพ ดังนั้นเราจึงตีความโฟลว์การควบคุมและดำเนินการคำสั่ง SQL ได้จริง สมมติว่าเทียบกับ BigQuery หรือ Synapse “ดังนั้น คุณจะได้รับความเที่ยงตรงเต็มรูปแบบของขั้นตอนการจัดเก็บ ด้วยความดีของการจัดการข้อผิดพลาดและคำสั่งที่ใช้งานได้จริง และคุณตั้งชื่อมัน” เขากล่าวต่อ “แต่มันไม่ได้ดำเนินการในฐานข้อมูล ขั้นตอนการควบคุมจะดำเนินการใน Hyper-Q ผลิตภัณฑ์ของเรา แต่การยกของหนักทั้งหมดจะทำในฐานข้อมูล” Grander Vision Datometry เสนอราคาตามการประมาณการปริมาณงาน สำหรับระบบ Teradata ขนาดกลางทั่วไป ค่าใช้จ่ายจะอยู่ที่ไม่กี่แสนเหรียญต่อปี Waas กล่าว การย้ายข้อมูลเสร็จสมบูรณ์ด้วยค่าใช้จ่ายหนึ่งในสิบและความเร็วหนึ่งในสิบของการย้ายข้อมูลแบบเดิมที่จัดการโดยผู้รวมระบบ โดยมีความน่าจะเป็นที่ชนะ 90% เขาอ้างว่า . หลังจากใช้เวลาในอาชีพการเป็นลูกค้าฐานข้อมูลและทำงานให้กับผู้จำหน่ายฐานข้อมูล Waas ได้เห็นผลกระทบมหาศาลที่ฐานข้อมูลที่ติดหนึบสามารถมีได้ เมื่อเขาเริ่มต้นกับ Amazon.com ใน 2005 เขามีส่วนเกี่ยวข้องในช่วงแรกของการโยกย้ายผู้ขายหนังสือออนไลน์ออกจากฐานข้อมูล Oracle ซึ่งในที่สุดก็ถึงจุดสูงสุดในปีที่แล้ว – 15 ปีโครงการ. ในทำนองเดียวกัน Facebook ใช้เวลาสองสามปีในการอัปเกรดจาก Postgres เวอร์ชันหนึ่งเป็นอีกเวอร์ชันหนึ่ง Datometry หวังที่จะช่วยให้ลูกค้าเฉลิมฉลองอิสรภาพจากการล็อคอินฐานข้อมูล (ปักธงชัย/Shutterstock) ลูกค้าไม่ใช่คนเดียวที่ได้รับผลกระทบจากการล็อคฐานข้อมูล Waas กล่าว เมื่อผู้จำหน่ายฐานข้อมูลปรับปรุงผลิตภัณฑ์ ลูกค้ามักจะไม่สามารถอัปเกรดเพื่อใช้ประโยชน์จากคุณลักษณะของตนได้ ซึ่งจะส่งผลเสียต่อผู้ที่มีแนวโน้มจะเป็นลูกค้าในระยะยาวของผู้ขาย “หากเราทำ Datometry 10 เมื่อหลายปีก่อน คุณจะเปลี่ยนจาก Oracle ที่มีฮาร์ดแวร์แบบถาวรไปเป็น SQL Server ที่มีฮาร์ดแวร์แบบถาวร มะเขือเทศ toh-mah-to” เขากล่าว “ค่าน่าจะดีที่สุด 10% ถึง 15% . ไม่มีมูลค่าเพิ่มขึ้นอย่างควอนตัม” แต่ระบบคลาวด์ให้มูลค่าที่ก้าวกระโดดอย่างควอนตัมด้วยความสามารถในการปรับขนาด ประสิทธิภาพ และตลาดแอพ Waas กล่าว ในที่สุด หลังจากหลายปีของการรักษาความเจ็บปวดจากการโยกย้ายฐานข้อมูลด้วยครีมทาเฉพาะที่ ในที่สุดการรักษาก็อาจทำได้สำเร็จ “มันกลายเป็นผลึกอย่างแท้จริง เพราะนี่คือช่วงเวลาสุดท้ายในประวัติศาสตร์ที่มีแรงภายนอกที่เปลี่ยนทุกคนจากภายในองค์กรไปสู่ระบบคลาวด์” เขากล่าว “นี่เป็นการเปิดในอุดมคติสำหรับเทคโนโลยีนี้ในการย้ายจากระบบฐานข้อมูลหนึ่งไปยังอีกระบบหนึ่งเพื่อนำการจำลองเสมือนมาสู่ตาราง” การย้ายฐานข้อมูลเป็นการใช้งานที่ชัดเจนที่สุดสำหรับการจำลองเสมือนของฐานข้อมูล แต่วิสัยทัศน์ Datometry นั้นใหญ่กว่านั้น Waas กล่าว “คิดถึง VMware” เขากล่าว “เมื่อ 20 ปีที่แล้ว ผู้คนมองว่าเครื่องมือนี้เป็นเครื่องมือรวมข้อมูลสำหรับมัลติคอร์ วันนี้ไม่มีใครมองสิ่งนี้ในลักษณะนี้อีกต่อไป มีฟังก์ชั่นมากมายที่ VMware มี bult” Datometry มีความคิดแบบเดียวกัน เมื่อคุณอยู่ในเส้นทางข้อมูลแล้ว Waas กล่าวว่ามีฟังก์ชันอีกมากมายที่คุณสามารถสร้างได้ รวมถึงการจัดการ การจัดการ ความปลอดภัย การทำโปรไฟล์ และการเพิ่มประสิทธิภาพ “ในอีกไม่กี่ปีข้างหน้า ฉันเชื่อว่าไม่มีใครจะเชื่อมต่อแอปพลิเคชันโดยตรงกับฐานข้อมูลอีกต่อไป เหมือนกับที่ไม่มีใครวางซอฟต์แวร์ระดับองค์กรบนเซิร์ฟเวอร์เปล่าในปัจจุบัน” เขากล่าว “สคริปต์ถูกพลิกโดยเวอร์ชวลไลเซชั่นโดยสิ้นเชิงในช่วงหลายปีที่ผ่านมา และฉันคาดหวังว่าสิ่งเดียวกันจะเกิดขึ้นในพื้นที่ฐานข้อมูล” รายการที่เกี่ยวข้อง: การโยกย้ายฐานข้อมูลเข้าสู่เกียร์สูง ใครเป็นผู้ชนะ Cloud Database War Cloud ตอนนี้เป็นแพลตฟอร์มเริ่มต้นสำหรับฐานข้อมูล Gartner กล่าว

  • บ้าน
  • Business
  • Data science
  • Marketing
  • Leave a Reply

    Your email address will not be published. Required fields are marked *

    Back to top button