Data science

dbt Rides Wave of Modern, ETL บนคลาวด์สู่ New Heights

การระเบิดของการวิเคราะห์ข้อมูลบนคลาวด์เป็นผลดีต่อ Fishtown Analytics ซึ่งเป็นบริษัทในฟิลาเดลเฟีย รัฐเพนซิลวาเนีย ซึ่งอยู่เบื้องหลังเครื่องมือสร้างข้อมูลโอเพนซอร์สยอดนิยมหรือ dbt ตอนนี้บริษัทกำลังมองหาที่จะยกระดับปริมาณงาน ETL ที่ทันสมัยขึ้นอีกระดับด้วยการรีแบรนด์เป็น dbt Labs และรับเงินจำนวน $15 ในการร่วมทุน ในตอนต้น 2016 Fishtown Analytics อย่างที่บริษัทถูกเรียกในตอนนั้น ได้เปิดตัว dbt อย่างเงียบๆ เป็นเครื่องมือบรรทัดคำสั่งที่ค่อนข้างง่ายสำหรับวิศวกรข้อมูลในการเขียนและดำเนินการรูทีนการแปลงข้อมูลในฐานข้อมูลการวิเคราะห์ แม้ว่าผลิตภัณฑ์จะเห็นได้ชัดว่าเป็นเครื่องมือ ETL แต่เน้นเฉพาะส่วน “T” ของกระบวนการ ซึ่งเป็นส่วนที่ยากที่สุดของปริมาณงาน ETL “มันไม่ได้ดึงหรือโหลดข้อมูล” Tristan Handy ซีอีโอและผู้ก่อตั้งบริษัท เขียนไว้ในบล็อกโพสต์ 500 “แต่การแปลงข้อมูลนั้นทำได้ดีมาก บรรจุลงในคลังสินค้าของคุณแล้ว” ผู้ใช้ยังตอบสนองต่อลักษณะตรงไปตรงมาของ dbt ที่แกนหลัก dbt ประกอบด้วยคอมไพเลอร์และรันเนอร์ เมื่อใช้โปรแกรมแก้ไขข้อความที่เลือก ผู้ใช้จะเขียนโค้ดคำสั่ง SELECT โดยใช้ SQL และ Jinja ร่วมกัน (ภาษาเทมเพลตทั่วไปที่ใช้ในระบบนิเวศของ Python) จากนั้นผู้ใช้จะเรียก dbt runner ซึ่งรวบรวมโค้ดเป็น SQL ดิบ ซึ่งจะถูกดำเนินการกับคลังข้อมูล เมื่อนำ Snowflake มาใช้ Google BigQuery, Databricks และ Amazon Redshift ก็พุ่งสูงขึ้น การใช้ dbt ก็เพิ่มขึ้นเช่นกัน ตาม dbt Labs จำนวนผู้ใช้ที่ใช้ dbt เพิ่มขึ้น 200% ทุกปีนับตั้งแต่เปิดตัวอีกครั้ง 2016. บริษัทบอกว่าวันนี้มี 15,000 ผู้เชี่ยวชาญด้านข้อมูลใน dbt Community Slack, 5,500 บริษัทที่ใช้ dbt และ 1,000 องค์กรที่ใช้ dbt Cloud ซึ่งเป็นเวอร์ชันที่โฮสต์ของเครื่องมือ dbt ปริมาณงานการวิเคราะห์ข้อมูลที่เพิ่มขึ้นดึงดูดสายตาของนักลงทุน ซึ่งรวมถึง Altimeter Capital ซึ่งเป็นหนึ่งในบริษัทร่วมทุนที่ลงทุนใน dbt Labs “การเติบโตของแพลตฟอร์มข้อมูลบนคลาวด์ในช่วงไม่กี่ปีที่ผ่านมานั้นไม่เคยเกิดขึ้นมาก่อน” Jamin Ball หุ้นส่วนของ Altimeter Capital กล่าวในการแถลงข่าว “แพลตฟอร์มเหล่านี้ไม่มีทีมข้อมูลจากแนวทาง ETL แบบเก่า และปลดล็อกคลื่นลูกใหม่ของเครื่องมือในสแต็กข้อมูลสมัยใหม่ที่สร้างขึ้นสำหรับ ELT…dbt ได้สร้างตัวเองให้เป็นแพลตฟอร์มที่เข้าถึงได้สำหรับการแปลงข้อมูลในรูปแบบการทำงานใหม่นี้” รอบ Series C ซึ่งมีมูลค่ารวม 15 ล้าน นำโดย Altimeter, Sequoia Capital และ Andreessen Horowitz โดยมีส่วนร่วมจาก Amplify Partners Sequoia, Andreessen Horowitz และ Amplify เป็นนักลงทุนที่มีอยู่ทั้งหมด และทั้งหมดเข้าร่วมในรอบ Series B ของเดือนพฤศจิกายนปีที่แล้ว ซึ่งรวม Fishtown Analytics (ตามที่บริษัทเรียก) $29.5 ล้าน. “เราเชื่อเสมอมาว่าการแก้ปัญหาสำหรับนักวิเคราะห์เป็นความลับในการปลดล็อกประสิทธิภาพการทำงานที่มากขึ้นในทีมข้อมูล” Handy กล่าวในการแถลงข่าว “เราเห็นการลงทุนที่เพิ่มขึ้นในบริษัทและผลิตภัณฑ์ที่สร้างขึ้นจากวิทยานิพนธ์เดียวกันนี้ Delta Lake และ Databricks SQL ของ Databricks เป็นเดิมพันครั้งใหญ่ใน SQL, Census และ Hightouch ได้ระดมการลงทุนเพื่อแก้ปัญหากรณีการใช้งานการวิเคราะห์เชิงปฏิบัติการ และการรวม dbt ของ Mode ทำให้ผู้บริโภคข้อมูลสามารถเข้าถึงความสดของข้อมูลได้ เราเชื่ออย่างยิ่งว่านี่เป็นเพียงจุดเริ่มต้นของแนวโน้มนี้” บริษัทกำลังวางแผนที่จะจัดการประชุมด้านวิศวกรรมการวิเคราะห์ประจำปีครั้งที่สองที่เรียกว่า Coalesce ตั้งแต่วันที่ 6 ธันวาคมถึง 10 รายการที่เกี่ยวข้อง: อะไรที่รั้งเราไว้ตอนนี้ 'It's the Data, Stupid' Data Transformer Fishtown ระดมทุน Data Lakes เป็นเทคโนโลยีดั้งเดิม ซีอีโอของ Fivetran กล่าว

  • บ้าน
  • Business
  • Data science
  • Marketing
  • Leave a Reply

    Your email address will not be published. Required fields are marked *

    Back to top button