Data science

เกล็ดหิมะ 'ไม่มีสำนักงานใหญ่' ใหม่ประกาศอย่างล้นหลาม

Snowflake เป็นที่รู้จักกันเป็นอย่างดีในฐานะคลังข้อมูลบนคลาวด์ ความทะเยอทะยาน “ดาต้าคลาวด์” ที่กว้างขึ้นเหล่านี้กำลังแสดงอยู่ในสัปดาห์นี้ เนื่องจากบริษัท “ไม่มีสำนักงานใหญ่” แห่งใหม่จัดประชุมสุดยอด Snowflake Summit ครั้งแรกนับตั้งแต่การเสนอขายหุ้นครั้งใหญ่ในปีที่แล้ว ตามที่ Christian Kleinerman รองประธานอาวุโสฝ่ายผลิตภัณฑ์ของ Snowflake การประกาศครั้งใหญ่ที่สุดในงาน Snowflake Summit ในสัปดาห์นี้เกี่ยวกับ Snowpark ซึ่งเป็นเครื่องมือในการพัฒนาและรันไทม์ใหม่ที่เปิดตัวเมื่อเดือนพฤศจิกายนปีที่แล้วที่งาน Data Cloud Summit Snowpark ช่วยให้ลูกค้าสามารถพัฒนาและเรียกใช้โปรแกรมที่ใช้ Java กับข้อมูลที่จัดเก็บไว้ใน Snowflake โปรแกรมเหล่านี้สามารถดำเนินการ ETL/ETL, การแปลงข้อมูล หรืองานวิศวกรรมคุณลักษณะที่จำเป็นสำหรับการวิเคราะห์ข้อมูล วิทยาศาสตร์ข้อมูล และเวิร์กโฟลว์วิศวกรรมข้อมูล “เป็นทางเลือกแทน Spark หรือ Dask หรือเฟรมเวิร์กทั้งหมดที่มีอยู่ในโปรแกรมไปยังข้อมูลใน Java หรือ Python” Kleinerman กล่าวกับ Datanami “มันเป็นโมเดลการเขียนโปรแกรมบนเอนทิตี Snowflake” Snowpark จะรองรับ Scala (ภาษาที่เข้ากันได้กับ JVM) ก่อน ลูกค้า Snowpark ทั้งหมดบน AWS จะได้รับภายในวันจันทร์หน้าตามข้อมูลของ Kleinerman คาดว่าจะรองรับ Java, Python และไลบรารีและรูทีนที่เกี่ยวข้องในปลายปีนี้ ในบันทึกที่เกี่ยวข้อง Snowflake ได้นำเสนอ Java User Defined Function (UDF) ใหม่ให้กับ Snowpark ซึ่งจะทำให้ผู้ใช้หรือคู่ค้าสามารถนำโค้ด Java ที่กำหนดเองไปใช้ในกระบวนทัศน์ Snowflake นี่ยังอยู่ในตัวอย่างส่วนตัว คาดว่าจะมีการแสดงตัวอย่างสาธารณะในเร็วๆ นี้ เกี่ยวกับพันธมิตร 13 ได้นำ Snowpark มาใช้แล้วหรือมีความมุ่งมั่นที่จะนำมาใช้ ซึ่งเป็นข้อพิสูจน์ว่า Snowpark กำลังได้รับความสนใจ Kleinerman กล่าว “ ได้ออกสู่ตลาดลูกค้าและพันธมิตรที่แตกต่างกันในช่วงสามเดือนที่ผ่านมา และตอนนี้ก็เพิ่มขึ้นเรื่อยๆ” เขากล่าว “เรามีลูกค้าและคู่ค้าที่พูดถึงประโยชน์ ประสิทธิภาพ ปริมาณงาน และต้นทุน” Frank Slootman CEO ของ Snowflake ทำให้หิมะตกบนเวทีที่ 2019 Snowflake Summit Snowflake ยังประกาศการสนับสนุนสำหรับข้อมูลที่ไม่มีโครงสร้าง เช่น รูปภาพ วิดีโอ และข้อความ ตามข้อมูลของ Kleinerman สิ่งนี้จะช่วยให้ภาพการวิเคราะห์ข้อมูลสมบูรณ์สำหรับลูกค้าที่มีความทะเยอทะยานด้านข้อมูลที่หลากหลาย “สโนว์เฟลกถือกำเนิดมาพร้อมกับข้อมูลที่มีโครงสร้างและข้อมูลกึ่งโครงสร้างเป็นความสามารถระดับเฟิร์สคลาส” ผู้จัดการผลิตภัณฑ์กล่าว “ฉันได้ยินลูกค้าพูดว่า ฉันชอบเรื่องที่ไม่มีไซโล แต่ฉันต้องการข้อมูลทั้งหมดของฉันที่นั่น ไม่ใช่แค่มีโครงสร้างและกึ่งมีโครงสร้าง ดังนั้นตอนนี้เรากำลังนำการสนับสนุนอย่างเต็มที่สำหรับข้อมูลที่ไม่มีโครงสร้างในรูปแบบของการสนับสนุนไฟล์” ลูกค้าสามารถจัดเก็บไฟล์ใดๆ ก็ตามใน Snowflake และบริษัทจะให้การรับประกันแบบเดียวกันเกี่ยวกับการกำกับดูแลข้อมูล การจัดการ และการจำลองข้อมูลบนข้อมูลนั้น Kleinerman กล่าว ยิ่งไปกว่านั้น ด้วย Snowpark ที่ให้การสนับสนุนโปรแกรมที่ใช้ Java (และในไม่ช้าโปรแกรมที่ใช้ Python เช่น PyTorch และ Tensorflow) ลูกค้าก็สามารถเริ่มทำการวิเคราะห์บนข้อมูลนั้นได้ ตัวอย่างเช่น ลูกค้าสามารถทำการวิเคราะห์ความเชื่อมั่นในข้อมูลข้อความหรือข้อมูลเสียง” Kleinerman กล่าว “ฉันมีคำพูดบางอย่าง ฉันสามารถใช้ไลบรารี่เพื่อแปลงเป็นข้อความได้ จากนั้นฉันก็สามารถใช้ห้องสมุดอื่นเพื่อดึงความรู้สึกออกจากมันได้” Snowflake เป็นผู้เล่นหลักในการต่อสู้ที่กำลังดำเนินอยู่ซึ่งแยกคลังข้อมูลบนคลาวด์และคลังข้อมูลบนคลาวด์มาไว้ด้วยกัน ผู้เสนอคลังข้อมูลบนระบบคลาวด์ เช่น Snowflake อ้างว่าลูกค้าควรใช้คลังข้อมูลที่มีการจัดการอย่างใกล้ชิด (และเป็นกรรมสิทธิ์) มากขึ้นเพื่อวิเคราะห์ข้อมูล ในขณะที่ผู้สนับสนุน Data Lake เช่น Dremio โต้แย้งว่าลูกค้าควรใช้การจัดการอย่างใกล้ชิดน้อยกว่า (และ เปิด) ทะเลสาบข้อมูล คุณลักษณะต่างๆ เช่น การสนับสนุนข้อมูลที่ไม่มีโครงสร้างและความสามารถในการนำฟังก์ชันที่ใช้ Java และ Python มาใช้กับข้อมูลดังกล่าวบ่งชี้ว่า Snowflake กำลังตอบสนองต่อข้อกังวลของลูกค้าเหล่านี้ อย่างน้อยก็ในบางส่วน Snowflake ยังประกาศด้วยว่าลูกค้าจะได้รับประโยชน์จากอัตราการบีบอัดที่เพิ่มขึ้นทั่วกระดาน ในบางกรณีอาจสูงถึง % Kleinerman กล่าวว่านี่เป็นประเภทของการปรับปรุงที่ผู้ใช้คาดหวังได้อย่างแน่นอน เนื่องจาก Snowflake จัดการรูปแบบข้อมูลอย่างใกล้ชิด การเพิ่มขึ้น 30% ซึ่งมาเหนืออัตราการบีบอัดที่มีอยู่แล้ว 10x สำหรับข้อมูลบางประเภท อันที่จริงแล้ว CFO ของ Snowflake ได้ประกาศในการเรียกนักวิเคราะห์ในไตรมาสที่แล้วว่ารายรับประจำปีจะลดลง $13 ล้าน , Kleinerman กล่าว “เงินโดยตรงที่เราไม่รู้จักเพราะเศรษฐกิจดีกว่าสำหรับลูกค้า” เขากล่าว “ทุกครั้งที่เราทำให้ระบบเร็วขึ้น เราทำร้ายไลน์ของเราเล็กน้อย แต่เราอยู่ในนี้ในระยะยาว” Snowflake ยังทำข่าวเกี่ยวกับตลาดข้อมูล ผู้ซื้อและผู้ขายที่ใช้ Data Marketplace ของบริษัท ซึ่งเปิดตัวใน 2019 สามารถทำธุรกรรมให้เสร็จสิ้นภายในตลาดซื้อขายได้ แทนที่จะทำข้อตกลงแบบออฟไลน์ให้เสร็จสิ้น Snowflake กำลังใช้รูปแบบการกำหนดราคาตามผู้ใช้สำหรับตลาดข้อมูล ซึ่งจะคำนวณต้นทุนตามเวลาในการคำนวณที่เกี่ยวข้องกับข้อมูลที่ระบุ ตลาดมีขนาดเพิ่มขึ้นสองเท่าในปีที่ผ่านมา และขณะนี้มี 500 รายการข้อมูลจากผู้ให้บริการ 160 บริษัทกล่าว “มันเติบโตได้ค่อนข้างดี” Kleinerman กล่าว “เรากำลังพยายามลดระดับความง่ายขององค์กรในการสร้างรายได้จากข้อมูล” การขายหรือแบ่งปันข้อมูลในตลาดซื้อขายสามารถทำได้อย่างปลอดภัยยิ่งขึ้น ด้วยขั้นตอนที่ Snowflake ได้ดำเนินการเพื่อป้องกันไม่ให้ข้อมูลสำคัญรั่วไหล ซึ่งรวมถึงตัวแยกประเภทข้อมูลที่ละเอียดอ่อนซึ่งสามารถระบุการรวมข้อมูลที่อาจเป็นปัญหาได้โดยอัตโนมัติ Kleinerman กล่าว นักวิจัยได้แสดงให้เห็นว่า แม้แต่ในข้อมูลที่รวบรวมไว้และไม่ได้เชื่อมโยงกับอัตลักษณ์ของบุคคลอย่างชัดเจน ก็สามารถระบุตัวบุคคลอีกครั้งได้ด้วยการเชื่อมโยงข้อมูลส่วนต่างๆ ที่แตกต่างกันเข้าด้วยกัน “หากคุณใช้วันเกิด เพศ และรหัสไปรษณีย์ของใครก็ตาม คุณจะสามารถระบุบุคคลเหล่านั้นได้อย่างชัดเจน” Kleinerman กล่าว “ตัวแยกประเภทของเราไม่เพียงแต่จะบอกคุณ สิ่งนี้มีความละเอียดอ่อน แต่ยังมีแนวคิดของตัวระบุเสมือน ดังนั้นมันจะช่วยให้ลูกค้าระบุชุดข้อมูลที่อาจระบุได้” สำนักงานใหญ่เดิมของ Snowflake ในเมืองซานมาเทโอ รัฐแคลิฟอร์เนีย (Sundry Photography/Shuttertock) บริษัทยังได้เปิดตัวสิ่งที่เรียกว่ามุมมองที่ไม่เปิดเผยตัวตน ซึ่งเป็นชุดข้อมูลแบบไม่ระบุตัวตนที่ช่วยลดความเสี่ยงของการระบุซ้ำ แต่ยังให้ค่าการวิเคราะห์ เทคโนโลยีนี้ใช้อัลกอริธึม k-anonymity และดิฟเฟอเรนเชียลความเป็นส่วนตัว Kleinerman กล่าว “เราคิดว่าสิ่งนี้จะช่วยเร่งความมั่นใจให้ผู้คนแชร์ข้อมูลซึ่งกันและกัน” เขากล่าว สุดท้ายแต่ไม่ท้ายสุด Snowflake ในวันนี้ได้ประกาศโปรแกรม “Powered by Snowflake” เพื่อช่วยสร้างและขยาย data cloud Snowflake ทำงานร่วมกับพันธมิตรมาหลายปีแล้ว แต่โปรแกรมใหม่นี้จะแสดงให้เห็นอย่างชัดเจนยิ่งขึ้นถึงประโยชน์ที่พันธมิตรจะได้รับ เนื่องจากเกี่ยวข้องกับการพัฒนาแอปพลิเคชัน กลยุทธ์การเข้าสู่ตลาด และการสนับสนุนด้านเทคนิค และอื่นๆ Frank Slootman CEO ของ Snowflake จะพูดในเวลา 9.00 น. PT วันนี้ที่ Snowflake Summit งานนี้จะเป็นเสมือนจริง เช่นเดียวกับบริษัทที่ละทิ้งสำนักงานใหญ่ใน Silicon Valley และประกาศว่ามีการกระจายอย่างสมบูรณ์หรือ “ไม่มีสำนักงานใหญ่” ยกเว้นสำหรับ “สำนักงานผู้บริหารหลัก” ใน Bozeman รัฐมอนแทนา ซึ่งเป็นที่ที่ Slootman และ CFO Mike Scarpelli แบ่งปันรหัสไปรษณีย์ สำหรับข้อมูลเพิ่มเติมและวาระการประชุม โปรดดูที่ www.snowflake.com/summit/agenda/ รายการที่เกี่ยวข้อง: Snowflake ขยายคลังข้อมูลด้วยไปป์ไลน์ บริการ Snowflake: ไม่ใช่สิ่งที่คุณอาจคิดว่าเป็น Snowflake Pops ในซอฟต์แวร์ 'Largest Ever' IPO Editor's note: เรื่องราวนี้ได้รับการแก้ไขแล้ว รายได้ประจำปีของ Snowflake จะสูงถึง $13 ล้านอันเป็นผลจากรายได้สูงสุด 10% การบีบอัดข้อมูลที่ Snowflake เพิ่งนำมาใช้ ไม่ใช่ $ ล้านต่อไตรมาสตามที่รายงานครั้งแรก Datanami เสียใจกับข้อผิดพลาด นอกจากนี้ยังได้รับการอัปเดตเพื่อสะท้อนถึงระยะเวลาของการสนับสนุน Scala, Java และ Python ใน Snowpark

วิทยาศาสตร์ข้อมูล

  • การตลาด
  • Leave a Reply

    Your email address will not be published. Required fields are marked *

    Back to top button