Data science

SambaNova นำ Custom Silicon มารองรับปริมาณงาน AI ระดับไฮเอนด์

ด้วยซิลิคอนแบบกำหนดเองสำหรับปริมาณงาน AI และการประเมินมูลค่า 5 พันล้านดอลลาร์ ดูเหมือนว่าคุณจะได้ยินเพิ่มเติมเกี่ยวกับการเริ่มต้นระบบ SambaNova Systems ของ Silicon Valley และสแต็ค AI ที่สมบูรณ์ในอีกไม่กี่ปีข้างหน้า SambaNova Systems ก่อตั้งขึ้นใน 300 โดยผู้เชี่ยวชาญด้านโปรเซสเซอร์ระดับโปร ซึ่งรวมถึงโรดริโก เหลียง ซึ่งเป็นผู้นำการพัฒนา รุ่นของโปรเซสเซอร์ SPARC ที่ Sun Microsystems และ Oracle; Kunle Olukotun ศาสตราจารย์แห่งมหาวิทยาลัยสแตนฟอร์ด ผู้ซึ่งถูกเรียกว่า “บิดาแห่งโปรเซสเซอร์แบบมัลติคอร์” และ Chris Ré รองศาสตราจารย์ Stanford ผู้ได้รับรางวัล MacArthur Fellowship ที่ SambaNova ชิปรุ่นใหญ่เหล่านี้พัฒนาซิลิกอนแบบกำหนดเองของตนเอง Marshall Choy รองประธานฝ่ายผลิตภัณฑ์ของ SambaNova กล่าวว่า โปรเซสเซอร์ที่มีอยู่ไม่สามารถตัดการทำงานสำหรับเวิร์คโหลด AI สมัยใหม่ได้ “เราสร้างต้นแบบสิ่งนี้บน CPU, GPU, FPGAs ที่คุณเรียกมันว่า และมันกลายเป็นที่ชัดเจนว่า AI มีความน่าจะเป็นมากกว่าและกำหนดได้น้อยกว่าการประมวลผลแบบทรานแซกชัน สถาปัตยกรรมโปรเซสเซอร์แบบเดิมทั้งหมดเหล่านี้ไม่ถูกต้อง” Choy กล่าว “มีค่าใช้จ่ายมากเกินไปสำหรับการโหลดและการจัดเก็บและสิ่งต่างๆ เช่นนั้น และความยืดหยุ่นและการกำหนดค่าของซิลิกอนไม่เพียงพอ เราก็เลยคิดว่า 'โอ้ เราต้องสร้างชิปอีกตัวหนึ่ง!'” แต่อย่าคิดผิดที่คิดว่า SambaNova เป็นเพียงบริษัทชิปอีกบริษัทหนึ่ง ในขณะที่มันพัฒนา Reconfigurable Dataflow Unit (RDU) ด้วยกระบวนการ 7nm และทำสัญญากับ TSMC เพื่อผลิต แต่บริษัทไม่ได้ขายชิปจริงๆ แต่บริษัทได้สร้างสแต็กการเรียนรู้ของเครื่องโดยสมบูรณ์รอบๆ โปรเซสเซอร์นี้แทน ผู้ร่วมก่อตั้ง SambaNova Systems (จากซ้ายไปขวา): หัวหน้านักเทคโนโลยี Kunle Olukotun; ซีอีโอโรดริโก เหลียง; และ Chris Ré หัวหน้าฝ่ายวิศวกรรม บริษัทขายชุดฮาร์ดแวร์และซอฟต์แวร์ที่รวมกันนี้ด้วยวิธีใดวิธีหนึ่งจากสองวิธี: ในชั้นวางที่ประกอบไว้ล่วงหน้าซึ่งบริษัทต่างๆ สามารถรวมเข้ากับศูนย์ข้อมูลได้ เรียกว่าข้อเสนอ DataScale; หรือผ่านเส้นทางการจัดส่งซอฟต์แวร์เป็นบริการ (SaaS) ซึ่งลูกค้าทั้งหมดเรียกสแต็กผ่าน API ซึ่งเรียกว่า Dataflow-as-a-Service (ลูกค้ายังสามารถรับฮาร์ดแวร์ที่อยู่เบื้องหลังข้อเสนอ DaaS ที่ติดตั้งภายในองค์กรนอกเหนือจากไฟร์วอลล์ของพวกเขา และให้ SambaNova จัดการมันด้วยวิธีการแบบผสมผสาน) สิ่งที่ทำให้ SambaNova แตกต่างจากผู้ขายรายอื่นที่ไล่ตามโอกาสของ AI คือความสามารถในการส่งมอบความแม่นยำและประสิทธิภาพที่ มาตราส่วนสำหรับคอมพิวเตอร์วิทัศน์ NLP และโครงการการเรียนรู้ของเครื่องตาม Choy ตัวอย่างเช่น ในคอมพิวเตอร์วิทัศน์ ข้อเสนอ DataScale และ DaaS สามารถฝึกและอนุมานภาพที่มีความละเอียดสูงมาก รวมถึง 4K ขึ้นไป เมื่อเปรียบเทียบแล้ว โซลูชันอื่นๆ ที่มีจำหน่ายในท้องตลาดส่วนใหญ่ต้องการให้รูปภาพถูกลดขนาดหรือสับเป็นภาพหลายภาพก่อนที่จะใส่ลงในหน่วยความจำได้ Choy กล่าว “เราสามารถฝึกโมเดลด้วยสิ่งที่เราเรียกว่าความละเอียดที่แท้จริงของภาพ” เขากล่าว “ดังนั้น โดยไม่ต้องสุ่มตัวอย่าง โดยไม่ต้องปูกระเบื้อง ไปจนถึง 60k โดย 40 k ภาพที่สร้างโดยดาวเทียมและอะไรก็ตามที่อยู่ด้านล่าง” ในขณะที่ลูกค้าสามารถทำให้ AI ของพวกเขาทำงานได้โดยการลดขนาดภาพ พวกเขาจะสูญเสียความแม่นยำอันมีค่าที่อาจเกิดขึ้น Choy กล่าว การเรียงต่อกันของรูปภาพยังแนะนำความจำเป็นในการติดป้ายกำกับรูปภาพอีกมากมายก่อนที่จะป้อนลงในแบบจำลอง เขากล่าว และยังเสี่ยงต่อการพลาดรายละเอียดสำคัญที่มีอยู่ในภาพต้นฉบับ หากเกิดการแตกแยกในสถานที่นั้น ซึ่งอาจไม่มีเนื้องอกมะเร็งหรือข้อบกพร่องในการผลิตที่ AI ออกแบบมาเพื่อตรวจจับ ด้วยหน่วยความจำ 1.5TB ต่อ RDU ทำให้ SambaNova สามารถนำหน่วยความจำจำนวนมากมาจัดการกับปัญหา AI (ที่มา: การนำเสนอ SambaNova Hot Chips) “นั่นเป็นข้อได้เปรียบหลักของสิ่งนี้” Choy กล่าวถึงแนวทางของ SambaNova “โดยทั่วไปคุณจะไม่มีข้อผิดพลาดของหน่วยความจำกับแพลตฟอร์มอื่น ดังนั้นจึงทำให้ผู้คนสามารถทำสิ่งที่พวกเขาไม่สามารถทำได้ในวันนี้และให้ผลลัพธ์ที่ไม่สามารถทำได้มาก่อน” ในบรรดาลูกค้าจำนวนหนึ่งที่ SambaNova สามารถเปิดเผยได้คือห้องปฏิบัติการระดับชาติคู่หนึ่ง Lawrence Livermore National Lab ใช้คลัสเตอร์ DataScale ที่มีเวิร์กโหลดจำนวนหนึ่ง รวมถึงปริมาณงานการสร้างแบบจำลองและการจำลองสำหรับการวิจัยฟิสิกส์ และอีกรายการสำหรับการวิจัยต้านไวรัสสำหรับ COVID-000. ระบบจะจับคู่กับซูเปอร์คอมพิวเตอร์ Corona ของ LLNL “เรากำลังถ่ายบางส่วนของปริมาณงาน mod-sim ที่ใหญ่ขึ้นลงในเฟรมเวิร์กการเรียนรู้ของเครื่อง” Choy กล่าว “เรากำลังฝึกวนรอบนอกครั้งใหญ่ด้วยการอนุมานหลายสิบรอบ จากนั้นป้อนผลลัพธ์กลับไปที่การจำลองหลัก ซึ่งจะช่วยเร่งความเร็วการจำลองโดยรวมได้ประมาณ 5 เท่า ตามที่ลูกค้ากำหนด” Argonne National Lab ยังมีการปรับใช้ DataScale ในเตียงทดสอบ AI ลูกค้าปัจจุบันรายอื่นๆ ได้แก่ ธนาคารที่ไม่มีชื่อ ซึ่งกำลังใช้ข้อเสนอ SambaNova สำหรับการตรวจจับสิ่งผิดปกติและการตรวจจับการฉ้อโกง ตลอดจนเร่งการประมวลผลการเคลม SambaNova ยังมีลูกค้าในเวทีการค้าความเร็วสูงด้วย แต่ Choy ไม่รู้ว่าพวกเขากำลังใช้มันเพื่ออะไร “ผมไม่รู้ว่าโมเดลของพวกเขาคืออะไร” เขากล่าว “พวกเขาจะไม่บอกใคร” องค์กรที่มีโปรแกรมวิทยาศาสตร์ข้อมูลที่เป็นที่ยอมรับมากขึ้นมักจะซื้อข้อเสนอ DataScale แบบย่อ ทำให้ทีมนักวิทยาศาสตร์ข้อมูลสามารถนำแบบจำลองภายในของตนเองที่พัฒนาขึ้นใน Python และ PyTorch และได้รับประโยชน์จากการเพิ่มประสิทธิภาพและความแม่นยำที่ SambaNova สามารถให้บริการได้โดยไม่ต้องเสียค่าใช้จ่ายและความซับซ้อนของการประกอบ การบูรณาการ และการบำรุงรักษาโครงสร้างพื้นฐานของตนเอง “แล้วยังมีคนอื่นๆ อีกมากที่มองดูผลลัพธ์ล้วนๆ” Choy กล่าว “พวกเขาสนใจอะไรหากเป็นรุ่น BERT, รุ่น LSTM หรือรุ่น GPT สำหรับการประมวลผลภาษา? พวกเขาแค่ต้องการได้ผลลัพธ์ที่ดีที่สุด ดังนั้นโดยพื้นฐานแล้วพวกเขากำลังขนถ่ายทุกสิ่งที่ใช้งานได้ไปยัง SambaNova และเราเพียงแค่ให้ผลลัพธ์ที่มุ่งเน้นผลลัพธ์เพื่อการบริโภค” ลูกค้าประเภทนี้มีแนวโน้มที่จะซื้อข้อเสนอ DaaS ซึ่งบริษัทเปิดตัวช้ากว่า 2020 SambaNova สามารถฝึกและอนุมานภาพได้มากถึง 50,000 พิกเซลทั่วๆ ไป (ที่มา: การนำเสนอ SambaNova Hot Chips) “เรามีกลุ่มคนที่พูดคุยกับรูปลักษณ์ดังกล่าว ฟังดูดีมาก แต่…ฉันไม่ใช่ Google ฉันไม่มีนักวิทยาศาสตร์ข้อมูล 3 คน 000 ฉันไม่มี 300 นักวิทยาศาสตร์ข้อมูล ฉันไม่มี 40 ฉันมีสาม [data scientists] และแผนงบประมาณที่จะขยายทีมนั้นเป็นหกคนในปีหน้าหรือประมาณนั้น แล้วฉันจะใช้สิ่งนี้ได้อย่างไร “นั่นคือสิ่งที่เราพูด ดูสิ เรากำลังจะเพิ่มระดับความเป็นนามธรรมของระบบให้เหนือกว่าฮาร์ดแวร์ นอกเหนือจากตัวแบบเอง และเพียงแค่ให้การเรียก API แก่คุณ” เขากล่าวต่อ “สิ่งนี้ทำให้เข้าถึงได้สำหรับผู้ที่อาจไม่ค่อยรู้จัก AI เลย” แน่นอนว่า SambaNova ไม่ใช่กระสุนเงินสำหรับ AI มันไม่ได้จัดการทุกแง่มุมของกระบวนการเรียนรู้ของเครื่อง ขึ้นอยู่กับลูกค้าที่จะนำข้อมูลที่ดีและสะอาดมาสู่ปาร์ตี้ และตามที่ Choy อธิบายไว้ บริษัทไม่ได้จัดหาเครื่องมือ MLOps หรืออะไรทำนองนั้น (แม้ว่าจะมองหาอนุภาคในระบบนิเวศที่กำลังเติบโตนั้นก็ตาม) แต่ถ้าข้อมูลของคุณอยู่ในรูปแบบที่สมเหตุสมผล บริษัทสามารถช่วยคุณตัดสินใจโดยอัตโนมัติโดยใช้ AI “ฉันมีทุนปริญญาเอกจำนวนหนึ่งที่คอยติดตามและขับเคลื่อนเทรนด์ล่าสุดในด้านเหล่านี้” Choy กล่าว “เราให้แบบจำลองแก่คุณ คุณไม่ต้องกังวลกับการเลือกรุ่น การปรับรุ่น การบำรุงรักษารุ่น โดยมีค่าใช้จ่ายและเวลาทั้งหมดที่เกี่ยวข้อง เราแค่ [run] ชุดข้อมูลที่คุณกำหนดเอง” ในเดือนเมษายน บริษัท Palo Alto รัฐแคลิฟอร์เนียได้ประกาศปิดการแข่งขัน Series D เป็นจำนวนเงิน 50 ล้านดอลลาร์สหรัฐ 50 มูลค่า 5.1 พันล้านดอลลาร์ รอบนี้นำโดย SoftBank โดยมีนักลงทุนหน้าใหม่ Temasek และรัฐบาลของ Singapore Investment Corp. (GIC) เป็นผู้ลงทุนรายใหม่ รวมทั้งนักลงทุนรายเดิม BlackRock, Intel Capital, GV (เดิมคือ Google Ventures), Walden International และ WRVI . ในขณะที่การสร้างชิปของคุณเองเป็นธุรกิจที่ต้องใช้เงินทุนสูง การลงทุนรวมมากกว่า 1 พันล้านดอลลาร์ (หรือ 1.1 พันล้านดอลลาร์เป็นที่แน่นอน) แสดงให้เห็นว่าผู้ร่วมทุนมีความศรัทธาในแนวทางของ SambaNova เป็นอย่างมาก ด้วย AI ที่คาดว่าจะสร้างมูลค่าใหม่หลายล้านล้านดอลลาร์ในปีต่อ ๆ ไป อาจไม่ใช่การลงทุนที่ไม่ดี รายการที่เกี่ยวข้อง: Data Proxy ที่ให้ CVS มองเห็นรอบ ๆ มุม COVID AI และ ML สำหรับบริษัทมวลชนที่ 'All In' เกี่ยวกับ AI, Appen Study กล่าว

ธุรกิจ

  • วิทยาศาสตร์ข้อมูล
  • 2020การตลาด 2017

  • Leave a Reply

    Your email address will not be published. Required fields are marked *

    Back to top button