Data science

คอมพิวเตอร์แบบเร่งความเร็วกำลังเปลี่ยนแปลงวิทยาศาสตร์ข้อมูลอย่างไร

บริษัทใหญ่ๆ สตาร์ทอัพที่ใช้ซอฟต์แวร์เพื่อเร่งความเร็วในการตัดสินใจสร้างผลิตภัณฑ์และบริการใหม่ ๆ เป็นเวลาเกือบสองทศวรรษแล้วที่บริษัทต่างๆ เช่น Facebook, Amazon, JP Morgan และ Uber ได้เขียนหนังสือเกี่ยวกับวิธีใช้วิทยาศาสตร์ข้อมูลเพื่อทำให้ธุรกิจเติบโตได้สำเร็จ . ต้องขอบคุณนักประดิษฐ์เหล่านี้และคนอื่นๆ ที่ตอนนี้กลายเป็นความต้องการในการแข่งขันเพื่อให้สามารถสรุปข้อมูลเชิงลึกที่นำไปปฏิบัติได้อย่างรวดเร็วจากข้อมูลที่เปลี่ยนแปลงอย่างรวดเร็ว ธุรกิจต่างๆ สามารถใช้ AI เพื่อเรียนรู้จากข้อมูลจำนวนมหาศาลที่บันทึกจากเซ็นเซอร์และแหล่งที่มาต่างๆ มากมาย แต่ไม่มีความรู้ใดที่จะได้รับหากไม่ได้ประมวลผลข้อมูลปริมาณเหล่านี้ ปัญหาคือ การสร้างแนวปฏิบัติด้านวิทยาศาสตร์ข้อมูลแบบ end-to-end นั้นพูดง่ายกว่าทำ แม้ว่าบริษัทต่างๆ จะแข่งขันกันเพื่อค้นหานักวิทยาศาสตร์ด้านข้อมูลที่ดีที่สุด แต่ก็ต้องดิ้นรนกับวิธีที่จะได้ประโยชน์สูงสุดจากการลงทุน เนื่องจากความแตกต่างที่กำหนดไว้ไม่ดีระหว่างบทบาทด้านวิทยาการข้อมูลและเนื่องจากปัญหาคอขวดที่สร้างขึ้นโดยใช้สถาปัตยกรรม CPU แบบเดิมร่วมกับการพยายามใช้ระบบเดิม เครื่องมือและซอฟต์แวร์บนปริมาณข้อมูลที่ไม่เคยมีมาก่อน ประเภทข้อมูล AI ใหม่ เช่น เสียงและวิดีโอที่ใช้ในคอมพิวเตอร์วิทัศน์และ AI ในการสนทนานั้นยากที่จะรวมเข้ากับระบบเดิม ที่ NVIDIA เรามองเห็นบทบาทของวิศวกรข้อมูลในการนำเข้าข้อมูลที่ไม่มีโครงสร้างและมีเสียงดัง และทำความสะอาดสำหรับนักวิทยาศาสตร์ด้านข้อมูลที่กำลังสำรวจและทดลองในขณะที่สร้างแบบจำลองและวิเคราะห์รูปแบบ วิศวกรแมชชีนเลิร์นนิงคือผู้ที่ออกแบบกระบวนการจากต้นทางถึงปลายทางทั้งหมดของแมชชีนเลิร์นนิงและการเรียนรู้เชิงลึก ตลอดวงจรชีวิตวิทยาศาสตร์ข้อมูลนี้ — โดยใช้ Jupyter Notebooks, รัน Apache Spark หรือ SQL Server ETL (การแยก การแปลง และโหลด) — การประมวลผลแบบช้าที่ใช้ CPU สามารถขัดขวางการวิเคราะห์ชุดข้อมูลที่เติบโตขึ้นเรื่อยๆ ได้เร็วพอที่จะเป็น มูลค่าให้กับธุรกิจ อันที่จริง การสำรวจ 2020 พบว่าผู้เชี่ยวชาญด้านวิทยาศาสตร์ข้อมูลมากกว่าครึ่งมีปัญหาในการแสดงผลกระทบที่วิทยาศาสตร์ข้อมูลมีต่อผลลัพธ์ทางธุรกิจ “การนำเอาข้อมูลวิทยาศาสตร์ข้อมูลมาสู่การผลิต ซึ่งพวกเขาสามารถส่งผลกระทบต่อธุรกิจนั้น ไม่ได้ตรงไปตรงมาเสมอไป” บริษัทซอฟต์แวร์ด้านวิทยาศาสตร์ข้อมูล Anaconda กล่าวในรายงานที่สำรวจผู้คน 2 คน 360 ทั่วโลก . หากมีสิ่งใดที่เข้าใจปัญหา มันไม่ค่อยตรงไปตรงมา ทีมวิทยาศาสตร์ข้อมูลสมัยใหม่เผชิญกับความท้าทายในการทำงานร่วมกันกับ CIO, CTO และหน่วยธุรกิจเพื่อสร้างวงจรชีวิตแบบ end-to-end เพื่อดึงข้อมูลเชิงลึกที่นำไปปฏิบัติได้จริงจากข้อมูล ผู้ให้บริการระบบคลาวด์ชั้นนำและบริษัทสตาร์ทอัพต่างเดินหน้าบรรลุเป้าหมายนี้ด้วยการนำเสนอแพลตฟอร์มและซอฟต์แวร์การประมวลผลแบบเร่งความเร็วเพื่อเร่งกระบวนการวิเคราะห์และประมวลผลข้อมูล รายงานของอนาคอนดาแนะนำว่า “การนำเอาผลลัพธ์ด้านวิทยาศาสตร์ข้อมูลมาสู่การผลิตจะมีความสำคัญมากขึ้นเรื่อยๆ ทำให้ผู้นำและนักวิทยาศาสตร์ด้านข้อมูลต้องขจัดอุปสรรคในการปรับใช้และนักวิทยาศาสตร์ด้านข้อมูลเพื่อเรียนรู้วิธีสื่อสารคุณค่าของงานของพวกเขา” It Takes a Village: Speeding Full-Stack Data Science องค์กรบางแห่งจะเร่งผลตอบแทนจากการลงทุนด้าน AI ด้วยการสร้างโครงสร้างพื้นฐานที่ใช้ร่วมกันแบบรวมศูนย์ในระดับซูเปอร์คอมพิวเตอร์ คนอื่นๆ เลือกวิธีการแบบไฮบริด ผสมผสานโครงสร้างพื้นฐานของคลาวด์และศูนย์ข้อมูลเข้าด้วยกัน ทุกคนกำลังทำงานเพื่ออำนวยความสะดวกในการดูแลและปรับขนาดผู้มีความสามารถด้านวิทยาศาสตร์ข้อมูล เพื่อแบ่งปันแนวทางปฏิบัติที่ดีที่สุด และเพื่อเร่งการแก้ปัญหา AI ที่ซับซ้อน NVIDIA ทำงานร่วมกับผู้ให้บริการระบบคลาวด์และผู้ผลิตเซิร์ฟเวอร์ชั้นนำทั้งหมด เพื่อช่วยบริษัทในการแปลงและวิเคราะห์ชุดข้อมูลที่ซับซ้อน และใช้การเรียนรู้ของเครื่องเพื่อทำการวิเคราะห์โดยอัตโนมัติ ความร่วมมือหลายอย่างเหล่านี้ใช้แพลตฟอร์มการประมวลผลแบบเร่งความเร็วที่รวมทั้งฮาร์ดแวร์และซอฟต์แวร์เพื่อเร่งความเร็วของวิทยาศาสตร์ข้อมูล หัวใจสำคัญของงานนี้ก็คือ RAPIDS ซึ่งเป็นชุดของไลบรารีซอฟต์แวร์โอเพ่นซอร์สและ API เพื่อใช้งานวิทยาศาสตร์ข้อมูลแบบ end-to-end และไปป์ไลน์การวิเคราะห์ทั้งหมดบน NVIDIA GPUs Walmart เป็นหนึ่งในนักประดิษฐ์ที่มีส่วนร่วมในแพลตฟอร์มและปรับใช้ RAPIDS ภายใน ผู้นำ supercenter ระดับโลกกำลังใช้ AI เพื่อปรับปรุงทุกอย่างตั้งแต่ประสบการณ์ของลูกค้า การสต๊อกสินค้า ไปจนถึงการกำหนดราคา ด้วยการซ่อนความซับซ้อนของการทำงานกับ GPU และโปรโตคอลการสื่อสารเบื้องหลังภายในสถาปัตยกรรมศูนย์ข้อมูล RAPIDS จะสร้างวิธีง่ายๆ ในการทำให้วิทยาศาสตร์ข้อมูลเสร็จสิ้น เนื่องจากนักวิทยาศาสตร์ด้านข้อมูลจำนวนมากขึ้นใช้ Dask ไลบรารีที่ยืดหยุ่นสำหรับการประมวลผลแบบคู่ขนานใน Python และภาษาระดับสูงอื่นๆ การเร่งความเร็วโดยไม่ต้องเปลี่ยนโค้ดจึงจำเป็นต่อการปรับปรุงเวลาในการพัฒนาอย่างรวดเร็ว Accelerated Data Science เร่งความสำเร็จของธุรกิจ มีองค์กรที่ประสบความสำเร็จเพียงไม่กี่แห่งที่ดำเนินงานโดยไม่มีฝ่ายการเงิน ทรัพยากรบุคคล หรือทีมการตลาด วิทยาศาสตร์ข้อมูลแบบเร่งรัดกำลังกลายเป็นหน้าที่ที่สำคัญไม่แพ้กัน เนื่องจากองค์กรต่างๆ ตระหนักดีว่าข้อมูลของพวกเขาคือกุญแจสำคัญในการดึงดูดลูกค้าให้มากขึ้น บรรดาผู้ที่ยังไม่ได้เพิ่มความเชี่ยวชาญด้านวิทยาศาสตร์ข้อมูลให้กับธุรกิจของพวกเขากำลังดำเนินการอยู่ในความมืด ในขณะที่คู่แข่งกำลังใช้วิทยาศาสตร์ข้อมูลเพื่อนำโอกาสใหม่ ๆ มาสู่แสงสว่าง ในทุกอุตสาหกรรม นักวิทยาศาสตร์ด้านข้อมูลต่างกระตือรือร้นที่จะนำทรัพย์สินที่มีค่าที่สุดของบริษัทไปใช้ในการทำงาน ตั้งแต่วิศวกรรมข้อมูลไปจนถึงการนำโมเดล AI ไปใช้ในการผลิต วิทยาศาสตร์ข้อมูลแบบเร่งความเร็วช่วยให้องค์กรต่างๆ มีความเร็วที่จำเป็นในการทดสอบแนวคิดเพิ่มเติม ค้นหาคำตอบเพิ่มเติม และขับเคลื่อนความสำเร็จ เกี่ยวกับผู้เขียน Scott McClellan เป็นหัวหน้าฝ่าย Data Science ที่ NVIDIA ก่อนร่วมงานกับ NVIDIA สกอตต์เคยเป็นหัวหน้าเจ้าหน้าที่เทคโนโลยีของ PRGX Inc. เขาเป็นหัวหน้านักเทคโนโลยีและเป็นผู้นำด้านวิศวกรรมและการพัฒนาผลิตภัณฑ์ในบริษัทต่างๆ ซึ่งรวมถึง RedHat และ HP ซึ่งเขาได้แนะนำกลยุทธ์ในโซลูชัน HPC, คลาวด์, บิ๊กดาต้า และ AI สกอตต์สำเร็จการศึกษาระดับปริญญาตรีวิทยาศาสตร์จากมหาวิทยาลัยไอโอวา ลงทะเบียนเพื่อรับจดหมายข่าว InsideBIGDATA ฟรี เข้าร่วมกับเราบน Twitter: @InsideBigData1 – https://twitter.com/InsideBigData1

  • บ้าน
  • Business
  • Data science
  • Marketing
  • Leave a Reply

    Your email address will not be published. Required fields are marked *

    Back to top button