Data science

AI Mindset ใหม่สำหรับ AutoML จะทำให้การเรียนรู้เชิงลึกเข้าถึงได้ง่ายขึ้นได้อย่างไร

ในคุณสมบัติพิเศษของแขกรับเชิญนี้ Yonatan Geifman ซีอีโอและผู้ร่วมก่อตั้ง Deci อภิปรายว่าแมชชีนเลิร์นนิงอัตโนมัติ (หรือ AutoML) สามารถ “ทำให้วิทยาศาสตร์ข้อมูลเป็นประชาธิปไตย” ได้อย่างไรโดยค่อยๆ ปรับใช้ระบบอัตโนมัติในระดับต่างๆ Yonatan เป็นผู้ร่วมก่อตั้ง Deci หลังจากสำเร็จการศึกษาระดับปริญญาเอกด้านวิทยาการคอมพิวเตอร์ที่ Technion-Israel Institute of Technology งานวิจัยของเขามุ่งเน้นไปที่การทำให้ Deep Neural Networks (DNNs) สามารถใช้งานได้มากขึ้นสำหรับงานที่มีความสำคัญต่อภารกิจ ในระหว่างการศึกษา Yonatan ยังเป็นสมาชิกของทีม MorphNet ของ Google AI ด้วย งานวิจัยของเขาได้รับการตีพิมพ์และนำเสนอในการประชุมชั้นนำทั่วโลก ซึ่งรวมถึงการประชุมเกี่ยวกับระบบประมวลผลข้อมูลประสาท (NeurIPS) การประชุมระหว่างประเทศเกี่ยวกับการเรียนรู้ด้วยเครื่อง (ICML) และการประชุมนานาชาติด้านการเรียนรู้ตัวแทน (ICLR) แมชชีนเลิร์นนิงอัตโนมัติหรือ AutoML ได้สร้างความตื่นเต้นมากมายในฐานะหนทางสู่ “การทำให้วิทยาศาสตร์ข้อมูลเป็นประชาธิปไตย” และยังพบกับความสงสัยจากผู้เฝ้าประตูของวิทยาศาสตร์ข้อมูลอีกด้วย ความซับซ้อนของการสนทนามากยิ่งขึ้นไปอีกคือไม่มีคำจำกัดความมาตรฐานของ AutoML ซึ่งทำให้การโต้วาทียากต่อการปฏิบัติตามอย่างเหลือเชื่อ แม้แต่ผู้รอบรู้ เป้าหมายตรงไปตรงมาเพียงพอ: ด้วยการเปิดรับแนวคิด AI ใหม่และองค์ประกอบหลักของการออกแบบอัลกอริธึมอัตโนมัติ AutoML สามารถทำให้แมชชีนเลิร์นนิงเข้าถึงผู้ใช้ในแถบต่างๆ ได้มากขึ้น รวมถึงบุคคลทั่วไป สตาร์ทอัพขนาดเล็ก และองค์กรขนาดใหญ่ โดยเฉพาะอย่างยิ่ง AutoML สามารถทำให้การเรียนรู้เชิงลึก ซึ่งเป็นชุดย่อยที่ซับซ้อนกว่าของแมชชีนเลิร์นนิง เข้าถึงได้โดยนักวิทยาศาสตร์ด้านข้อมูล แม้ว่าจะมีลักษณะที่ซับซ้อนกว่าก็ตาม นั่นคือข้อเสนอด้านคุณค่าที่น่าดึงดูด ซึ่งรับประกันประสิทธิภาพ การประหยัดต้นทุน และโอกาสในการสร้างรายได้อย่างที่ไม่เคยมีมาก่อน นอกจากนี้ยังช่วยอธิบายว่าทำไมตลาด AutoML จะเติบโตอย่างมากในอีกไม่กี่ปีข้างหน้า ตามการคาดการณ์ของ P&S Intelligence ตลาด AutoML ทั่วโลกกำลังเติบโตอย่างรวดเร็วจาก $2696 ล้านใน 2019 มากกว่า $.5 พันล้านโดย 2030 – ก้าวหน้าที่ CAGR มากกว่า 40%. แต่อะไรจะเกิดขึ้นภายใต้ตลาดที่เติบโตอย่างรวดเร็วนี้? ไม่มีคำตอบที่เรียบร้อยและเรียบง่าย เพื่อให้เข้าใจ AutoML มากขึ้น เราควรตรวจสอบเป็นสเปกตรัม ไม่ใช่แบบขาวดำอย่างอิสระหรือแบบควบคุมเองทั้งหมด พิจารณาอุตสาหกรรมยานยนต์ที่ซึ่งเอกราชแบ่งออกเป็นระดับต่างๆ ตั้งแต่ระดับ 1 (เทคโนโลยีช่วยเหลือผู้ขับขี่) ไปจนถึงระดับ 5 (รถยนต์ที่ขับเคลื่อนด้วยตัวเองเต็มรูปแบบ ซึ่งยังมีโอกาสอีกมาก) การคิดถึง AutoML ในลักษณะนี้ถือเป็นเครื่องเตือนใจที่มีประโยชน์ – การสร้างแบบจำลอง AI แบบอัตโนมัติไม่ใช่ข้อเสนอทั้งหมดหรือไม่มีเลย มาดูสเกลที่สำเร็จการศึกษาอย่างละเอียดยิ่งขึ้นซึ่งกำหนดนิยามใหม่ของไปป์ไลน์ AI ระดับ 0: ไม่มีการทำงานอัตโนมัติ ตามคำจำกัดความ กระบวนการเรียนรู้เชิงลึกแบบแมนนวลทั้งหมดอาศัยชุดทักษะของนักวิทยาศาสตร์ข้อมูลและผู้เชี่ยวชาญอื่นๆ ในการดำเนินการตามกระบวนการที่สำคัญ ซึ่งรวมถึงการเขียนโปรแกรมโครงข่ายประสาทเทียม การจัดการข้อมูล การค้นหาสถาปัตยกรรม และอื่นๆ ระดับของทักษะที่จำเป็นในการทำงานเหล่านี้เป็นสิ่งที่น่าเกรงขาม ซึ่งช่วยให้อธิบายได้ว่าทำไมการเรียนรู้เชิงลึก (พร้อมกับความสามารถที่มีราคาแพงที่จำเป็นในการนำไปใช้) จึงได้รับการพิสูจน์แล้วว่าเข้าใจยากสำหรับหลายองค์กร ระดับ 1: กรอบงาน DL ระดับสูง แม้ว่าการนำ DL ไปใช้ด้วยตนเองตั้งแต่ต้นจะทำให้เกิดอุปสรรคมากมาย แต่งานที่สะสมมาของโปรแกรมเมอร์ DL และนักวิทยาศาสตร์ด้านข้อมูลได้นำไปสู่การสร้างกรอบงานระดับสูง เช่น Caffe, TensorFlow และ PyTorch ซึ่งให้บริการโมเดล DL และ ไปป์ไลน์สำหรับผู้ใช้ในการเขียนเครือข่ายของตนเองและอื่น ๆ เช่นเดียวกับการขับขี่อัตโนมัติระดับ 1 ซึ่งครอบคลุมระบบช่วยเหลือผู้ขับขี่ขั้นสูง (ADAS) ได้ให้ประโยชน์มากมายแก่ผู้ขับขี่ทั่วไป ในขณะที่ยังคงห่างไกลจากความเป็นอิสระเต็มรูปแบบ ไลบรารี DL ระดับสูงเหล่านี้ทำให้ไปป์ไลน์ DL ง่ายขึ้นและมีประสิทธิภาพมากขึ้น การใช้งานยังคงต้องใช้ความเชี่ยวชาญระดับสูงในการเขียนโปรแกรมและ DL แต่ไม่จำเป็นต้องมีความเชี่ยวชาญด้านวิทยาศาสตร์ข้อมูลระดับปริญญาเอก ทำให้หลายองค์กรเข้าถึงได้ง่ายขึ้น ระดับ 2: การแก้ปัญหา Set การใช้ประโยชน์จากโมเดลที่ได้รับการฝึกอบรมล่วงหน้าควบคู่ไปกับการถ่ายโอนการเรียนรู้ทำให้ได้กระบวนการอัตโนมัติมากขึ้น ระบบอัตโนมัติระดับนี้สร้างขึ้นจากความพร้อมใช้งานของโมเดลที่ได้รับการฝึกอบรม เช่น ที่เก็บโอเพนซอร์สและข้อมูลที่มีป้ายกำกับ ซึ่งจะถูกปรับแต่งเพื่อแก้ปัญหาที่กำหนด อีกครั้ง ขั้นตอนนี้ไม่ได้ลบล้างความต้องการความเชี่ยวชาญด้านข้อมูล โดยอาศัยวิศวกรในการประมวลผลข้อมูลล่วงหน้าและปรับแต่งโมเดลตามงานที่ทำอยู่ ระดับ 3: AutoML พร้อม NAS Neural Architecture Search (NAS) เป็นฟิลด์ที่เกิดขึ้นใหม่ซึ่งอัลกอริธึมจะสแกนโมเดล AI ที่มีอยู่หลายพันตัวเพื่อให้ได้อัลกอริทึมที่เหมาะสมสำหรับงานที่กำหนด กล่าวอีกนัยหนึ่งคือ AI ถูกนำไปสร้าง AI ที่ดียิ่งขึ้น แม้ว่า NAS จะเป็นบริษัทยักษ์ใหญ่ด้านเทคโนโลยีอย่าง Google, Facebook และสถาบันการศึกษาที่สำคัญๆ เช่น Stanford University แต่เพียงผู้เดียว นวัตกรรมเพิ่มเติมในสาขานี้จะทำให้เกิดความสามารถในการปรับขนาดและความสามารถในการจ่ายที่มากขึ้น เปิดแอปพลิเคชันที่มีมูลค่าสูงมากมาย รวมถึงการวิเคราะห์ทางการแพทย์ที่ซับซ้อนยิ่งขึ้น ภาพ เป็นต้น ระดับ 4: ระบบอัตโนมัติเต็มรูปแบบ เมื่อไปป์ไลน์การเรียนรู้เชิงลึกเป็นแบบอัตโนมัติทั้งหมด meta-models จะตั้งค่าพารามิเตอร์ที่จำเป็นสำหรับงานที่กำหนด จากข้อมูลการฝึกอบรม เมตาโมเดลสามารถประดิษฐ์สถาปัตยกรรมที่เหมาะสมซึ่งจำเป็นสำหรับงานที่ทำอยู่ ตลอดจนให้ความรู้ก่อนหน้านี้เกี่ยวกับไฮเปอร์พารามิเตอร์ของสถาปัตยกรรม แม้ว่าระบบอัตโนมัติเต็มรูปแบบจะยังเหลือเวลาอีกหลายปี แต่การทำงานไปสู่โมเดลเมตาจะช่วยเพิ่มประสิทธิภาพและความซับซ้อนได้อย่างมาก แม้กระทั่งในระดับที่ต่ำกว่าของความเป็นอิสระ (เช่นเดียวกับที่นักประดิษฐ์ที่ทำงานเพื่อพัฒนารถยนต์ที่ขับด้วยตนเองในท้ายที่สุดได้นำเสนอการปรับปรุงเทคโนโลยียานยนต์แล้ว) . เนื่องจากแต่ละระดับของความเป็นอิสระสร้างขึ้นจากระดับอื่น โมเดล NAS จะมีบทบาทสำคัญในการค้นหาโมเดลเมตาที่เหมาะสมเพื่อเรียกใช้ในแต่ละกรณีการใช้งาน การทำให้ Deep Learning เข้าถึงผู้ชมได้กว้างขึ้น แม่นยำว่าต้องใช้เวลานานแค่ไหนกว่าที่ระบบอัตโนมัติเต็มรูปแบบจะสามารถทำได้ยังคงเห็นอยู่ แต่ด้วยการเรียนรู้เชิงลึกที่เข้าถึงได้มากขึ้นในฐานะที่เป็นดาวเด่น นักพัฒนา AI กำลังเปิดรับแนวคิดใหม่และปูทางไปสู่อนาคตที่งานที่ยุ่งยากและเสียค่าใช้จ่ายมากที่สุดในวงจรชีวิต AI จะล้าสมัย เป็นการปลดปล่อยความก้าวหน้าของ AI รุ่นใหม่ ในท้ายที่สุด ไม่ว่าเราจะกำหนด AutoML อย่างไร เป้าหมายก็คือทำให้ผู้ที่ต้องการการเรียนรู้เชิงลึกเข้าถึงได้มากขึ้น ซึ่งหมายความว่าทำให้การใช้งานง่ายขึ้นเพื่อให้บริษัทใด ๆ ไม่ว่าใหญ่หรือเล็กสามารถผลิต AI ได้ ลงทะเบียนเพื่อรับจดหมายข่าว InsideBIGDATA ฟรี เข้าร่วมกับเราบน Twitter: @InsideBigData1 – https://twitter.com/InsideBigData1

  • บ้าน
  • Business
  • Data science
  • Marketing
  • Leave a Reply

    Your email address will not be published. Required fields are marked *

    Back to top button