Data science

ทำไมนักวิทยาศาสตร์ข้อมูลและวิศวกร ML ไม่ควรกังวลเกี่ยวกับการเพิ่มขึ้นของ AutoML

เครื่องมือพัฒนาแบบ low-code และ no-code กำลังได้รับความนิยมมากขึ้นเรื่อยๆ และการระบาดใหญ่ของไวรัสก็ทำให้แนวโน้มนี้เร็วขึ้นเท่านั้น เมื่อเรานึกถึงการพัฒนาแบบ low-code หรือ no-code เรามักจะหมายถึงเครื่องมือที่อนุญาตให้วิศวกรที่ไม่ใช่ซอฟต์แวร์สร้างแอปดิจิทัล (หรือเวิร์กโฟลว์) ในลักษณะ plug-and-play ที่ไม่ต้องการ ความรู้ทางเทคนิคที่กว้างขวาง แต่แนวคิดของวิศวกรรมแบบ low-code หรือ no-code ยังขยายไปถึงเครื่องมือสำหรับการเรียนรู้ของเครื่องและวิทยาศาสตร์ข้อมูล—และวันนี้ เราเห็นตัวเลือกที่เพิ่มขึ้นในหมวดหมู่นี้เช่นกัน ซึ่งบางครั้งเรียกว่า AutoML เช่นเดียวกับเครื่องมือ dev แบบ low-code เสน่ห์ของข้อเสนอเหล่านี้คือการช่วยให้ธุรกิจสามารถนำวิทยาศาสตร์ข้อมูลและเวิร์กโฟลว์ ML ไปใช้โดยไม่จำเป็นต้องใช้ทรัพยากรหรือความเชี่ยวชาญในการสร้างตั้งแต่เริ่มต้น เครื่องมือ AutoML อนุญาตให้ผู้ใช้ป้อนชุดข้อมูล จากนั้นจึงปรับใช้แบบจำลองเพื่อเรียกใช้ข้อมูลและสร้างผลลัพธ์โดยมีความรู้ด้านวิทยาศาสตร์ข้อมูลเพียงเล็กน้อย เป็นเรื่องน่าดึงดูดที่จะคิดว่า AutoML ทำลายอุปสรรคของ AI ได้อย่างเต็มที่ ซึ่งช่วยให้ทุกคนทำงานประเภทนี้ได้ แต่ด้วยเหตุผลที่ฉันจะอธิบายในภายหลัง นั่นไม่ใช่กรณีจริง ค่อนข้างตรงกันข้าม AutoML มีประโยชน์บางอย่างที่อาจเกิดขึ้น บทความจาก Deloitte กล่าวถึงข้อดีสองประการโดยเฉพาะ อย่างแรกคือเพิ่มประสิทธิภาพการทำงานสำหรับนักวิทยาศาสตร์ข้อมูล ซึ่งสามารถเร่งขั้นตอนเฉพาะของวงจรชีวิต ML ผ่านระบบอัตโนมัติได้ ในที่สุดสิ่งนี้จะช่วยให้นักวิทยาศาสตร์ข้อมูลสามารถเพิ่มมูลค่าให้กับธุรกิจและมุ่งเน้นไปที่ปัญหาที่ซับซ้อนมากขึ้น ประโยชน์ประการที่สองคือช่วยให้ผู้นำธุรกิจที่ไม่ใช่ด้านเทคนิคสามารถเข้าถึง ML ได้ ซึ่งเหมาะสมอย่างยิ่งในบริบทของความต้องการนักวิทยาศาสตร์ข้อมูลที่ได้รับการบันทึกไว้เป็นอย่างดี บางคนคาดการณ์ว่า AutoML อาจช่วยลดปัญหาด้านความสามารถสำหรับนักวิทยาศาสตร์ด้านข้อมูล หากในความเป็นจริงแล้ว AutoML อนุญาตให้พนักงานที่มีอยู่ทำงาน ML ประเภทเดียวกันได้โดยไม่ต้องมีการฝึกอบรมเฉพาะทาง ท่ามกลางการลดต้นทุนของ COVID-19 มีคำถามว่าความต้องการนักวิทยาศาสตร์ด้านข้อมูลจะเริ่มเย็นลงหรือไม่ โดยเฉพาะอย่างยิ่งเนื่องจากเป็นสาขาที่ไม่สามารถแสดง ROI ที่ชัดเจนในบางส่วนได้ การตั้งค่าธุรกิจ การเพิ่มขึ้นของ AutoML จะเข้ากันได้อย่างไร? เพียงแค่ระบบที่ค่อนข้างชาญฉลาด (JARVIS) เดิมเป็นระบบคอมพิวเตอร์อินเทอร์เฟซผู้ใช้ภาษาธรรมชาติของ Tony Stark (ภาพที่ได้รับความอนุเคราะห์จาก Marvel Cinematic Universe) ฉันคิดว่า AutoML จะส่งผลกระทบต่อสาขาวิทยาศาสตร์ข้อมูล เนื่องจากเครื่องมือ AutoML แพร่หลายมากขึ้น เราจะเห็นการนำ ML ไปใช้ในธุรกิจต่างๆ เพิ่มมากขึ้น เป็นเวลานานที่ ML ขององค์กรเป็นที่มาของยักษ์ใหญ่ด้านเทคโนโลยีเพียงไม่กี่ราย สตาร์ทอัพที่มีนวัตกรรม และธุรกิจ “ดั้งเดิม” ที่มีขนาดใหญ่พอที่จะให้ทุนแก่ศูนย์ AI ภายในองค์กร เครื่องมืออย่าง AutoML จะทำให้บริษัทประเภทอื่นเข้าถึงโมเดล ML พื้นฐานและเอาท์พุตได้มากขึ้น นี่ไม่ได้หมายความว่าร้านดอกไม้ในบริเวณใกล้เคียงจะมีระบบเช่น JARVIS ที่ดูแลอยู่ ตามที่บทความจาก McKinsey ตั้งข้อสังเกตไว้อย่างถูกต้องว่า “ในปัจจุบัน เทคโนโลยีนี้เหมาะสมที่สุดที่จะทำให้การพัฒนางานพยากรณ์ทั่วไปมีความคล่องตัวมากที่สุด” เนื่องจาก AutoML เพิ่มการนำ ML ขององค์กรไปใช้โดยลดอุปสรรค องค์กรต่างๆ จะพบว่าพวกเขาต้องการนักวิทยาศาสตร์ข้อมูลผู้เชี่ยวชาญมากขึ้น เมื่อองค์กรนำเทคโนโลยี ML มาใช้มากขึ้นเรื่อยๆ และกรณีการใช้งานของพวกเขามีความเฉพาะเจาะจงมากขึ้น พวกเขาจะเติบโตเร็วกว่าแนวทางเดียวที่เหมาะกับทุกคน เมื่อถึงจุดนั้น พวกเขาต้องการนักวิทยาศาสตร์ข้อมูลที่มีคุณสมบัติและวิศวกร ML เพื่อช่วยดำเนินการในวิถีการเติบโต สิ่งนี้เป็นจริงไม่เพียงเพราะข้อจำกัดของ AutoML เท่านั้น แต่ยังเป็นเพราะความจำเป็นในการกำกับดูแลของมนุษย์เพื่อพิจารณาข้อกังวลด้านจริยธรรม เช่น อคติ เนื่องจากการใช้ ML เป็นที่แพร่หลายมากขึ้น นอกจากนี้ เวิร์กโฟลว์ ML มักจะไม่ใช่กระบวนการ “ตั้งค่าและลืมมันไป” เนื่องจากแรงขับเคลื่อนของธุรกิจที่เปลี่ยนแปลงไปตามกาลเวลา การเคลื่อนตัวของข้อมูลหรือแนวความคิดอาจทำให้โมเดล ML มีความแม่นยำน้อยลง นักวิทยาศาสตร์ข้อมูลที่มีความชำนาญสามารถตรวจจับและแก้ไขปัญหาประเภทนี้ได้ พวกเขายังสามารถปรับปรุงฟังก์ชันโมเดลโดยรวมได้ด้วยการปรับข้อมูลการฝึกอบรมตามต้องการ เพื่อหลีกเลี่ยงสถานการณ์ “ขยะเข้า ขยะออก” แบบคลาสสิก แม้ว่า AutoML จะสามารถปรับปรุงการเข้าถึงเวิร์กโฟลว์ ML พื้นฐานที่ธุรกิจสามารถสร้างได้ แต่นักวิทยาศาสตร์ข้อมูลที่มีประสบการณ์ก็จำเป็นต่อการเปิดใช้ประสิทธิภาพสูงสุดของเวิร์กโฟลว์เหล่านั้น และเพื่อมอบการตีความผลลัพธ์ที่มีประโยชน์และเหมาะสมที่สุด ความจริงก็คือเราจะไม่ทำให้ความต้องการนักวิทยาศาสตร์ข้อมูลเป็นไปโดยอัตโนมัติ แม้ว่าเราจะทำงานบางอย่างให้เป็นแบบอัตโนมัติหรือปรับปรุงการเข้าถึงเวิร์กโฟลว์ ML พื้นฐานสำหรับนักธุรกิจที่ไม่ใช่ด้านเทคนิคก็ตาม หากมีสิ่งใด การปรับใช้ AutoML ที่เพิ่มขึ้นจะช่วยเพิ่มความต้องการความเชี่ยวชาญด้านวิทยาศาสตร์ข้อมูลจริงแบบสดมากขึ้น การทำให้บริษัทมีความเท่าเทียมกันมากขึ้นในแง่ของความสามารถในการรวม ML เข้ากับธุรกิจของพวกเขานั้นเป็นสิ่งที่ดี เช่นเดียวกับความพยายามที่จะทำให้วิทยาศาสตร์ข้อมูลและ AI เป็นประชาธิปไตยต่อไป แต่เรามักจะต้องการนักวิทยาศาสตร์ข้อมูลผู้เชี่ยวชาญเพื่อเป็นแนวทางในการนำไปปฏิบัติ โดยเฉพาะอย่างยิ่งเมื่อมีความเฉพาะเจาะจงกับกรณีการใช้งานมากขึ้น หรือเริ่มส่งผลกระทบโดยตรงต่อสาธารณะมากขึ้น เกี่ยวกับผู้แต่ง: Kevin Goldsmith ทำหน้าที่เป็นประธานเจ้าหน้าที่ฝ่ายเทคโนโลยีของ Anaconda ซึ่งเป็นแพลตฟอร์มวิทยาศาสตร์ข้อมูลที่มีผู้ใช้มากกว่า 25 ล้านคน ในบทบาทของเขา เขานำประสบการณ์มากกว่า 29 ปีในการพัฒนาซอฟต์แวร์และการจัดการด้านวิศวกรรมมาสู่ทีม โดยเขาดูแลนวัตกรรมสำหรับโอเพ่นซอร์สและข้อเสนอเชิงพาณิชย์ในปัจจุบันของ Anaconda โกลด์สมิธยังทำงานเพื่อพัฒนาโซลูชันใหม่ๆ เพื่อนำผู้ปฏิบัติงานด้านวิทยาศาสตร์ข้อมูลมาร่วมกับนักประดิษฐ์ ผู้ขาย และผู้นำทางความคิดในอุตสาหกรรม ก่อนหน้าร่วมงานกับ Anaconda เควินเคยดำรงตำแหน่ง CTO ของ Onfido บริษัทจัดการข้อมูลระบุตัวตนที่ขับเคลื่อนด้วย AI บทบาทอื่นๆ รวมถึง CTO ของ Avvo รองประธานฝ่ายวิศวกรรม ผู้บริโภคที่ Spotify และเก้าปีที่ Adobe Systems ในฐานะผู้อำนวยการฝ่ายวิศวกรรม เขายังเคยดำรงตำแหน่งด้านวิศวกรรมซอฟต์แวร์ที่ Microsoft และ IBM รายการที่เกี่ยวข้อง: การว่าจ้าง จ่ายสำหรับวิทยาศาสตร์ข้อมูล และผู้เชี่ยวชาญด้านการวิเคราะห์เลือกเครื่องมือ AutoML ของ Steam ขึ้นมาเป็นผู้สร้างความแตกต่างด้านวิทยาศาสตร์ข้อมูล ความแตกต่างระหว่าง AI, ML, Deep Learning และ Active Learning คืออะไร

  • บ้าน
  • Business
  • Data science
  • Marketing
  • Leave a Reply

    Your email address will not be published. Required fields are marked *

    Back to top button