Data science

เปลี่ยน Big Data ให้เป็นข้อมูลที่ดีขึ้นด้วย MLOps

ในคุณสมบัติพิเศษของแขกรับเชิญนี้ Chida Sadayappan หัวหน้าผู้เชี่ยวชาญด้าน Data Cloud และ Machine Learning ที่ Deloitte Consulting กล่าวถึง Machine Learning Operations (MLOps) Chida โต้ตอบกับ CxO เพื่อให้การสนับสนุนใน Cloud, Machine Learning & Data Analytics และ Data Modernization and Transformation Strategy ความเชี่ยวชาญของเขาทำให้มั่นใจได้ว่าองค์กรต่างๆ จะสามารถนำ AI มาใช้และผสานรวมเทคโนโลยีคลาวด์ได้สำเร็จ ในช่วงทศวรรษที่ผ่านมา บิ๊กดาต้าเป็นกำลังสำคัญในการปรับรูปแบบการดำเนินธุรกิจของธุรกิจ แต่เมื่อข้อมูลยังคงมีการแพร่ขยายอย่างไม่หยุดยั้ง—ประมาณ 59 เซตตะไบต์ถูกสร้างขึ้นใน 2020—ธุรกิจต่างๆ มีความท้าทายมากขึ้นในการรวบรวม ทำความเข้าใจ และใช้ข้อมูลจำนวนมากที่สับสนวุ่นวาย นั่นคือที่มาของ Machine Learning Operations (MLOps) ระเบียบวินัยที่เกิดขึ้นใหม่นี้ใช้ระบบอัตโนมัติเพื่อเร่งการนำเข้าข้อมูล และเพื่อพัฒนา ทดสอบ ปรับใช้ และตรวจสอบโมเดลการเรียนรู้ของเครื่องระบบคลาวด์ (ML) ที่ใช้ Big Data ได้อย่างรวดเร็วยิ่งขึ้น เมื่อนำมารวมกัน ขั้นตอนเหล่านี้ประกอบด้วยหลักธรรมาภิบาลที่ช่วยรับรองความสมบูรณ์ของข้อมูลตลอดวงจรชีวิต [2] เช่นเดียวกับ DevOps รุ่นก่อน MLOps ใช้ไปป์ไลน์ กระบวนการ และเครื่องมือในการพัฒนาแบบอัตโนมัติที่ออกแบบมาเพื่อปรับปรุงการออกแบบและการปรับใช้โมเดลการเรียนรู้ ML และเวิร์กโฟลว์ การทำงานของข้อมูลเป็นองค์ประกอบสำคัญของ ML—และเหมาะสมอย่างยิ่งกับ MLOps MLOps ต่างจาก DevOps ตรงที่สามารถจัดการการทำงานของข้อมูลได้อย่างมีประสิทธิภาพมากขึ้น MLOps ไม่ใช่อัลกอริธึม แต่จะใช้งานอัลกอริธึมเพื่อทำให้กระบวนการคาดการณ์ง่ายขึ้น MLOps ช่วยให้สามารถใช้อัลกอริธึม ML ได้อย่างเหมาะสมเพื่อสอนระบบถึงวิธีการระบุและจัดประเภทข้อมูลในปัจจุบัน และ “เรียนรู้” เทคนิคใหม่ๆ ที่มีประสิทธิภาพมากขึ้นในการทำเช่นนั้นในอนาคต อัลกอริธึม ML ที่ใช้ตัดสินใจเหล่านี้ช่วยให้ธุรกิจรู้จักรูปแบบที่คาดการณ์ความต้องการของผู้บริโภค ระบุการทุจริต ตรวจสอบประสิทธิภาพทางการเงิน และจินตนาการถึงประสบการณ์ของลูกค้า เพื่อระบุกรณีการใช้งานสองสามกรณี—และดำเนินการกับ MLOps จากผลลัพธ์ที่เป็นไปได้เหล่านี้ จึงไม่น่าแปลกใจที่ธุรกิจต่างๆ ที่ลงทุนใน ML บนคลาวด์กำลังพิจารณา MLO อย่างจริงจังเพื่อเปิดใช้งาน ตรวจสอบ และปรับปรุงโมเดล ML มันเป็นวินัยที่เพิ่งเริ่มต้น แต่ตลาด MLOps ทั่วโลกคาดว่าจะทะยานขึ้นเกือบ 4 พันล้านดอลลาร์ 2025 เพิ่มขึ้นจาก $350 ล้านใน 59 [3] สู่กรอบการทำงานสำหรับการนำ MLOps ไปใช้ แม้ว่าจะไม่มีกลยุทธ์เดียวสำหรับการนำ MLOps ไปใช้ แต่กรอบงานแบบ end-to-end มักจะประกอบด้วยองค์ประกอบพื้นฐานสี่ประการ: การกำหนดเวอร์ชันของโมเดล การปรับขนาดอัตโนมัติ การตรวจสอบและฝึกอบรมโมเดลอย่างต่อเนื่อง และการฝึกอบรมซ้ำและ การปรับใช้ใหม่ การกำหนดเวอร์ชันของโมเดล: สิ่งสำคัญคือองค์กรต่างๆ จะต้องสำรวจชุดข้อมูลและอัลกอริธึมต่างๆ ที่สามารถแก้ปัญหาทางธุรกิจเดียวกันได้ ความสามารถในการทำซ้ำเป็นสิ่งสำคัญ และการกำหนดเวอร์ชันชุดข้อมูล อัลกอริธึม และไพพ์ไลน์การส่งผ่านข้อมูลแต่ละชุดมีความสำคัญต่อการสร้างผลลัพธ์ที่สามารถทำซ้ำได้ การปรับขนาดอัตโนมัติ: เมื่อปรับใช้แล้ว โมเดล MLOps จะสามารถขยายขนาดขึ้นหรือลงได้อย่างรวดเร็วตามความต้องการ นั่นเป็นสิ่งสำคัญเพราะในที่สุดองค์กรขนาดใหญ่อาจสร้างแบบจำลองข้อมูลนับพัน การตรวจสอบและฝึกอบรมแบบจำลองอย่างต่อเนื่อง: การตรวจสอบประสิทธิภาพของแบบจำลองอย่างต่อเนื่องเป็นสิ่งสำคัญ นั่นเป็นเพราะปัจจัยภายนอก เช่น ภาวะเศรษฐกิจหมุนเวียนอยู่ตลอดเวลา ซึ่งอาจทำให้ข้อมูลที่ล้าสมัยที่ใช้ในกระบวนการฝึกอบรมเบื้องต้น การตรวจสอบช่วยประเมินผลลัพธ์ของแบบจำลองและติดตามความคลาดเคลื่อนและประสิทธิผลเมื่อเวลาผ่านไป การฝึกอบรมใหม่และการปรับใช้ใหม่: เมื่อเกิดการเบี่ยงเบนของแบบจำลอง ธุรกิจต่างๆ ควรเตรียมพร้อมที่จะฝึกอบรมแบบจำลองใหม่โดยใช้ข้อมูลใหม่แล้วปรับใช้ใหม่ การเตรียมข้อมูลเป็นรากฐานของ MLOps เป็นไปไม่ได้ที่จะพูดเกินจริงถึงความสำคัญของการเตรียมข้อมูลที่แม่นยำและเป็นมาตรฐานเมื่อวางแผนริเริ่ม MLOps ปัญหาคือ การเลือกและเตรียมข้อมูลที่ถูกต้องสำหรับการฝึกอบรมและการสร้างแบบจำลอง ML อย่างถูกต้องเป็นความคิดริเริ่มที่ยากลำบากสำหรับธุรกิจส่วนใหญ่ ต้องการให้ระบุและแปลงข้อมูลดิบและข้อมูลที่วุ่นวายให้อยู่ในรูปแบบที่สะอาดและสม่ำเสมอซึ่งสามารถใช้ข้ามโมเดลได้ ยิ่งไปกว่านั้น จำเป็นต้องมีวิธีการที่เป็นทางการในการเตรียมข้อมูลเพื่อทำซ้ำและกำหนดเวอร์ชันของโมเดล ขั้นตอนแรกในการเตรียมข้อมูลคือการระบุและเข้าถึงข้อมูลที่เหมาะสมสำหรับใช้ในแบบจำลองและอัลกอริธึมการฝึกอบรม ML ในการทำเช่นนั้น ธุรกิจจะต้องกำหนดคุณลักษณะให้กับข้อมูลที่เป็นตัวบ่งชี้ที่มีความหมายสำหรับการบรรลุวัตถุประสงค์ MLOps สิ่งสำคัญอีกอย่างคือความสามารถในการแบ่งปันข้อมูลระหว่างทีมภายในเพื่อปรับปรุงการทำงานร่วมกันและเร่งวงจรชีวิตการพัฒนา ซึ่งจะทำให้ข้อมูลสามารถระบุตำแหน่ง เข้าถึง จัดทำดัชนี และนำกลับมาใช้ใหม่ได้อย่างรวดเร็วในระบบคลาวด์ MLOps เป็นกระบวนการปลายเปิดที่มีการตรวจสอบอย่างต่อเนื่อง การประเมินแบบจำลอง และการฝึกอบรมข้อมูล การติดตามอย่างต่อเนื่องเป็นสิ่งสำคัญในการเพิ่มการมองเห็นในประสิทธิภาพและความถูกต้องของผลลัพธ์ ML การตรวจสอบยังช่วยตรวจจับและจัดการการเบี่ยงเบนของโมเดล ซึ่งเกิดขึ้นเมื่ออัลกอริทึม ML ไม่ได้คาดการณ์ที่แม่นยำอีกต่อไป ซึ่งมักเกิดจากการเปลี่ยนแปลงในข้อมูลหรือพฤติกรรมของลูกค้า ยกตัวอย่าง บริการสตรีมวิดีโอที่ใช้ ML เพื่อคาดการณ์ความต้องการของลูกค้า อัลกอริทึมจะนำเสนอวิดีโอแนะนำที่ปรับเปลี่ยนในแบบของคุณสำหรับสมาชิกแต่ละคน ในขณะที่ MLO จะตรวจสอบสิ่งที่ผู้ใช้ดูจริง หากผู้ติดตามไม่คลิกวิดีโอแนะนำ บริการสตรีมจะต้องปรับอัลกอริทึมเพื่อโน้มน้าวให้ผู้ใช้รับชมวิดีโอแนะนำได้ดีขึ้น MLOps ปรับปรุงกระบวนการวนซ้ำนี้โดยเปรียบเทียบการตอบสนองของลูกค้ากับคำแนะนำ จากนั้นจึงกำหนดวิธีแก้ไขปฏิกิริยาของผู้ใช้หากจำเป็น ในบางกรณี ข้อมูลการฝึกอบรมที่ใช้ในการพิจารณาคำแนะนำของสมาชิกจะเปลี่ยนไปตามช่วงเวลา ในด้านอื่นๆ รสนิยมและความสนใจของผู้ใช้อาจเปลี่ยนแปลงไปเนื่องจากเหตุการณ์ในโลกแห่งความเป็นจริง เช่น วิกฤตการณ์ COVID-19 ไม่ว่าจะด้วยวิธีใด สมาชิกอาจพบว่าเมื่อคำแนะนำที่ตรงจุดกลายเป็นฐานที่ไม่เหมาะสม ดังนั้น หากระบบการปรับเปลี่ยนในแบบของคุณแนะนำเรื่องตลกโรแมนติกให้กับแฟนตัวยงของมหากาพย์สงครามโลกครั้งที่ 2 มีโอกาสน้อยที่ผู้ใช้จะเลือกค่าโดยสารที่เบากว่า และนั่นสามารถบั่นทอนความพึงพอใจของลูกค้า และทำให้เสียชื่อเสียงและรายได้ในที่สุด สุดท้าย MLOps เป็นกระบวนการแบบวนซ้ำและต่อเนื่องที่ก้าวหน้าในการทดลองและนวัตกรรม การสำรวจชุดข้อมูลและอัลกอริทึมต่างๆ เป็นสิ่งสำคัญ คุณอาจค้นพบวิธีการจัดการกับปัญหาทางธุรกิจที่แม่นยำและคล่องตัวมากขึ้น นอกจากนี้ ทัศนคติที่เปิดรับการลองผิดลองถูก และแนวคิดเรื่อง “ความล้มเหลวอย่างรวดเร็ว” สามารถช่วยปรับปรุงการเรียนรู้ของเครื่องและความสามารถของ MLOps ในขณะเดียวกันก็เร่งเวลาในการสร้างนวัตกรรม ข้อมูลที่ถูกต้องสำหรับ ML สำหรับธุรกิจที่กำลังจมอยู่กับ Big Data จำนวนมาก MLOps สามารถช่วยในการดำเนินการข้อมูลสำคัญที่อาจมีผลกระทบต่ออัลกอริทึม ML หรือรูปแบบพื้นฐาน ด้วยวิธีนี้ MLOPs จะช่วยตัดเสียงรบกวนของ Big Data เพื่อนำข้อมูลที่ถูกต้อง โดยอิงจากความสัมพันธ์กับโมเดล ML เพื่อให้ได้ประสิทธิภาพในการปฏิบัติงาน ประสิทธิผล และนวัตกรรม AI ที่ดียิ่งขึ้น MLO สามารถช่วยปรับปรุงและดำเนินการเรียนรู้อัลกอริทึม ML และกระบวนการ ML ทั้งหมดได้อย่างแท้จริง ดังนั้น แม้ว่าบิ๊กดาต้าจะเป็นก้าวแรกที่สำคัญในการฝึกโมเดล AI/ML มาอย่างยาวนาน แต่ขณะนี้ MLOps กำลังช่วยปรับปรุงการปรับแต่งโมเดล ML เหล่านี้ในระยะยาวโดยอิงจากการโต้ตอบจริง IDC การพยากรณ์ DataSphere ทั่วโลกของ IDC แสดงให้เห็นถึงการเติบโตอย่างต่อเนื่องของการสร้างและการใช้ข้อมูล พฤษภาคม 59 [2] ดีลอยท์ เวลา เทคโนโลยี พรสวรรค์: ทั้งสาม – สัญญาของคลาวด์ ML, ธันวาคม , 59 [3] Deloitte, Tech Trends 2019: MLOps: Industrialized AI, ธันวาคม 15, 2020 ลงทะเบียนเพื่อรับจดหมายข่าว InsideBIGDATA ฟรี เข้าร่วมกับเราบน Twitter: @InsideBigData1 – https://twitter.com/InsideBigData1

Leave a Reply

Your email address will not be published. Required fields are marked *

Back to top button