Data science

9 แนวทางปฏิบัติที่ดีที่สุดที่ผู้นำด้าน Data Science ทุกคนควรปฏิบัติตาม

การเป็นนักวิทยาศาสตร์ข้อมูลนั้นยาก นอกเหนือจากการผสมผสานระหว่างทักษะทางคณิตศาสตร์ขั้นสูงและทักษะการเขียนโค้ดที่จำเป็นสำหรับการทำงานแล้ว ยังเป็นบทบาทที่ใหม่กว่าสำหรับหลายองค์กร ดังนั้นนักวิทยาศาสตร์ด้านข้อมูลจึงถูกเรียกตัวให้ไปสำรวจภูมิทัศน์ขององค์กร จัดหาแหล่งข้อมูลด้านไอทีที่เหมาะสม และสร้างเวิร์กโฟลว์ใหม่ในแผนกต่างๆ งานของตนอย่างมีประสิทธิภาพ แนวทางปฏิบัติที่ดีที่สุดเหล่านี้จะช่วยให้ผู้นำด้านข้อมูลทำงานได้อย่างมีประสิทธิภาพมากขึ้น เป็นผู้นำทางสำหรับนักวิทยาศาสตร์ด้านข้อมูลในอนาคต และสร้างแผนกที่มีนวัตกรรมและประสิทธิผล ปรับการใช้โอเพนซอร์ซให้เหมาะสม เนื่องจากเครื่องมือโอเพนซอร์สเป็นส่วนสำคัญของกลุ่มเทคโนโลยีวิทยาศาสตร์ข้อมูล จึงเป็นสิ่งสำคัญที่เกณฑ์การจ้างงานสะท้อนถึงสิ่งนี้ นักวิทยาศาสตร์ข้อมูลที่มีประสบการณ์ในการสนับสนุนโครงการโอเพนซอร์ซจะมีความเข้าใจที่ดีขึ้นเกี่ยวกับวิธีการประเมินและจัดการเครื่องมือโอเพนซอร์ซโดยดูจากกิจกรรมของรหัส ข้อมูลเมตาของแพ็คเกจ ประวัติการเปิดตัว และผู้มีส่วนร่วมในโครงการ พวกเขาควรเข้าใจด้วยว่าเมื่อใดและอย่างไรที่จะทำการดึงคำขอ หากแพ็คเกจสามารถอัปเดต ปรับปรุง หรือมีความปลอดภัยมากขึ้นเพื่อตอบสนองความต้องการขององค์กร นอกเหนือจากการจ้างนักวิทยาศาสตร์ข้อมูลและนักพัฒนาที่มีความเชี่ยวชาญด้านโอเพ่นซอร์สแล้ว ให้พิจารณาทำงานร่วมกับผู้จำหน่ายที่ให้การสนับสนุนเครื่องมือและไลบรารีโอเพนซอร์ส สร้างวัฒนธรรมที่คำนึงถึงความปลอดภัย เมื่อนักวิทยาศาสตร์ด้านข้อมูลไม่ได้เฝ้าติดตามภัยคุกคามที่อาจเกิดขึ้น ช่องโหว่ก็ค่อยๆ ขยายไปสู่แบบจำลองเมื่อเวลาผ่านไป ผู้นำด้านวิทยาศาสตร์ข้อมูลต้องก้าวขึ้นและร่วมมือกับผู้นำด้านไอทีและความปลอดภัยเพื่อดูแลด้านวิทยาศาสตร์ข้อมูลและไปป์ไลน์แมชชีนเลิร์นนิง เนื่องจากไปป์ไลน์เหล่านี้มักเกี่ยวข้องกับการใช้ไลบรารีโอเพนซอร์ซ สิ่งสำคัญคือต้องเข้าใจการยอมรับความเสี่ยงขององค์กรสำหรับซอฟต์แวร์โอเพนซอร์ส เรียนรู้เกี่ยวกับช่องโหว่และความเสี่ยงทั่วไป (CVE) วิธีค้นหา และวิธีตรวจสอบสภาพแวดล้อมสำหรับแพ็คเกจที่มีความเสี่ยงสูง การละเว้นคะแนน CVE ที่สูงอาจส่งผลให้เกิดการละเมิดข้อมูลและแอปพลิเคชันที่ไม่เสถียร กำหนดโครงสร้างทีมที่เพิ่มผลกระทบสูงสุด นักวิทยาศาสตร์ด้านข้อมูลจำนวนมากไม่ได้เริ่มต้นจากทีม แต่กระจัดกระจายไปทั่วทั้งองค์กรและมอบหมายให้สายธุรกิจเฉพาะเพื่อแก้ปัญหาเฉพาะ ซึ่งมักจะมีประสิทธิภาพสำหรับองค์กรที่เริ่มต้นเส้นทางด้านวิทยาศาสตร์ข้อมูล เนื่องจากง่ายต่อการแสดงผลกระทบทางธุรกิจด้วยโครงการขนาดเล็กที่มุ่งเน้น แต่เมื่อเวลาผ่านไป นักวิทยาศาสตร์ข้อมูลจะต้องร่วมมือกันพัฒนากระบวนการและขจัดความซ้ำซ้อน พวกเขาจะต้องทำงานร่วมกับฝ่ายไอทีเพื่อทำความเข้าใจวิธีการนำโปรเจ็กต์ไปสู่การผลิต ประเมินขีดจำกัดของทรัพยากร และเข้าใจมาตรฐานความปลอดภัย หลายองค์กรประสบความสำเร็จในการใช้โมเดลแบบฮับและพูด ซึ่งนักวิทยาศาสตร์ข้อมูลบางคนยังคงอยู่ในสายธุรกิจ ในขณะที่องค์กรอื่นๆ ทำงานในห้องปฏิบัติการหรือศูนย์วิทยาศาสตร์ข้อมูลเพื่อช่วยนักวิทยาศาสตร์ข้อมูลและนักวิเคราะห์ทั่วทั้งองค์กร ปรับแต่งการนำเสนอตามสายธุรกิจ เพื่อแก้ปัญหาทางธุรกิจ ทีมวิทยาศาสตร์ข้อมูลควรเข้าใจวิธีพูดภาษาของหน่วยธุรกิจที่พวกเขาทำงานด้วย จำเป็นอย่างยิ่งที่ต้องใช้คำทั่วไปและคำย่อในการนำเสนอพร้อมกับสายธุรกิจที่เกี่ยวข้อง สิ่งนี้จะช่วยสร้างพื้นฐานร่วมกันในการกำหนดและประเมินความสำเร็จ การปรับให้เข้ากับสายธุรกิจก็มีความสำคัญเช่นกันในการสร้างแดชบอร์ดแบบกำหนดเองที่ตอบสนองความต้องการเฉพาะ การอ้างอิงถึงตัวชี้วัดแดชบอร์ดเหล่านี้เป็นประจำในการประชุมร่วมกันจะมีความสำคัญเช่นกัน เนื่องจากมีการอภิปรายเป้าหมายโครงการวิทยาศาสตร์ข้อมูลใหม่ และประเมินผลกระทบของการตัดสินใจตามผลลัพธ์ของแบบจำลอง นำไอทีและนักพัฒนาเข้าสู่ขั้นตอน POC เกือบครึ่งหนึ่งของโครงการวิทยาศาสตร์ข้อมูลไม่เคยทำเพื่อการผลิต วิธีหนึ่งที่จะช่วยให้มั่นใจได้ว่าโมเดลต่างๆ จะไปถึงมือผู้ใช้ปลายทางและนำคุณค่ามาสู่ธุรกิจได้ในที่สุด ก็คือการมีส่วนร่วมกับนักพัฒนาด้านไอทีและซอฟต์แวร์ในช่วงต้นของกระบวนการ การประเมินเบื้องต้นของส่วนประกอบซอฟต์แวร์ที่จะใช้ในการสร้างแบบจำลองทำให้มั่นใจได้ว่าข้อมูลจะได้รับการจัดการอย่างปลอดภัยเมื่อแบบจำลองอยู่ในการผลิต ทีมไอทีสามารถช่วยรักษาความปลอดภัยโครงสร้างพื้นฐานที่เหมาะสมสำหรับการฝึกโมเดลและการผลิต และนักพัฒนาจะช่วยให้มั่นใจได้ว่าผู้ใช้ปลายทางจะได้รับประสบการณ์ที่ดีขึ้นสำหรับผลิตภัณฑ์ขั้นสุดท้าย สร้างเวิร์กโฟลว์ เนื่องจากวิทยาศาสตร์ข้อมูลเป็นฟังก์ชันใหม่ในหลายๆ องค์กร จึงต้องสร้างเวิร์กโฟลว์แบบกำหนดเอง หลายองค์กรหันมาใช้การพัฒนาซอฟต์แวร์สำหรับโมเดลเวิร์กโฟลว์ โดยใช้หลักการแบบ Agile และวิธี Scrum สำหรับผลลัพธ์ด้านวิทยาศาสตร์ข้อมูล แต่สิ่งนี้ใช้ไม่ได้กับวิทยาศาสตร์ข้อมูลที่เน้นการวิจัยเสมอไป ตามที่นักวิทยาศาสตร์ด้านข้อมูลทราบ ขั้นตอนที่จำเป็นในการไปถึงเป้าหมายสุดท้ายนั้นไม่ชัดเจนเสมอไป การวิจัยและการสำรวจข้อมูลสามารถให้ผลลัพธ์ที่เปลี่ยนแนวทางของโครงการอย่างมาก เมื่อคำนึงถึงสิ่งนี้ นักวิทยาศาสตร์ด้านข้อมูลยังคงสามารถนำระเบียบวิธีแบบ Agile มาใช้ (โดยเฉพาะอย่างยิ่งมีประโยชน์สำหรับโครงการวิทยาศาสตร์ข้อมูลที่กลายเป็นเว็บแอปพลิเคชัน) และปรับแต่งเพื่อให้เหมาะกับเป้าหมายและกระบวนการของพวกเขา โปรดทราบว่าโครงการมักเปลี่ยนกลับเป็นขั้นตอนก่อนหน้า และสามารถเพิ่มผลงานใหม่ได้ในแต่ละขั้นตอน ดังนั้นให้กำหนดเส้นตายอย่างนุ่มนวลเพื่อให้สามารถเปลี่ยนแปลงหลักสูตรได้ในขณะที่โครงการต่างๆ คลี่คลาย ส่งเสริมการทำงานร่วมกัน นักวิทยาศาสตร์ข้อมูลไม่ทำงานในไซโล นักวิทยาศาสตร์ข้อมูลที่กระจายอยู่ทั่วทั้งองค์กรควรประชุมกันเป็นประจำเพื่อหารือเกี่ยวกับกระบวนการ เครื่องมือ และโครงการ ในขณะที่ผู้ที่อยู่ในโครงสร้างแบบรวมศูนย์ควรพบปะกับผู้จัดการธุรกิจเป็นประจำ ด้วยการสื่อสารอย่างสม่ำเสมอ นักวิทยาศาสตร์ด้านข้อมูลจะเรียนรู้ได้รวดเร็วยิ่งขึ้น พัฒนาชุดทักษะ สร้างกรณีศึกษาที่ดีขึ้นสำหรับทรัพยากรที่ต้องการ และมอบคุณค่าที่มากขึ้นให้กับองค์กรโดยรวม ใช้เครื่องมือที่ลดอคติและเพิ่มความยุติธรรมให้สูงสุด วิทยาศาสตร์ข้อมูลและแมชชีนเลิร์นนิงถูกนำมาใช้มากขึ้นเพื่อช่วยในการตัดสินใจที่ส่งผลต่อชีวิตของผู้คนผ่านการให้คะแนนเครดิต การให้คะแนนผู้สมัครงานและวิทยาลัย และแม้แต่ผลลัพธ์ด้านการรักษาพยาบาลที่อาจเกิดขึ้น เมื่อดำเนินการอย่างรอบคอบแล้ว แมชชีนเลิร์นนิงสามารถปรับปรุงการตัดสินใจของมนุษย์และลดความเหลื่อมล้ำทางเชื้อชาติได้ ในทางกลับกัน เมื่อนำโมเดลการเรียนรู้ของเครื่องมาใช้โดยไม่คำนึงถึงอคติหรือความเป็นธรรม แบบจำลองเหล่านี้สามารถบังคับใช้และทำให้อคติของมนุษย์รุนแรงขึ้นได้ ขั้นตอนที่สำคัญที่สุดที่นักวิทยาศาสตร์ด้านข้อมูลสามารถทำได้คือการทำความเข้าใจอคติในข้อมูลและทำความเข้าใจว่าแบบจำลองของพวกเขาตัดสินใจอย่างไร โชคดีที่มีเครื่องมือโอเพนซอร์สใหม่ๆ มากมายที่ช่วยให้นักวิทยาศาสตร์ด้านข้อมูลทำสิ่งนี้ได้ เช่น FairLearn, InterpretML และ LIME เป็นกระบอกเสียงสำหรับจริยธรรมและการอธิบายได้ ในขณะที่วิทยาศาสตร์ข้อมูลสมัยใหม่เริ่มฝังแน่นมากขึ้นเรื่อยๆ ในการดำเนินธุรกิจ การเมือง และสังคมในแต่ละวัน สิ่งสำคัญคือคำถามเกี่ยวกับอคติและความยุติธรรมจะต้องอยู่ในใจของนักวิทยาศาสตร์ข้อมูล ผู้นำธุรกิจ และวิชาการ ความล้มเหลวในการจัดการปัญหาเหล่านี้ในเชิงรุกก่อให้เกิดความเสี่ยงเชิงกลยุทธ์ต่อองค์กรและสถาบันในมิติการแข่งขัน การเงิน และแม้แต่กฎหมาย เราเห็นโอกาสสำหรับผู้เชี่ยวชาญด้านข้อมูลในการเป็นผู้นำภายในองค์กรและขับเคลื่อนการเปลี่ยนแปลง การทำเช่นนี้จะเพิ่มขนาดของวินัยในองค์กรที่ขึ้นอยู่กับมัน และที่สำคัญกว่านั้น จะเป็นการนำนวัตกรรมและการแก้ปัญหาที่เป็นที่รู้จักของวิชาชีพเพื่อแก้ไขปัญหาสำคัญที่ส่งผลกระทบต่อสังคม เริ่มต้นด้วยการสำรวจความสามารถภายในองค์กรและค้นหาผู้เชี่ยวชาญด้านจริยธรรมในด้านอื่นๆ เช่น ทนายความด้านจริยธรรม ผู้จัดการด้านจริยธรรมและการปฏิบัติตามกฎระเบียบ หรือแม้แต่นักจริยธรรมมืออาชีพ ทำงานร่วมกับบุคคลที่มีจรรยาบรรณเพื่อจัดการประชุมเชิงปฏิบัติการหรือสัมมนาที่เกี่ยวข้องกับผู้นำระดับสูง อธิบายความเสี่ยงและผลกระทบเชิงลบของการเพิกเฉยอคติในข้อมูลและแบบจำลอง และเป็นผู้นำการรับผิดชอบทั่วทั้งแผนกและองค์กร

  • บ้าน
  • Business
  • Data science
  • Marketing
  • Leave a Reply

    Your email address will not be published. Required fields are marked *

    Back to top button