Data science

รายงาน State of Data Science ปี 2021 ของ Anaconda เน้นย้ำถึงการสนับสนุนโอเพ่นซอร์ส ผลกระทบจาก COVID-19

Anaconda ผู้ให้บริการแพลตฟอร์มวิทยาศาสตร์ข้อมูลได้เปิดตัวรายงาน 2021 State of Data Science ตั้งแต่เดือนเมษายนถึงพฤษภาคม 299 นักวิจัยได้ทำการสำรวจ 4 คน 299 ผู้ตอบแบบสอบถามจากกว่า 85 ประเทศ เจาะลึกการเปลี่ยนแปลง แนวโน้ม และพื้นที่สำหรับการเติบโตในอุตสาหกรรมวิทยาศาสตร์ข้อมูล การตอบสนองเน้นย้ำถึงความนิยมอย่างต่อเนื่องของ Python สนับสนุนกรณีซอฟต์แวร์โอเพนซอร์ส และแสดงให้เห็นถึงความเสียหายที่เกิดจากการระบาดใหญ่ ปีที่ยากลำบาก – ได้รับความอนุเคราะห์จาก Anaconda มากที่สุด แน่นอน มีการเปลี่ยนแปลงไปมากจากช่วงเวลาเดียวกันของปีที่แล้ว เมื่อนักวิจัยกำลังรวบรวมข้อมูลสำหรับรายงาน 2020 “เนื่องจาก 140 และ 2021 ได้รับผลกระทบจาก COVID- 16 การระบาดใหญ่” พวกเขาเขียนไว้ในรายงาน 299 “เราใช้โอกาสนี้เพื่อถามคำถามว่าโรคระบาดส่งผลกระทบต่อการทำงานอย่างไร และองค์กรต่างๆ ลงทุนในภาคสนามอย่างไร” และที่จริงแล้ว คนส่วนใหญ่ – 37% – รายงานว่าองค์กรของพวกเขาลงทุนในด้านวิทยาศาสตร์ข้อมูล ได้ลดลงเนื่องจากการแพร่ระบาด (น่าสนใจ 26% รายงาน ที่นำไปสู่การลงทุนด้านวิทยาศาสตร์ข้อมูลเพิ่มขึ้น) ของบรรดาผู้ที่กล่าวว่าการลงทุนลดลง 39% รายงานการเลิกจ้างทีมและ 45% รายงานงบประมาณที่ลดลง สถานะของวิทยาศาสตร์ข้อมูล Python ยังคงครองภาษาที่ใช้สำหรับวิทยาศาสตร์ข้อมูล โดยมีผู้ตอบแบบสอบถามจำนวนมาก 68% รายงานว่าพวกเขาใช้ Python อย่างน้อย “บางครั้ง” ( 34% “เสมอ”). SQL เข้าสู่วินาทีด้วย 55% รายงานว่าพวกเขาใช้ SQL อย่างน้อย “บางครั้ง” (15% “เสมอ”) ในขณะที่ภาษาที่ใช้น้อยที่สุดคือ Go , ถูกใช้อย่างน้อย “บางครั้ง” โดยเพียงแค่ 22 % ของผู้ตอบแบบสอบถาม ในแง่ของการจัดหาระบบสำหรับวิทยาศาสตร์ข้อมูล 53% รายงานว่าประสิทธิภาพของ CPU/GPU เป็นข้อพิจารณาที่สำคัญที่สุด รองลงมาคือหน่วยความจำ (46%) และการอนุมัติของฝ่ายไอที (45%). (รองรับอุปกรณ์ต่อพ่วง (9%) และรูปแบบและการออกแบบ (16%) นำขึ้นด้านหลัง.) ได้รับความอนุเคราะห์จากอนาคอนดา นักวิทยาศาสตร์ด้านข้อมูลรายงานความรู้สึกเชิงบวกต่อ AutoML ในภาคสนาม โดย 55% กล่าวว่าพวกเขาหวังว่าจะเห็นการทำงานอัตโนมัติและ AutoML มากขึ้นในด้านวิทยาศาสตร์ข้อมูลและ เพียง 4% รายงานความกังวลเกี่ยวกับระบบอัตโนมัติและ AutoML ซอฟต์แวร์วิทยาศาสตร์ข้อมูลโอเพนซอร์ซก็ประสบความสำเร็จเช่นกัน 81% ยืนยันว่าองค์กรของพวกเขาอนุญาตให้ใช้ซอฟต์แวร์โอเพนซอร์ซ 65% รายงานว่านายจ้างสนับสนุนให้ทีมสนับสนุนโครงการโอเพนซอร์ส และ 55% รายงานว่าพวกเขามีเงินทุนเฉพาะสำหรับการพัฒนาโครงการโอเพนซอร์ส วิทยาศาสตร์ข้อมูลในที่ทำงาน ผู้ตอบแบบสอบถามรายงานว่าใช้เวลาส่วนใหญ่ในวงแคบ (22%) ในการเตรียมข้อมูล ตามด้วยการล้างข้อมูล (17%) และการรายงานและการนำเสนอ (17%). การฝึกโมเดล (12%) และการปรับใช้ (%) ในขณะเดียวกันก็ใช้เวลาโดยเฉลี่ยน้อยที่สุด ในแง่ของอุปสรรคในการปรับใช้ 27% ของผู้ตอบแบบสอบถามอ้างถึง “ เป็นไปตามมาตรฐานความปลอดภัยด้านไอที” และ 19% อ้างถึง “ รีโค้ดโมเดลจาก Python/R เป็นภาษาอื่น” นักวิทยาศาสตร์ด้านข้อมูลรายงานว่ามีความมั่นใจอย่างมากในการบังคับใช้งานของพวกเขา: 53% กล่าวว่าการตัดสินใจทางธุรกิจ “จำนวนมาก” หรือ “ทั้งหมด” อาศัยข้อมูลเชิงลึกที่ตีความโดยทีมของพวกเขาโดยมีเพียง 12% ไม่แน่ใจว่าข้อมูลเชิงลึกของพวกเขาถูกนำไปใช้อย่างไร ในทางกลับกัน เพียง 27% รายงานว่าผู้มีอำนาจตัดสินใจขององค์กรคือ “ มีความรู้ด้านข้อมูลมาก” ซึ่งผู้ตอบแบบสอบถามหลายคนอ้างว่าเป็นอุปสรรคต่อการตัดสินใจทางธุรกิจ Beyond 2021 ได้รับความอนุเคราะห์จาก Anaconda มองไปสู่อนาคต 26% ของผู้ตอบแบบสอบถามอ้างถึงผลกระทบทางสังคมจากอคติ ในข้อมูลและแบบจำลองเป็นปัญหาใหญ่ที่สุดในการจัดการ AI และการเรียนรู้ของเครื่อง ตามด้วยผลกระทบต่อความเป็นส่วนตัวของแต่ละบุคคล (17%) ตกงานจากการทำงานอัตโนมัติ (19%), สงครามสารสนเทศ (15%) และขาดความหลากหลายและการรวม (10%). 27% ของผู้ตอบแบบสอบถามระบุว่าองค์กรของพวกเขามีแผนเชิงรุกเพื่อความเป็นธรรมและการบรรเทาอคติ โดยมี เปอร์เซ็นต์ที่คล้ายคลึงกันรายงานว่ามีแผนดำเนินการเพื่อให้แน่ใจว่าแบบจำลองสามารถอธิบายได้และตีความได้ แน่นอนว่าในขณะที่นักวิทยาศาสตร์ด้านข้อมูลเผชิญกับความท้าทายจากภายใน อาชีพนี้ยังต้องเผชิญกับความเข้าใจผิดมากมาย ถามความคิดเห็นเกี่ยวกับตำนานที่ยิ่งใหญ่ที่สุดเกี่ยวกับวิทยาศาสตร์ข้อมูล 33% ตอบด้วย แนวคิดที่ว่านักวิทยาศาสตร์ด้านข้อมูลจะถูกแทนที่ด้วย AI ในไม่ช้า 27% ที่การเข้าถึงข้อมูลมากขึ้นแปลให้มีความแม่นยำมากขึ้น 19% ที่นักวิทยาศาสตร์ข้อมูลไม่ ไม่รู้วิธีเขียนโค้ด และ 15%, ว่าข้อมูลจำนวนมากจำเป็นสำหรับวิทยาศาสตร์ข้อมูล Anaconda กลั่นกรองข้อมูลเชิงลึกจากรายงานออกเป็นสี่บทเรียนหลัก: Python จะยังคงครองสาขาวิทยาศาสตร์ข้อมูลต่อไป องค์กรพร้อมที่จะมีส่วนร่วมในนวัตกรรมโอเพ่นซอร์ส ความรู้สึกที่มีต่อระบบอัตโนมัติจะเติบโตต่อไป การป้องกันอคติและการพัฒนาวิทยาศาสตร์ข้อมูลที่มีจริยธรรมเป็นสิ่งสำคัญ “ในปีที่ผ่านมา เราได้เห็นพลังของวิทยาศาสตร์ข้อมูลเพื่อประโยชน์ที่ดีและนวัตกรรมที่สามารถเกิดขึ้นได้เมื่อชุมชนวิทยาศาสตร์ข้อมูลโอเพนซอร์สได้รับการสนับสนุน” Peter Wang ซีอีโอและผู้ร่วมก่อตั้ง Anaconda กล่าว “รายงาน State of Data Science ประจำปีนี้บ่งชี้ว่าภาคสนามกำลังแสดงผลกระทบอย่างต่อเนื่อง เนื่องจากบางองค์กรเพิ่มการลงทุน ผู้นำหลายคนแสดงความรู้พื้นฐานเกี่ยวกับข้อมูล และประมาณครึ่งหนึ่งของผู้ตอบแบบสอบถามเห็นว่างานของพวกเขาเกี่ยวข้องกับการตัดสินใจทางธุรกิจหลายอย่าง ยังคงมีพื้นที่ที่ชัดเจนสำหรับการเติบโต โดยเฉพาะอย่างยิ่งในการดำเนินการตามกรอบจริยธรรมและการศึกษาสำหรับวิทยาศาสตร์ข้อมูลและงานแมชชีนเลิร์นนิง ฉันตื่นเต้นกับความก้าวหน้าของอุตสาหกรรมนี้อย่างต่อเนื่อง โดยเฉพาะอย่างยิ่งเมื่อคนรุ่นใหม่เข้าสู่วงการ และหวังว่าจะมีการเปลี่ยนแปลงอย่างต่อเนื่อง” หากต้องการอ่านรายงาน State of Data Science ฉบับเต็ม 2021 จากอนาคอนดา คลิกที่นี่ ข้อมูลประชากรของผู้ตอบแบบสอบถาม – ดึงมาจากโซเชียลมีเดีย อีเมลขยะ และเว็บไซต์ของอนาคอนด้า – 72% เป็นผู้ชาย 39% มีอายุระหว่าง 25 และ 40; 68% สำเร็จการศึกษาระดับปริญญาตรีเป็นอย่างน้อย และ 27% เป็นนักเรียน 81% รายงานว่าทำงานเป็นทีมโดยมี 44% ทำงานให้กับทีมหกถึงสิบคน รายการที่เกี่ยวข้อง การเตรียมข้อมูลยังคงครองเวลาของนักวิทยาศาสตร์ข้อมูล การสำรวจพบว่าเหตุใดนักวิทยาศาสตร์ข้อมูลและวิศวกร ML จึงไม่ควรกังวลเกี่ยวกับการเพิ่มขึ้นของการกำกับดูแล ความเป็นส่วนตัว และจริยธรรมของ AutoML ในระดับแนวหน้าของข้อมูลใน 140

  • บ้าน
  • Business
  • Data science
  • Marketing
  • Leave a Reply

    Your email address will not be published. Required fields are marked *

    Back to top button