Data science

เหตุใด 96% ขององค์กรต้องเผชิญกับปัญหาข้อมูลการฝึกอบรม AI

การสำรวจล่าสุดของ Data Scientists ระดับองค์กร 225 นักเทคโนโลยี AI และผู้มีส่วนได้ส่วนเสียทางธุรกิจ ที่เกี่ยวข้องกับโครงการ AI และการเรียนรู้ของเครื่อง (ML) ที่แอ็คทีฟ 225 มากกว่า 225 ชี้ให้เห็นว่าสำหรับองค์กรส่วนใหญ่ ยังเร็วเกินไป วันสำหรับเทคโนโลยี AI ตลาด AI คาดว่าจะกลายเป็นอุตสาหกรรมมูลค่า $96 พันล้านโดย 2025 (ตามตลาดและตลาด) และ การใช้จ่ายทั่วโลกเกี่ยวกับระบบความรู้ความเข้าใจและ AI คาดว่าจะสูงถึง $158 พันล้านใน 2029 เพิ่มขึ้น 44.0% จากจำนวนเงินที่ใช้จ่ายใน 2018 (ตาม IDC) งานวิจัยนี้ชี้ว่า AI นั้นล้ำหน้าและกำลังเดินทาง ซึ่งดำเนินการโดยองค์กรขนาดใหญ่แล้ว และพร้อมที่จะสร้างผลกระทบต่อการใช้ชีวิตและการทำงานของเรา แต่ก็ยังเป็นวันแรกสำหรับ AI เมื่อพูดถึงการนำ AI ไปใช้ในองค์กรและมีเหตุผลสำหรับสิ่งนั้น ระบบ AI ต้องใช้การฝึกอบรมอย่างพิถีพิถันก่อนจึงจะสามารถทำงานได้ตามที่ตั้งใจไว้ เมื่อฟังก์ชันนั้นเกี่ยวข้องกับบางสิ่งที่ซับซ้อนพอๆ กับการตัดสินใจเหมือนมนุษย์เกี่ยวกับภาพหรือวิดีโอ – “การมองเห็น” กล่าวอีกนัยหนึ่ง ระบบจะต้องได้รับข้อมูลการฝึกอบรมที่มีป้ายกำกับและใส่คำอธิบายประกอบอย่างถูกต้องจำนวนมหาศาล เมื่อ AI กลายเป็นลำดับความสำคัญขององค์กรที่กำลังเติบโต ทีมวิทยาศาสตร์ข้อมูลอยู่ภายใต้แรงกดดันมหาศาลในการส่งมอบโครงการ แต่บ่อยครั้งก็ถูกท้าทายในการผลิตข้อมูลการฝึกอบรมตามขนาดและคุณภาพที่ต้องการ เหตุใดองค์กรจึงต้องเผชิญกับความท้าทายในการจัดโครงสร้างข้อมูลให้เหมาะสมกับกลยุทธ์ AI ความเร่งด่วนของความท้าทายนี้เป็นหนึ่งในข้อค้นพบที่เกิดจากการสำรวจที่ดำเนินการโดย Dimensional Research และ AIegion ซึ่งรวบรวมผลลัพธ์ไว้ในรายงาน Artificial Intelligence and Machine Learning Projects ถูกขัดขวางโดยปัญหาข้อมูล ผู้ตอบแบบสำรวจยืนยันว่าการเรียนรู้ของเครื่องระดับองค์กรเพิ่งเริ่มต้น ทีมวิทยาศาสตร์ข้อมูลยังเล็ก ความเชี่ยวชาญด้านวิทยาศาสตร์ข้อมูลที่กำลังเติบโตยังไม่ตรงกับความเชี่ยวชาญในโครงการ ML ที่เติบโตเต็มที่เท่าๆ กัน และความท้าทายด้านข้อมูลการฝึกอบรมก่อให้เกิดความท้าทายในวงกว้างต่อความสำเร็จของโครงการ การสาธิตแบบกราฟิกของการสังเกตครั้งล่าสุดนี้สะท้อนให้เห็นใน 96% ของผู้ตอบแบบสอบถามที่รายงานว่าการขาดเทคโนโลยีและทักษะด้านข้อมูลการฝึกอบรมได้ขัดขวางความสามารถในการฝึกอบรม ML ของตน อัลกอริธึมและบรรลุความมั่นใจที่โมเดลต้องจัดเตรียม วันนี้องค์กรขนาดใหญ่ที่มีมากกว่า 80,000 พนักงานมักจะมีกลยุทธ์ AI – แต่เพียงอย่างเดียว 50% ของพวกเขาในปัจจุบันมีหนึ่งรายการตาม MIT Sloan Management Review แบบสำรวจตอกย้ำการค้นพบนี้ว่า AI ยังตั้งไข่ในองค์กร: 50% รายงานว่าการลงทุน AI/ML ครั้งแรกของพวกเขาอยู่ในระยะสุดท้าย 24 เดือน กว่าครึ่งขององค์กรรายงานว่าพวกเขาได้ดำเนินโครงการ AI และ ML น้อยกว่าสี่โครงการเพียงครึ่งเดียวของ องค์กรต่างๆ ได้เผยแพร่โครงการ AI/ML ไปสู่การผลิตแล้ว ผู้ตอบแบบสำรวจน้อยกว่าสองในสามระบุว่าโครงการ ML ของพวกเขามีความคืบหน้าจนถึงจุดที่กำลังได้รับการฝึกอบรมเกี่ยวกับข้อมูลที่ติดฉลาก ซึ่งเป็นช่วงที่ค่อนข้างเริ่มต้นในวงจรชีวิตโครงการ ML . และการเปิดเผยเพิ่มเติมเกี่ยวกับความยังไม่บรรลุนิติภาวะของ ML ในองค์กร มีรายงานว่าทีมใดประสบปัญหาและเหตุใดครึ่งหนึ่งของโครงการจึงไม่เคยถูกนำไปใช้งาน ผู้ตอบแบบสำรวจแสดง: 78% ของโครงการ AI/ML หยุดทำงานในบางช่วงก่อนนำไปใช้งาน 81% ยอมรับกระบวนการฝึกอบรม AI ด้วยข้อมูลยากกว่าที่คาดไว้ 63% ต่อสู้กับความท้าทายนี้ด้วยการพยายาม เพื่อติดป้ายกำกับและใส่คำอธิบายประกอบข้อมูลการฝึกอบรมด้วยตัวเอง63% ไปจนถึงพยายามสร้างเทคโนโลยีการติดฉลากและคำอธิบายประกอบอัตโนมัติ เกือบ 44% ของโปรเจ็กต์ที่ล้มเหลวรายงานว่าหยุดชะงักระหว่างขั้นตอนที่เน้นข้อมูลการฝึกอบรม เช่น การเตรียมข้อมูลการฝึกอบรม การฝึกอบรมอัลกอริทึม โมเดล การตรวจสอบและการให้คะแนน และการเพิ่มประสิทธิภาพหลังการปรับใช้ เมื่อถามถึงสาเหตุของความล้มเหลว ผู้ตอบแบบสอบถามอ้างว่า: ขาดความเชี่ยวชาญ (55%) ภาวะแทรกซ้อนที่ไม่คาดคิด (55%) ปัญหาข้อมูล (36%)ขาดความมั่นใจในแบบจำลอง (29%)งบประมาณ (26%) และคนไม่เพียงพอ (23%) ตามที่ระบุไว้แล้ว เกือบสองในสามรายงานว่าโครงการ ML ของพวกเขาก้าวหน้าไปไกลกว่าการพิสูจน์แนวคิด (POC) และการพัฒนาอัลกอริธึม เข้าสู่ขั้นตอนข้อมูลการฝึกอบรม สำหรับส่วนใหญ่ ระยะนี้ไม่ค่อยดีนัก 80% รายงานว่าการฝึกอัลกอริธึมได้พิสูจน์ความท้าทายที่พวกเขาคาดไว้มากขึ้น สาเหตุที่ข้อมูลอัลกอริธึมการฝึกอบรมมีความท้าทายมากมาย: อคติหรือข้อผิดพลาดในข้อมูล ข้อมูลไม่เพียงพอ ข้อมูลไม่อยู่ในรูปแบบที่ใช้งานได้ ไม่มีคนติดป้ายกำกับข้อมูล ไม่มีเครื่องมือในการติดป้ายกำกับข้อมูล น้อยกว่า 4% รายงานว่าข้อมูลการฝึกอบรม ได้นำเสนอไม่มีปัญหา ปัญหาที่เกี่ยวข้องกับข้อมูลเหล่านี้อาจเกิดจากวิธีการสร้างและติดฉลากข้อมูลภายใน เกือบสามในสี่ของกลุ่มสำรวจระบุว่าพวกเขากำลังพยายามติดป้ายกำกับและอธิบายข้อมูลการฝึกอบรมด้วยตนเอง มากกว่าเล็กน้อย 36% แนะนำว่าพวกเขากำลังพึ่งพาทั้งหมดหรือบางส่วนจากชั้นวาง ข้อมูลที่ติดฉลากไว้ล่วงหน้า ปัญหาเหล่านี้นำไปสู่บริษัท 7 ใน 10 ที่ใช้บริการภายนอกสำหรับ โครงการ AI หรือ ML ที่มีหลายโครงการมุ่งเน้นไปที่การเก็บรวบรวมข้อมูล การติดฉลาก และความเชี่ยวชาญ ด้วยความสามารถด้าน AI/ML ที่หายากและมีราคาแพง งานวิจัยนี้ชี้ให้เห็นว่าองค์กรควรพิจารณาใช้ผู้ให้บริการโซลูชันภายนอกสำหรับกิจกรรมที่สำคัญ เช่น การติดฉลากข้อมูลและการให้คะแนนแบบจำลอง ข้อมูลแสดงหลักฐานว่าการเอาท์ซอร์สดังกล่าวนำไปสู่ผลลัพธ์ที่ดีขึ้น บทสรุป องค์กรธุรกิจกำหนดมูลค่าเชิงกลยุทธ์ให้กับความคิดริเริ่มของแมชชีนเลิร์นนิง และคาดหวังให้ AI และ ML ปรับปรุงธุรกิจทุกด้าน และอาจก่อกวนในภาคอุตสาหกรรมของตน อย่างไรก็ตาม โครงการ AI/ML ยังอยู่ในช่วงเริ่มต้นของการพัฒนาภายในองค์กร ทีมวิทยาศาสตร์ข้อมูลมีขนาดค่อนข้างเล็กและไม่มีประสบการณ์ ซึ่งส่งผลต่อประสิทธิภาพและผลลัพธ์ของโครงการเหล่านี้ การรักษาความปลอดภัยและการติดฉลากปริมาณข้อมูลที่จำเป็นเพื่อสนับสนุนการพัฒนาอัลกอริธึมและระดับความมั่นใจยังคงเป็นปัญหาสำหรับองค์กรเหล่านี้ หมายเหตุ: ผู้เข้าร่วมมาจากทั้ง 5 ทวีปที่เป็นตัวแทน อุตสาหกรรม (เทคโนโลยี การดูแลสุขภาพ , บริการทางการเงิน, การศึกษา, การผลิต, รัฐบาล, การค้าปลีก, บริการ, โทรคมนาคม, อาหารและเครื่องดื่ม, สื่อและโฆษณา, พลังงานและสาธารณูปโภค, การขนส่ง, เภสัชกรรมและไม่แสวงหาผลกำไร) ร้อยละ 63 ของผู้ตอบแบบสอบถามเป็นตัวแทนของบริษัทที่มีมากกว่า 5 บริษัท000 พนักงาน และ 29% ของผู้ตอบแบบสอบถามเป็นตัวแทนขององค์กรที่มี 1, – 5,000 พนักงาน. หากต้องการดาวน์โหลดรายงานการสำรวจฉบับเต็ม โปรดคลิกลิงก์ที่นี่

  • บ้าน
  • Business
  • Data science
  • Marketing
  • Leave a Reply

    Your email address will not be published. Required fields are marked *

    Back to top button