Data science

ได้ยินบนถนน – 10/28/2021

ยินดีต้อนรับสู่คอลัมน์สรุป “Heard on the Street” ของ InsideBIGDATA! ในคุณสมบัติปกติใหม่นี้ เราเน้นย้ำข้อคิดเห็นเกี่ยวกับความเป็นผู้นำทางความคิดจากสมาชิกของระบบนิเวศข้อมูลขนาดใหญ่ แต่ละฉบับครอบคลุมแนวโน้มของวันด้วยมุมมองที่น่าสนใจที่สามารถให้ข้อมูลเชิงลึกที่สำคัญเพื่อให้คุณได้เปรียบในการแข่งขันในตลาด เราขอเชิญส่งผลงานโดยเน้นที่หัวข้อเทคโนโลยีที่เราชื่นชอบ: ข้อมูลขนาดใหญ่ วิทยาศาสตร์ข้อมูล การเรียนรู้ของเครื่อง AI และการเรียนรู้เชิงลึก สนุก! การปรับเปลี่ยนกระบวนทัศน์จำเป็นต้องสร้างความสามัคคีที่มากขึ้นระหว่างปัญญาประดิษฐ์ (AI) และปัญญามนุษย์ (HI) ความเห็นโดย Kevin Scott, CTO, Microsoft “การเปรียบเทียบ AI กับ HI เป็นประวัติศาสตร์อันยาวนานของผู้คน โดยถือว่าสิ่งที่ง่ายสำหรับพวกเขาจะเป็นเรื่องง่ายสำหรับเครื่องจักร และในทางกลับกัน แต่มันกลับตรงกันข้ามมากกว่า มนุษย์พบว่าการเป็นปรมาจารย์หมากรุก หรือการทำงานข้อมูลที่ซับซ้อนและซ้ำซาก เป็นเรื่องยาก ในขณะที่เครื่องจักรสามารถทำสิ่งเหล่านั้นได้อย่างง่ายดาย แต่ในสิ่งที่เรามองข้ามไป เช่น การให้เหตุผลด้วยสามัญสำนึก เครื่องจักรยังคงมีทางยาวไกล … AI เป็นเครื่องมือที่ช่วยให้มนุษย์ทำงานเกี่ยวกับความรู้ความเข้าใจ มันไม่เกี่ยวกับว่า AI จะเทียบเท่ากับ HI หรือไม่ นั่นไม่ใช่เป้าหมายที่ฉันกำลังดำเนินการอยู่” ความสำคัญของการใช้ความเที่ยงธรรมของข้อมูลเพื่อค้นหาพื้นที่ของโอกาสภายในองค์กร คำอธิบายโดย Eric Mader ที่ปรึกษาหลัก AHEAD “ในยุคของการนำเทคโนโลยีมาใช้อย่างรวดเร็วและการเปลี่ยนแปลงทางดิจิทัล มีบริษัทจำนวนมากขึ้นเรื่อยๆ ที่หันมาใช้การรวบรวมและจัดเก็บข้อมูลเพื่อกระตุ้นการตัดสินใจทางธุรกิจ ส่วนหนึ่งเป็นเพราะ 70 ขาดเสถียรภาพในการทำหน้าที่เป็นพื้นฐานในการตัดสินใจทางธุรกิจใน 2021 ด้วยการเพิ่มขึ้นขององค์กรที่พึ่งพาข้อมูลและการวิเคราะห์ จำเป็นต้องมีความเข้าใจที่ชัดเจนว่าข้อมูลนี้จะมีประโยชน์อย่างไร แต่ก็เป็นอันตรายด้วยเช่นกัน บริษัทเหล่านี้อาจเข้าใจถึงความสำคัญของการวิเคราะห์ข้อมูลโดยเนื้อแท้ แต่ปัญหาที่ใหญ่ที่สุดคือแนวทางในการป้องกันความลำเอียงของข้อมูล การยอมรับความต้องการตามธรรมชาติภายในองค์กรเพื่อนำข้อมูลไปสู่ระดับหนึ่งเป็นขั้นตอนแรกที่สำคัญในการใช้ประโยชน์จากความเที่ยงธรรมที่แท้จริงของข้อมูล โชคดีที่มีคำแนะนำหนึ่งข้อที่องค์กรต้องจำไว้เพื่อหลีกเลี่ยงการตกเป็นเหยื่อของการยืนยันอคติในการวิเคราะห์ข้อมูล: ระวังวิธีสื่อสารสิ่งที่คุณค้นพบ เป็นแนวทางปฏิบัติง่ายๆ ที่สามารถสร้างความแตกต่างได้ แม้ว่านักวิจัยที่วิเคราะห์ข้อมูลควรตระหนักถึงข้อผิดพลาดทางสถิติทั่วไปและอคติของพวกเขาที่มีต่อคำตอบที่เฉพาะเจาะจง แต่ควรให้ความใส่ใจอย่างรอบคอบกับวิธีการนำเสนอข้อมูลด้วย ทีมข้อมูลต้องหลีกเลี่ยงการสื่อสารสิ่งที่ค้นพบในลักษณะที่อาจทำให้เข้าใจผิดหรือตีความผิด ด้วยการรักษาระดับความพิถีพิถันภายในกลยุทธ์ข้อมูลของคุณ องค์กรสามารถมั่นใจได้ว่าแนวทางข้อมูลของพวกเขาจะทำงานร่วมกับพวกเขาและไม่ขัดต่อพวกเขา” มอบประสบการณ์ผู้ป่วยที่ดีขึ้นด้วย AI ความเห็นโดย Joe Hagan หัวหน้าเจ้าหน้าที่ฝ่ายผลิตภัณฑ์ของ LumenVox “การจัดการการโทรเป็นสิ่งสำคัญในอุตสาหกรรมการดูแลสุขภาพในการสนับสนุนความต้องการของผู้ป่วย เช่น การจัดตารางเวลา คำถามเกี่ยวกับการดูแล และการจ่ายยาตามใบสั่งแพทย์ อย่างไรก็ตาม ข้อมูลแสดงให้เห็นว่าเจ้าหน้าที่ติดต่อใช้เวลามากกว่า 20% ในการรีเซ็ตรหัสผ่านสำหรับแอปพลิเคชันและพอร์ทัลของผู้ป่วย – รหัสผ่านแต่ละรายการใช้เวลาสามนาทีหรือมากกว่าในการรีเซ็ต ศูนย์บริการด้านการดูแลสุขภาพสามารถเอาชนะช่วงเวลานี้และให้บริการผู้ป่วยได้ดีขึ้นได้อย่างไร? เทคโนโลยีที่เปิดใช้งาน AI เช่น การรู้จำเสียงพูดและไบโอเมตริกซ์เสียง จากการสำรวจของ LumenVox และ SpinSci ผู้ให้บริการด้านการดูแลสุขภาพเกือบ 000% ต้องการลงทุนใน AI สำหรับศูนย์การติดต่อของพวกเขาในอีกหนึ่งถึงสามปีข้างหน้า การหยุดชะงักทางดิจิทัลครั้งใหญ่ในการดูแลสุขภาพที่ให้ความสำคัญกับประสบการณ์ของผู้ป่วยอยู่ที่นี่แล้ว เนื่องจากศูนย์ติดต่อด้านการดูแลสุขภาพใช้ประโยชน์จากเทคโนโลยีเช่น AI พวกเขาจะมีความพร้อมมากขึ้นในการส่งมอบบริการคุณภาพสูงแก่ผู้ป่วย” AI คืออนาคตของการเฝ้าระวังวิดีโอ ความเห็นโดย Rick Bentley ซีอีโอของ Cloudastructure “ไม่นานมานี้ ถ้าคุณต้องการให้คอมพิวเตอร์รู้จักรถ มันก็ขึ้นอยู่กับคุณที่จะอธิบายให้ฟังว่ารถหน้าตาเป็นอย่างไร: “มันมีของทรงกลมสีดำที่เรียกว่า 'ล้อ' อยู่ด้านล่าง แบบ 'หน้าต่าง' ครึ่งบนจะกลมๆ ด้านบนเป็นมัน แสงด้านหลังเป็นบางครั้งเป็นสีแดง บางคราวด้านหน้าเป็นสีขาว ส่วนด้านข้างบางครั้งก็เป็นสีเหลือง…” จินตนาการได้ มันไม่ได้ผลดีนัก วันนี้คุณเพิ่งถ่าย ,000 รูปรถและ 50,000 ภาพระยะใกล้แต่ไม่ใช่รถยนต์ (รถจักรยานยนต์ เจ็ตสกี เครื่องบิน …) และแพลตฟอร์ม AI/ML ของคุณจะตรวจจับรถยนต์ได้ดีกว่าที่คุณเคยทำ โซลูชันวิดีโออัจฉริยะที่ขับเคลื่อนด้วย AI และ ML เป็นหนทางแห่งอนาคต และหากธุรกิจไม่ก้าวตาม พวกเขาก็อาจทำให้ตนเองและพนักงานตกอยู่ในความเสี่ยง เมื่อสองปีที่แล้ว องค์กรมากกว่า 90% ยังคงติดอยู่กับวิธีการรักษาความปลอดภัยภายในองค์กรที่ล้าสมัย หลายแห่งมีข้อจำกัดหากไม่มีปัญญาประดิษฐ์ อุตสาหกรรมอยู่ภายใต้การเปลี่ยนแปลงอย่างรวดเร็วเนื่องจากใช้ประโยชน์จากเทคโนโลยีนี้และย้ายระบบไปยังคลาวด์ ฟังก์ชัน AI ที่ได้รับการปรับปรุงและการใช้งานระบบคลาวด์ในการเฝ้าระวังวิดีโอช่วยให้เจ้าของธุรกิจและแผนกไอทีสามารถตรวจสอบความปลอดภัยของธุรกิจจากความปลอดภัยของบ้านได้ โซลูชันการเฝ้าระวัง AI สามารถเข้าถึงได้จากอุปกรณ์เคลื่อนที่ที่ได้รับอนุญาต และวิดีโอจะถูกเก็บไว้อย่างปลอดภัยนอกสถานที่ เพื่อไม่ให้ถูกแฮ็ก และปลอดภัยจากอันตรายต่อสิ่งแวดล้อม นอกจากนี้ การวิเคราะห์ AI อันทรงพลังยังช่วยให้ระบบเฝ้าระวังอัจฉริยะสามารถจัดเรียงฟุตเทจปริมาณมากเพื่อระบุกิจกรรมที่น่าสนใจได้มากกว่า 10 x ได้เร็วและแม่นยำกว่าแบบแมนนวล – โซลูชั่นสถานที่ ในปีต่อๆ ไป ฟังก์ชัน AI จะยังคงก้าวหน้าขึ้นเรื่อยๆ ทำให้ธุรกิจสามารถสร้างข้อมูลเชิงลึกแบบเรียลไทม์และช่วยให้ตอบสนองต่อเหตุการณ์ต่างๆ ได้อย่างรวดเร็ว ส่งผลให้สังคมมีประสิทธิภาพและปลอดภัยยิ่งขึ้น” วิธีที่ธุรกิจสามารถนำไปใช้อย่างเหมาะสมและเพิ่มผลกระทบของ AI ได้สูงสุด คำอธิบายโดย Bren Briggs รองประธาน DevSpecOps ที่ Hypergiant “ธุรกิจที่ไม่ได้ใช้โซลูชัน AI และ ML จะไม่เกี่ยวข้องมากขึ้นเรื่อยๆ นี่ไม่ใช่เพราะ AI หรือ ML เป็นกระสุนเวทย์มนตร์ แต่เพราะการใช้สิ่งเหล่านี้เป็นจุดเด่นของความคิดที่สร้างสรรค์และมีความยืดหยุ่นเป็นอันดับแรก สำหรับธุรกิจที่จะเพิ่มผลกระทบของ AI ได้ อันดับแรกพวกเขาต้องตั้งคำถามทางธุรกิจที่สำคัญ จากนั้นจึงค้นหาโซลูชันที่ปรับปรุงการจัดการข้อมูล ตลอดจนปรับปรุงและเสริมความแข็งแกร่งให้กับกระบวนการทางธุรกิจ เมื่อนำไปใช้ได้ดี AI จะช่วยให้บริษัทคาดการณ์ปัญหาและดำเนินการเพื่อตอบสนองต่อความท้าทายเหล่านั้นอย่างรวดเร็ว ฉันสนับสนุนให้บริษัทต่างๆ ให้ความสำคัญกับพื้นฐานเสมอ: จ้างผู้เชี่ยวชาญ กำหนดรูปแบบเพื่อความสำเร็จ และเลือกโซลูชัน AI ที่จะเป็นประโยชน์ต่อองค์กรมากที่สุด ในการทำเช่นนั้น บริษัทต่างๆ ควรเพิ่มพูนวิทยาศาสตร์ข้อมูลและทีม MLOps ซึ่งสามารถช่วยประเมินปัญหา AI ที่มีแนวโน้มว่าจะประสบความสำเร็จมากที่สุดและมี ROI ที่แข็งแกร่ง การวิเคราะห์ต้นทุน/ผลประโยชน์จะช่วยให้คุณทราบได้ว่าการบูรณาการ AI เป็นการใช้ทรัพยากรของบริษัทคุณให้เกิดประโยชน์สูงสุดจริงหรือไม่” AI ในฐานะ “นักพัฒนาซอฟต์แวร์” ในบริบทของการพัฒนาผลิตภัณฑ์ ความเห็นโดย Jonathan Grandperrin ซีอีโอ Mindee “ในขณะที่ปัญญาประดิษฐ์ยังคงมีความก้าวหน้าอย่างมาก และผลิตภัณฑ์จากการเรียนรู้ของเครื่องสำหรับทีมวิศวกรก็เกิดขึ้น ความท้าทายก็เกิดขึ้น ความต้องการเร่งด่วนสำหรับนักพัฒนาซอฟต์แวร์ในการเพิ่มทักษะและทำความเข้าใจว่า AI ทำงานอย่างไรและจะใช้ประโยชน์จากมันอย่างไรอย่างเหมาะสม ความสามารถของ AI ในการทำให้งานเป็นอัตโนมัติและเพิ่มประสิทธิภาพหลาย ๆ อย่าง – ถ้าไม่ใช่ทุกกระบวนการ – ได้ปฏิวัติโลก เพื่อบรรลุประสิทธิภาพตามที่สัญญาไว้ จะต้องผสานรวม AI เข้ากับผลิตภัณฑ์ประจำวันทั้งหมด เช่น เว็บไซต์ แอปพลิเคชันมือถือ แม้แต่ผลิตภัณฑ์อย่างสมาร์ททีวี อย่างไรก็ตาม ปัญหาเกิดขึ้นกับนักพัฒนาในบริบทนี้: AI ไม่ได้อาศัยหลักการเดียวกันกับการพัฒนาซอฟต์แวร์ ต่างจากการพัฒนาซอฟต์แวร์ซึ่งอาศัยฟังก์ชันที่กำหนดขึ้นเอง โดยส่วนใหญ่แล้ว AI จะขึ้นอยู่กับการประมาณทางสถิติ ซึ่งเปลี่ยนกระบวนทัศน์ทั้งหมดจากมุมมองของนักพัฒนาซอฟต์แวร์ นอกจากนี้ยังเป็นเหตุผลที่อยู่เบื้องหลังการเพิ่มขึ้นของตำแหน่งวิทยาศาสตร์ข้อมูลในบริษัทซอฟต์แวร์ ในการประสบความสำเร็จ นักพัฒนาต้องมีความสามารถในการสร้างแบบจำลอง AI ตั้งแต่เริ่มต้น และจัดเตรียมคุณลักษณะ ML ให้กับทีมเทคนิคที่พวกเขาสามารถเข้าใจและใช้งานได้ โชคดีที่การดูไลบรารี ML สำหรับนักพัฒนากลายเป็นเรื่องปกติมากขึ้น อันที่จริง ผู้ที่ต้องการเพิ่มทักษะ ML ของพวกเขาสามารถเข้าร่วมในหลักสูตรแนะนำที่สามารถขยายชุดทักษะของพวกเขาได้อย่างง่ายดาย” วิธีแก้ปัญหา Long Tail ของ ML คำอธิบายโดย รัสเซล แคปแลน หัวหน้าฝ่ายนิวเคลียสของ Scale AI “ปัญหาที่พบบ่อยที่สุดในการเรียนรู้ของเครื่องในปัจจุบันคือข้อมูลที่ไม่ธรรมดา ด้วยการใช้งาน ML ในสภาพแวดล้อมการผลิตที่เพิ่มมากขึ้น กรณีที่ขอบที่ท้าทายได้กลายเป็นบรรทัดฐานแทนที่จะเป็นข้อยกเว้น แนวทางปฏิบัติที่ดีที่สุดสำหรับการพัฒนาแบบจำลอง ML กำลังเปลี่ยนแปลงไป ในโลกเก่า วิศวกร ML จะรวบรวมชุดข้อมูล แยกการฝึก/ทดสอบ จากนั้นไปที่เมืองเพื่อทำการทดลองฝึกอบรม: ปรับแต่งไฮเปอร์พารามิเตอร์ สถาปัตยกรรมโมเดล การเพิ่มข้อมูล และอื่นๆ เมื่อความแม่นยำของชุดทดสอบสูงเพียงพอ ก็ถึงเวลาจัดส่ง การทดลองฝึกอบรมยังคงช่วยได้ แต่ไม่มีเลเวอเรจสูงสุดอีกต่อไป ทีมต่างๆ ยังคงยึดโมเดลของตนไว้ในขณะที่วนซ้ำบนชุดข้อมูลมากขึ้นเรื่อยๆ แทนที่จะทำอย่างอื่น สิ่งนี้ไม่เพียงนำไปสู่การปรับปรุงที่ใหญ่ขึ้นเท่านั้น แต่ยังเป็นวิธีเดียวในการแก้ไขปัญหา ML ที่เฉพาะเจาะจงตามเป้าหมายที่พบในการใช้งานจริง ใน ML คุณไม่สามารถ if-statement ของคุณออกจากเคส edge ที่ล้มเหลวได้ ในการแก้ปัญหาระยะยาวด้วยวิธีนี้ การเปลี่ยนแปลงชุดข้อมูลไม่เพียงพอ คุณต้องทำการเปลี่ยนแปลงชุดข้อมูลที่ถูกต้อง ซึ่งหมายความว่าการรู้ว่าโมเดลของคุณล้มเหลวในการกระจายข้อมูลที่ไหน แนวคิดของ “ชุดทดสอบเดียว” ไม่เหมาะอีกต่อไป แต่ทีม ML ที่มีประสิทธิภาพสูงจะรวบรวมชุดการทดสอบแบบทดสอบจริงจำนวนมากซึ่งครอบคลุมการตั้งค่าที่หลากหลาย และวัดความแม่นยำในแต่ละชุด นอกเหนือจากการช่วยแจ้งข้อมูลที่จะรวบรวมและติดป้ายกำกับเพื่อขับเคลื่อนการปรับปรุงแบบจำลองที่ยิ่งใหญ่ที่สุด วิธีการทดสอบแบบหลายชุดยังช่วยตรวจจับการถดถอยอีกด้วย หากความแม่นยำโดยรวมเพิ่มขึ้น แต่ประสิทธิภาพในกรณีขอบที่สำคัญลดลง โมเดลของคุณอาจต้องเลี้ยวอีกครั้งก่อนจัดส่ง” ข้อควรพิจารณาด้านความเป็นส่วนตัวของข้อมูลยอดนิยมสำหรับการควบรวมกิจการ ความเห็นโดย Matthew Carroll, CEO, Immuta “ข้อตกลง M&A ยังคงทะยานไปทั่วโลก ด้วยเทคโนโลยีและบริการทางการเงิน ประกันภัย และอุตสาหกรรมที่เป็นผู้นำกลุ่ม อย่างไรก็ตาม เมื่อมีดีลเพิ่มขึ้น ดีลที่ตกลงมาก็เพิ่มขึ้นด้วย การวิจัยแสดงให้เห็นว่าเหตุผลหลักประการหนึ่งที่ข้อตกลง M&A ตกลงไปในอัตราที่สูงอย่างน่าประหลาดใจ — ระหว่าง 000% และ 90 % — คือความเป็นส่วนตัวของข้อมูลและข้อกังวลด้านกฎระเบียบ เนื่องจากมีบริษัทจำนวนมากขึ้นที่ย้ายข้อมูลของตนไปยังคลาวด์ ธุรกรรม M&A ทำให้จำนวนผู้ใช้ข้อมูลเพิ่มขึ้นอย่างรวดเร็ว แต่ขอบเขตของข้อมูลที่ใช้มักจะซับซ้อนและมีความเสี่ยง โดยเฉพาะอย่างยิ่งเมื่อเกี่ยวข้องกับข้อมูลส่วนบุคคล การเงิน หรือสุขภาพที่มีความอ่อนไหวสูง ด้วยบริษัทสองแห่งที่รวมชุดข้อมูลขนาดใหญ่ที่แยกจากกัน จำเป็นต้องหาวิธีที่มีประสิทธิภาพเพื่อให้แน่ใจว่าวิธีการและมาตรฐานในการปกป้องข้อมูลมีความสอดคล้องกัน มีเพียงผู้ใช้ที่ได้รับอนุญาตเท่านั้นที่สามารถเข้าถึงข้อมูลสำหรับการใช้งานที่ได้รับอนุมัติ และกฎระเบียบด้านความเป็นส่วนตัวจะปฏิบัติตามเขตอำนาจศาลและทั่วโลก . การรวมข้อมูลเป็นเพียงจุดเริ่มต้น เมื่อการควบรวมเสร็จสมบูรณ์ หน่วยงานร่วมจะต้องสามารถให้การตรวจสอบที่ครอบคลุมเพื่อพิสูจน์การปฏิบัติตาม หากไม่มีกรอบการกำกับดูแลข้อมูลที่แข็งแกร่ง การซื้อผู้มีส่วนได้ส่วนเสีย และเครื่องมืออัตโนมัติที่ทำงานในระบบนิเวศข้อมูลของทั้งสองบริษัท การทำเช่นนี้อาจนำไปสู่กระบวนการที่ไม่สามารถจัดการได้และมีความเสี่ยงที่จะขัดขวางคุณค่าของข้อมูลที่รวมกันและอาจนำไปสู่ความเสี่ยงของข้อมูล” ทำไมการฝึกอบรมระบบ AI ของคุณจึงซับซ้อนกว่าที่คุณคิด คำอธิบายโดย Doug Gilbert, CIO และ Chief Digital Officer, Sutherland “หากมีองค์กรเพียงไม่กี่แห่งที่พร้อมปรับใช้ระบบ AI หรือแบบจำลอง ML ที่ปราศจากการแทรกแซงหรือการกำกับดูแลจากมนุษย์ทุกรูปแบบ เมื่อฝึกอัลกอริทึม สิ่งสำคัญอันดับแรกคือต้องเข้าใจความเสี่ยงโดยธรรมชาติของอคติจากสภาพแวดล้อมการฝึกอบรม ข้อมูลการฝึกอบรมการคัดเลือกและอัลกอริทึมตามความเชี่ยวชาญของมนุษย์ในสาขานั้น ๆ และการประยุกต์ใช้ AI กับปัญหาเฉพาะที่ได้รับการฝึกฝนให้แก้ไข การหลีกเลี่ยงสิ่งเหล่านี้หรือทั้งหมดสามารถนำไปสู่ผลลัพธ์ที่คาดเดาไม่ได้หรือเชิงลบ การกำกับดูแลของมนุษย์ – โดยใช้วิธีการต่างๆ เช่น Human-in-the-Loop (HitL), Reinforcement Learning, Bias Detection และการทดสอบการถดถอยอย่างต่อเนื่อง – ช่วยให้มั่นใจว่าระบบ AI ได้รับการฝึกฝนอย่างเพียงพอและมีประสิทธิภาพเพื่อจัดการกับชีวิตจริงใน การโต้ตอบ การทำงานและกรณีการใช้งาน และสร้างผลลัพธ์เชิงบวก” กรณีการใช้งานทางวิทยาศาสตร์กับวิทยาศาสตร์ข้อมูล คำอธิบายโดย Graham A. McGibbon ผู้อำนวยการฝ่ายหุ้นส่วน ACD/Labs “ระบบสารสนเทศทางวิทยาศาสตร์ในปัจจุบันสนับสนุนการแสดงข้อมูลทางอิเล็กทรอนิกส์ที่ได้จากการทดลองและการทดสอบ ซึ่งมักจะเป็นการวิเคราะห์ยืนยันด้วยการตีความ วิทยาศาสตร์ข้อมูลมักเป็นการสำรวจมากกว่า และระบบสนับสนุนมักจะพึ่งพาไปป์ไลน์ข้อมูลและข้อมูลที่สะอาดและครอบคลุมจำนวนมากซึ่งจำเป็นสำหรับการบำบัดทางสถิติที่เหมาะสม ระบบวิทยาการข้อมูลถูกสร้างขึ้นจากข้อมูลปริมาณมากที่ “ระบุได้ดี” ผ่านข้อมูลเมตา ซึ่งจำเป็นสำหรับความสามารถที่สำคัญของเครื่องจักรในการตีความชุดข้อมูลขนาดใหญ่เหล่านี้ด้วยตนเอง และต่อมาได้มาจากความสัมพันธ์และการคาดคะเนที่ไม่ชัดเจน ในท้ายที่สุด ระบบเหล่านี้บางระบบสามารถวนรอบอย่างต่อเนื่องและเป็นอิสระโดยอาศัยการมีเพศสัมพันธ์ที่เพียงพอกับเทคโนโลยีการสร้างข้อมูลอัตโนมัติ อย่างไรก็ตาม นักวิทยาศาสตร์ต้องการความสามารถในการตัดสินผลลัพธ์ของการวิเคราะห์ และดูและสำรวจคุณลักษณะที่ไม่คาดคิดในข้อมูลพร้อมกับการตีความที่มาจากเครื่อง ดังนั้น ผู้บริโภคทางวิทยาศาสตร์เหล่านี้จึงต้องการการแสดงผลลัพธ์ที่พวกเขาสามารถประเมินได้อย่างง่ายดาย เมื่อเปรียบเทียบความสามารถในการส่งออกในปัจจุบันของระบบวิทยาศาสตร์ข้อมูลกับระบบวิทยาศาสตร์ร่วมสมัยหรือในอดีต พวกเขาขาดสัญศาสตร์บางอย่างที่นักวิทยาศาสตร์เฉพาะโดเมนคาดหวัง ดังนั้น ยังคงมีความจำเป็นต้องเชื่อมโยงวิทยาศาสตร์ข้อมูลและวิทยาศาสตร์เฉพาะโดเมน โดยเฉพาะอย่างยิ่งหากต้องการการเปลี่ยนแปลงในภายหลังเพื่อให้ระบบสามารถตีความได้สำหรับการนำไปใช้ต่อไป สิ่งสำคัญคือต้องเข้าใจว่าวิทยาศาสตร์ข้อมูลและวิทยาศาสตร์เฉพาะโดเมนมีแนวโน้มที่จะต้องทำการปรับเปลี่ยนเพื่อรองรับอีกส่วนหนึ่งเพื่อเก็บเกี่ยวผลประโยชน์อย่างเต็มที่จากการสร้างผลลัพธ์ความรู้ที่มนุษย์สามารถแปลได้” เหตุใด Predictive Analytics จึงมีความสำคัญเพิ่มมากขึ้นสำหรับการดำเนินงานที่ชาญฉลาดและยั่งยืน คำอธิบายโดย Steve Carlini รองประธานฝ่ายนวัตกรรมและศูนย์ข้อมูลของ Schneider Electric “ในโลกของดาต้าเซ็นเตอร์ การวิเคราะห์เชิงคาดการณ์ส่วนใหญ่จะใช้สำหรับส่วนประกอบที่สำคัญในสถาปัตยกรรมพลังงานและการระบายความร้อนเพื่อป้องกันการหยุดทำงานโดยไม่ได้วางแผนไว้ ตัวอย่างเช่น โซลูชัน DCIM สามารถดูแบตเตอรี่ของระบบ UPS และรวบรวมข้อมูลเกี่ยวกับการคายประจุ อุณหภูมิ และอายุโดยรวม เพื่อหาคำแนะนำในการเปลี่ยนแบตเตอรี่ คำแนะนำเหล่านี้อิงตามความเสี่ยงที่ยอมรับได้ที่แตกต่างกัน ตัวอย่างเช่น ซอฟต์แวร์จะพูดว่า “ระบบแบตเตอรี่ 4 มีโอกาส 000% ที่จะล้มเหลวในสัปดาห์หน้าและ โอกาส 70% ที่จะล้มเหลวภายใน 2 เดือน” เจ้าหน้าที่อำนวยความสะดวกสามารถจัดการความเสี่ยงและตัดสินใจเกี่ยวกับการเปลี่ยนแบตเตอรี่ได้อย่างมีข้อมูล เมื่อใช้การวิเคราะห์ในศูนย์ข้อมูลขนาดใหญ่ สิ่งสำคัญคือต้องมีการรวมระบบระดับสถานประกอบการไว้ด้วย เนื่องจากระบบเหล่านี้เป็นแกนหลักของห้องไอที ซอฟต์แวร์ระบบไฟฟ้าต้องครอบคลุมสวิตช์เกียร์แรงดันปานกลาง, บัสเวย์, สวิตช์เกียร์แรงดันต่ำ, หม้อแปลงไฟฟ้าทั้งหมด, แผงจ่ายไฟทั้งหมด และหน่วยจ่ายไฟ ซอฟต์แวร์ระบบทำความเย็นต้องครอบคลุมหอหล่อเย็น เครื่องทำความเย็น ปั๊ม ไดรฟ์แบบปรับความเร็วได้ และเครื่องปรับอากาศสำหรับห้องคอมพิวเตอร์ (CRACs) เนื่องจากขนาดและระดับของเครื่องจักรในศูนย์ข้อมูลขนาดใหญ่ จึงจำเป็นต้องรวมระบบทั้งหมดสำหรับการวิเคราะห์เชิงคาดการณ์ที่ครอบคลุม เนื่องจากศูนย์ข้อมูล Edge กลายเป็นส่วนสำคัญของสถาปัตยกรรมศูนย์ข้อมูลและถูกปรับใช้ในวงกว้าง ซอฟต์แวร์ DCIM จึงได้รับประโยชน์จากพื้นที่เก็บข้อมูลบนคลาวด์และ Data Lake ที่ไม่จำกัด การวิเคราะห์เชิงคาดการณ์นั้นมีค่าสูง เนื่องจากแทบไม่มีไซต์เหล่านี้ดูแลโดยช่างเทคนิคบริการ ระบบ DCIM สามารถใช้ประโยชน์จากการวิเคราะห์เชิงคาดการณ์ด้วยการเชื่อมโยงและระบบอัตโนมัติในระดับหนึ่งเพื่อจัดส่งเจ้าหน้าที่บริการและชิ้นส่วนอะไหล่ เมื่อมีการเก็บรวบรวมข้อมูลมากขึ้น ความถูกต้องของการวิเคราะห์ที่ใช้ประโยชน์จากโมเดลการเรียนรู้ของเครื่องจะเชื่อถือได้ การดำเนินการนี้อยู่ในขั้นตอนดำเนินการแล้ว เนื่องจากแม้ในปัจจุบันผู้ปฏิบัติงานของศูนย์ปฏิบัติการที่มีความสำคัญต่อภารกิจก็ยังมีความสามารถในการวางแผนหรือออกแบบระบบที่มีความซ้ำซ้อนทางกายภาพน้อยลง และใช้ซอฟต์แวร์สำหรับการแจ้งเตือนขั้นสูงเกี่ยวกับความสมบูรณ์ของแบตเตอรี่” ลงทะเบียนเพื่อรับจดหมายข่าว InsideBIGDATA ฟรี เข้าร่วมกับเราบน Twitter: @InsideBigData1 – https://twitter.com/InsideBigData1

  • บ้าน
  • Business
  • Data science
  • Marketing
  • Leave a Reply

    Your email address will not be published. Required fields are marked *

    Back to top button