Data science

ปล่อยมันไป: ประโยชน์ทางการเงินของการลบข้อมูล

ภูมิปัญญาดั้งเดิมถือได้ว่ากุญแจสู่ชัยชนะในข้อมูลขนาดใหญ่คือการปรับขนาดความสามารถในการรวบรวมข้อมูล การจัดเก็บ และการวิเคราะห์ได้เร็วกว่าคู่แข่ง ยิ่งคุณมีข้อมูลมากเท่าใด คุณก็จะสามารถค้นพบแนวโน้มได้มากขึ้นเท่านั้น และแบบจำลอง ML ของคุณก็จะดีขึ้นเท่านั้น แต่ในบางสถานการณ์ การเก็บข้อมูลไว้เป็นความรับผิดชอบที่อาจทำให้คุณเสียเงินหลายล้าน นั่นเป็นเหตุผลที่บริษัทที่ฉลาดกว่ารู้ว่าเมื่อใดควรปล่อยข้อมูลไป แม้ว่าข้อมูลบางอย่างจะมีคุณค่าและควรเก็บไว้อย่างชัดเจน แต่ข้อมูลอื่นๆ อาจเป็นอันตรายต่อสุขภาพทางการเงินและกฎหมายของบริษัท และควรถูกกำจัดโดยเร็วที่สุดตามกฎหมาย Bill Tolson รองประธานฝ่ายการปฏิบัติตามข้อกำหนดสากลของ Archive 360. “ส่วนหนึ่งของการจัดการบันทึก การจัดการข้อมูล ไม่ใช่แค่การจัดเก็บข้อมูล มันยังกำจัดสิ่งต่างๆ ออกไปด้วย” โทลสันบอกกับดาตานามิ “นั่นคือสิ่งที่หลายคนไม่ยอมรับจริงๆ ความสามารถในการจัดการบันทึกที่ดีคือการกำจัดสิ่งต่างๆ และนั่นคือศิลปะของสิ่งทั้งปวง: เมื่อใดสิ่งที่กลายเป็นสิ่งไร้ค่าสำหรับบริษัท?” เพื่อให้ได้คำตอบสำหรับคำถามนั้น – เมื่อใดที่ข้อมูลบางส่วนจะไร้ค่า–Tolson ชี้ไปที่ชุดรายงานที่ตีพิมพ์ในทศวรรษที่ผ่านมาโดยสภาการปฏิบัติตาม การกำกับดูแลและการกำกับดูแล (CGOC) ซึ่งเป็นฟอรัมด้านกฎหมาย ไอที ความเป็นส่วนตัว ผู้เชี่ยวชาญด้านความปลอดภัย บันทึก และการจัดการข้อมูลที่ได้รับการสนับสนุนจาก IBM เมื่อข้อมูลมีอายุมากขึ้น ค่าก็จะสูญเสียไป อันที่จริง ตามรายงาน 300 ที่มีชื่อว่า “The Information Governance Process Maturity Model” CGOC (ซึ่งยุบไปเมื่อต้นปีนี้) ได้คำนวณ “cost to value gap” และ “risk” to value gap” สำหรับข้อมูลประเภทต่างๆ รวมถึงเอกสารสำนักงานทั่วไป การวิจัยผลิตภัณฑ์ การขาย ข้อมูลลูกค้า ทรัพยากรบุคคล การเงิน และการส่งข้อความ หลังจากผ่านไปประมาณเจ็ดปี สิ่งเหล่านี้ไม่มีคุณค่ามากนัก (ดูรูป) ความเสี่ยงและผลตอบแทนของการถือครองข้อมูลเปลี่ยนแปลงไปตามกาลเวลา (ที่มา: CGOC) ในรายงานอื่น CGOC สรุปว่า 1% ของข้อมูลองค์กรมีความอ่อนไหวต่อการดำเนินคดีและ e-discovery และต้องถูกเก็บรักษาไว้ ในขณะที่ 5% ถูกควบคุมข้อมูลที่ยัง จำเป็นต้องเก็บไว้เป็นระยะเวลาหนึ่งโดยขึ้นอยู่กับกฎระเบียบเฉพาะ Tolson กล่าว CGOC พบว่าข้อมูลอีก 11% มีมูลค่าทางธุรกิจบ้าง เขากล่าว “สิ่งที่สำคัญที่สุดคือพวกเขากล่าวว่า 65% ถึง 69 % ของข้อมูลองค์กรทั้งหมดเป็นขยะและควรกำจัดทิ้ง” โทลสันกล่าว “กำจัดขยะเหล่านั้นเสีย เพราะคุณจ่ายค่าดิสก์ที่หมุนได้ แต่ยิ่งกว่านั้น คุณจะต้องเสียเวลาที่เสียไปในการผ่านมันไป” คำว่า “e-discovery” จะทำให้ CFO ของคุณสั่นคลอน หากพวกเขาอยู่มาเป็นระยะเวลาหนึ่ง หากบริษัทเกี่ยวข้องกับการดำเนินคดี (ซึ่งบริษัทส่วนใหญ่จะประสบในบางช่วงชีวิต) ก็อาจต้องจัดเตรียมเอกสารให้โจทก์ เนื่องจากบริษัทส่วนใหญ่จัดเก็บเอกสารด้วยระบบอิเล็กทรอนิกส์ในปัจจุบัน การค้นพบจึงดำเนินการทางอิเล็กทรอนิกส์ ปัญหาของ e-discovery คือเราไม่มีทนายความรุ่นเยาว์ที่แปลงเป็นดิจิทัลอย่างสมบูรณ์และอัตรา $300 ต่อชั่วโมงของพวกเขา จากข้อมูลของ Tolson 65% ของค่าใช้จ่ายที่เกี่ยวข้องกับ e-discovery สามารถนำมาประกอบกับความจำเป็นในการจ่ายเงินให้ทนายความเพื่อเจาะลึกเอกสารทุกฉบับที่ e- กระบวนการค้นพบที่เน้นว่าเป็นหลักฐานที่มีศักยภาพ “ข้อแลกเปลี่ยนกับการเก็บข้อมูลมากเกินไปคือค่าใช้จ่ายในการเก็บรักษาและจัดการข้อมูล และค่าใช้จ่ายในการรักษาความปลอดภัย” โทลสันกล่าว “แต่ก็รวมถึงค่าใช้จ่ายที่เกี่ยวข้องกับการต้องผ่านมันเพื่อการค้นพบทางอิเล็กทรอนิกส์ด้วย” การศึกษาเมื่อเร็ว ๆ นี้โดยบริษัทเคมีดูปองท์แสดงให้เห็นว่าการเก็บเอกสารที่เกินวันหมดอายุนั้นมีค่าใช้จ่ายสูงเพียงใด จากข้อมูลของ Tolson บริษัท DuPont ได้วิเคราะห์ค่าใช้จ่ายในการค้นหาทางอิเล็กทรอนิกส์ในคดีฟ้องร้องเก้าคดีหรือ 10 และพบว่าพวกเขาใช้เงินไป $25 ล้านถึง $65 ล้านเพื่อตรวจสอบ 24 ล้านเอกสารเพื่อตรวจสอบว่าได้รับสิทธิพิเศษหรือไม่ CGOC เสนอรูปแบบการกำกับดูแลข้อมูล “ในเวลาต่อมาพวกเขาพบว่า จากเอกสารเหล่านั้น 11 ที่พวกเขาตรวจสอบ 11 พวกมันหรือประมาณนั้นหลายล้านตัวหมดอายุแล้วและไม่ควรมีอยู่จริง” โทลสันกล่าว “พวกเขาควรได้รับการกำจัด แต่ด้วยเหตุนี้ พวกเขาจึงใช้เงินเพิ่มอีก $12 เพื่อตรวจสอบเอกสารที่ไม่ควรมีอีกต่อไป” ทุกบริษัทจำเป็นต้องค้นหาว่าสื่อแห่งความสุขคืออะไรระหว่างการลดการเปิดเผยทางกฎหมายในด้านหนึ่ง และการถือชุดข้อมูลที่อาจเป็นประโยชน์สำหรับบริษัท รวมถึงสำหรับโครงการวิเคราะห์ข้อมูลและอัลกอริธึมการเรียนรู้ของเครื่องฝึกอบรม ในการต่อสู้ทางกฎหมายระหว่าง Samsung และ Apple เมื่อเร็ว ๆ นี้ ณ จุดหนึ่ง Samsung ประกาศว่าพวกเขาถืออีเมลเพียงสองสัปดาห์เท่านั้น เว้นแต่จะมีการติดแท็กว่าได้รับการคุ้มครองตามกฎหมายโดยเฉพาะ Tolson กล่าว “สองสัปดาห์ค่อนข้างแปลก” เขากล่าว “อีเมลทำให้คุณเข้าถึงเรื่องแปลกๆ ได้ มีคนเปิดมัน? พวกเขาอ่านหรือไม่ หากพวกเขาเปิดขึ้นมา พวกเขาพยายามที่จะลบมันหรือไม่? สิ่งเหล่านี้ล้วนเป็นสิ่งที่น่าสนใจในชั้นศาล” AI ได้รับการปรับปรุง และอันที่จริง Archive360 เป็นหนึ่งในบริษัทซอฟต์แวร์และบริการหลายแห่งที่ใช้ความสามารถล่าสุดในการประมวลผลภาษาธรรมชาติ (NLP) เพื่อจำลองสิ่งที่ผู้เชี่ยวชาญด้านข้อมูลมนุษย์ (และ บางทีแม้แต่ทนายความ) เก่งมาก แต่โครงการ e-discovery โดยเฉลี่ยยังคงมีค่าใช้จ่ายหลายล้านดอลลาร์ Tolson กล่าว ดังนั้นจึงเป็นการดีที่สุดที่จะหลีกเลี่ยงธุรกิจทั้งหมด “ถ้าเอกสารเหล่านั้นไม่มีอยู่จริง คุณก็ไม่ต้องตรวจสอบ” เขากล่าว วิธีหนึ่งที่ Archive360 กำลังใช้ AI คือการจัดประเภทข้อมูลเพื่อพิจารณาว่าข้อมูลนั้นเหมาะสมกับนโยบายการเก็บรักษาข้อมูลของลูกค้าอย่างไร มนุษย์ยังคงต้องพึ่งพา 90% ถึง 69% ของการพิจารณาว่า ข้อมูลที่ระบุอาจอยู่ภายใต้คำขอ e-discovery และควรย้ายไปยังโฟลเดอร์ที่มีการป้องกัน Tolson กล่าว แม้แต่ข้อมูลก็มีวงจรชีวิตที่สิ้นสุดลงในที่สุด “หากคุณสามารถทำให้เป็นอัตโนมัติด้วยความแม่นยำ 90 หรือ 99% จากนั้นบันทึกข้อมูลผู้คน คนข้อมูลข่าวสาร กำลังจะคลั่งไคล้ เพราะนั่นคือปัญหาที่ใหญ่ที่สุดของพวกเขา” เขากล่าว เอกสารเก่า 360 ยังมี AI ที่ทำหน้าที่เป็นแอปพลิเคชัน “ผู้ดูแล” ภายในโปรแกรมการสื่อสารของลูกค้าเพื่อดูแลสิ่งที่พนักงานพูดและไม่ว่าจะทำผิดกฎหมายหรือไม่ เช่น นายหน้าซื้อขายหุ้น การค้ำประกันผลตอบแทนทางการเงินซึ่งผิดกฎหมาย ดังนั้น AI จึงมีบทบาทมากขึ้นในการริเริ่มการเก็บรักษาบันทึกและการปฏิบัติตามข้อกำหนด แต่ท้ายที่สุดแล้ว มนุษย์กำลังขับเรือ และจำเป็นต้องให้คำแนะนำว่าข้อมูลใดควรถูกเก็บไว้ และข้อมูลใดควรถูกส่งไปยังเครื่องทำลายเอกสารอิเล็กทรอนิกส์ ความเป็นอยู่และผลกำไรของบริษัทขึ้นอยู่กับมัน Tolson กล่าวว่า “การจัดการที่สามารถป้องกันได้เป็นหนึ่งในสิ่งที่กำลังกลายเป็นเรื่องใหญ่สำหรับบริษัทต่างๆ ในขณะนี้ เนื่องจากพวกเขากำลังใช้จ่ายเงินจำนวนมหาศาล ไม่ว่าจะอยู่ในระบบคลาวด์หรือในระบบ Prem เพื่อรักษาสิ่งที่พวกเขาไม่ควรเก็บไว้” “การเพิ่มฟังก์ชันและความสามารถเพิ่มเติมเพื่อบอกว่าคุณควรกำจัดสิ่งนี้จะทำให้ TCO โดยรวมลดลง” รายการที่เกี่ยวข้อง: วิธีที่น่าแปลกใจสามวิธีในการเก็บข้อมูลถาวรสามารถประหยัดเงินได้มาก การลบข้อมูลในโลกที่มีช่องโหว่ใน CCPA ที่ไม่มีที่สิ้นสุด

  • บ้าน
  • Business
  • Data science
  • Marketing
  • Leave a Reply

    Your email address will not be published. Required fields are marked *

    Back to top button