Data science

Big Data at 10: ใหญ่กว่าหมายถึงดีกว่าไหม

คลิกเพื่อเรียนรู้เพิ่มเติมเกี่ยวกับผู้แต่ง Mathias Golombek หากเวลานี้ 10 ปีที่แล้วคุณกำลังทำงานด้านข้อมูลและการวิเคราะห์ มีบางอย่างกำลังจะเกิดขึ้นซึ่งจะครอบงำชีวิตส่วนใหญ่ของคุณในอาชีพการงานของคุณ ฉันกำลังพูดถึงการเกิดขึ้นของ “ข้อมูลขนาดใหญ่” ฉันเพิ่งอ่านว่าที่มาของแนวคิดนั้นสามารถสืบย้อนไปถึงได้ 2011 นอกเหนือจากการเตือนฉันอย่างแน่ชัดว่าฉันอยู่ในอุตสาหกรรมนี้มานานแค่ไหนแล้ว สิ่งนี้ทำให้ฉันมีเหตุผลที่จะไตร่ตรองถึงสิ่งที่ทำให้เอะอะทั้งหมดเป็นจริงในที่สุด Big Data หรือ Big Diversion? ฉัน (และยังคง) สงสัยเกี่ยวกับวิธีการอธิบายข้อมูลขนาดใหญ่ ฉันรู้สึกว่าวิธีที่ดีที่สุดคือการคิดว่าข้อมูลขนาดใหญ่เป็นผลพลอยได้จากการแปลงเป็นดิจิทัลของธุรกิจทั้งหมด ไม่ใช่คุณลักษณะที่กำหนดหรือตัวขับเคลื่อนของการเปลี่ยนแปลงนี้ แต่ธุรกิจจำนวนมากกลับได้รับการส่งเสริมจากนักวิเคราะห์และที่ปรึกษาให้เชื่อว่าพวกเขาสามารถบรรลุการเปลี่ยนแปลงได้โดยการเอาชนะความท้าทายทางเทคนิคที่เกี่ยวข้องกับขนาดข้อมูล ไม่ว่าจะโดยตรงหรือโดยอ้อม ฉันเขียนเกี่ยวกับเรื่องนี้ใน 10 หากคุณต้องการดำดิ่งสู่ความคับแค้นนี้ ผลจากการหมกมุ่นอยู่กับความท้าทายทางเทคนิคหมายความว่าหลายปีที่ผ่านมาข้อมูลขนาดใหญ่เกี่ยวข้องโดยตรงกับ Hadoop, Spark และ data lake ที่เต็มไปด้วยข้อมูลที่ไม่มีโครงสร้าง เทคโนโลยีเหล่านี้กำลังจะครองโลก แต่ในท้ายที่สุด โครงการส่วนใหญ่ล้มเหลวหรือไม่ได้รับมูลค่าที่คาดหวัง ทุกวันนี้ เป็นที่ยอมรับกันโดยทั่วไปว่าฐานข้อมูลเชิงสัมพันธ์ที่มีโครงสร้างเป็นแกนหลักที่เหมาะสมกว่าสำหรับการวิเคราะห์ข้อมูลและแอปพลิเคชันข้อมูล การคิดเกี่ยวกับข้อมูลขนาดใหญ่นี้ทำให้เกิดปัญหาสองประการ ประการแรก การจัดเก็บข้อมูลกองใหญ่ในราคาประหยัดทำให้บริษัทต่างๆ สามารถสร้าง Data Lake และแหล่งเก็บข้อมูลขนาดใหญ่ที่พวกเขาพยายามดิ้นรนเพื่อดึงคุณค่าออกมาได้มาก ด้วยเหตุนี้ Data Lake เหล่านี้จึงกลายเป็นทรัพยากรการจัดเก็บข้อมูลแบบพาสซีฟมากกว่าที่จะเป็นชั้นข้อมูลแบบรวมศูนย์และแหล่งที่มาของข้อมูลเชิงลึกใหม่ๆ ประการที่สอง การมุ่งเน้นไปที่เทคโนโลยีทำให้องค์กรหันเหความสนใจจากความท้าทายที่แท้จริงของการสร้างวัฒนธรรมที่ขับเคลื่อนด้วยข้อมูล ทีมงานขนาดใหญ่ได้รับการว่าจ้างให้จัดการกับเทคโนโลยีข้อมูลขนาดใหญ่ที่ซับซ้อน แต่นั่นทำให้กลุ่มเหล่านี้กลายเป็นทีมพัฒนาที่มุ่งเน้นการนำไปใช้ในระดับเทคโนโลยีมากกว่าที่จะเปลี่ยนแปลงบริษัท ใช้เวลานานกว่าที่เคยทำมาเพื่อพิสูจน์ว่ากุญแจสำหรับวัฒนธรรมที่ขับเคลื่อนด้วยข้อมูลอยู่ในความเรียบง่ายของเทคโนโลยีแทนที่จะเป็นความซับซ้อน ในการสร้างกลยุทธ์ข้อมูลที่ถูกต้อง การรักษาความมุ่งมั่นของผู้นำ การศึกษาผู้ใช้ และการกำหนดมาตรฐาน กระบวนการ และกฎเกณฑ์ของการมีส่วนร่วม ตกลง สบายดี – มันไม่ได้แย่ไปซะหมด เรายังห่างไกลจากสถานะที่บริษัทต่างๆ มักขับเคลื่อนด้วยข้อมูลหรือแปลงข้อมูลเป็นประจำ อย่างไรก็ตาม ในขณะที่มันล้มเหลว (ในตอนนี้) ในการทำตามสัญญา แต่บิ๊กดาต้าสามารถให้เครดิตกับสิ่งที่ยอดเยี่ยมมากมายในโลกของการวิเคราะห์องค์กรในปัจจุบัน องค์กรต่างๆ ได้สร้างกลยุทธ์และทีมทั้งหมดโดยเฉพาะเพื่อจัดการข้อมูลเป็นทรัพย์สินขององค์กร ซึ่งมักจะอยู่ภายใต้ผู้นำที่ทุ่มเทให้กับผู้บริหาร ไม่มีสิ่งใดเกิดขึ้นก่อนแนวโน้มของข้อมูลขนาดใหญ่ นอกจากนี้ยังมีการปรับปรุงพื้นฐานเกี่ยวกับวิธีการเปลี่ยนชุดข้อมูลขนาดใหญ่เป็นข้อมูลเชิงลึก ใช้ในการตัดสินใจโดยอัตโนมัติ หรือใช้เพื่อขับเคลื่อนการเพิ่มประสิทธิภาพ ต้องขอบคุณประสบการณ์ที่ได้รับและการวางรากฐานระหว่างการเดินทางของข้อมูลขนาดใหญ่ การผสานรวมแหล่งข้อมูลที่หลากหลายทำได้ง่ายกว่าที่เคย การปรับปรุงการรู้เท่าทันข้อมูล มาตรการคุณภาพข้อมูล การกำกับดูแลข้อมูล แค็ตตาล็อกข้อมูล และการรักษาความปลอดภัย – เรามีการย้ายข้อมูลขนาดใหญ่เพื่อขอบคุณสำหรับการพัฒนาทั้งหมดเหล่านี้ ที่ไหนต่อไป? ถึงกระนั้น ความปรารถนาของฉันสำหรับทศวรรษหน้าก็คือข้อมูลและการวิเคราะห์ และผู้เชี่ยวชาญที่ทำงานในสาขาเหล่านี้ ที่จะหลุดพ้นจากการเชื่อมโยงใดๆ กับข้อมูลขนาดใหญ่ ขนาดเล็ก กลาง หรือเพียงตัวอย่างเสียงทางสถิติของชุดข้อมูลที่ใหญ่กว่านั้นก็สามารถสร้างกรณีการใช้งานที่น่าทึ่งได้ แจ้งการตัดสินใจที่สำคัญหรือเพิ่มประสิทธิภาพกระบวนการ หลังจากให้ความสำคัญกับความซับซ้อนของยุคข้อมูลขนาดใหญ่แล้ว ฉันก็ตั้งตารอที่จะเห็นว่าการมุ่งเน้นที่ความเรียบง่ายในปัจจุบันเป็นอย่างไร สำหรับฉัน การบรรจบกันของ Data Science ฐานข้อมูลเชิงสัมพันธ์ และระบบธุรกิจอัจฉริยะ ในที่สุดควรจะสามารถส่งมอบคำมั่นสัญญาของทีมที่ขับเคลื่อนด้วยข้อมูลและวัฒนธรรมที่พวกเขาเติบโตได้ (สิ่งนี้สำคัญเพราะ Data Science จะต้องดำเนินการและให้บริการแก่ผู้ใช้ข้อมูลมาตรฐาน หากไม่ต้องการให้เกิดซ้ำในโลก Hadoop และแซนด์บ็อกซ์ที่ลึกลับ) ในทำนองเดียวกัน การถ่ายโอนความเป็นเจ้าของข้อมูลจะเป็นการเปลี่ยนแปลงอย่างแท้จริง ธุรกิจเพื่อให้ทีมข้อมูลส่วนกลางไม่เป็นปัญหาคอขวดสำหรับโครงการและแอปพลิเคชันอีกต่อไป เส้นทางที่เป็นไปได้ที่น่าสนใจสำหรับผลลัพธ์นี้ ได้แก่ การแยกสถาปัตยกรรมข้อมูลแบบรวมศูนย์เพื่อสนับสนุนโมเดลแบบกระจาย เช่น การออกแบบ data mesh ทุกวันนี้ยังซับซ้อนเกินไปที่จะสร้างแอปพลิเคชันข้อมูล อุตสาหกรรมจึงจำเป็นต้องเร่งการพัฒนาเครื่องมือและเทคนิคที่ช่วยให้องค์กรสามารถทำข้อมูลได้มากขึ้นโดยไม่ต้องใช้ทักษะเฉพาะทาง แนวโน้ม Hyperautomation ที่เกี่ยวข้องกับ RPA, AI และแมชชีนเลิร์นนิงล้วนให้คำมั่นสัญญาอย่างมากเกี่ยวกับวิธีที่เราทำงานกับข้อมูลและวิธีที่เราใช้เพื่อทำให้กระบวนการของบริษัทในขอบเขตกว้างกว่าในปัจจุบันเป็นดิจิทัล ตัวอย่างเช่น นานแค่ไหนก่อนที่เราจะสามารถสร้างฝาแฝดดิจิทัลของทั้งองค์กร ซึ่งเราสามารถเพิ่มประสิทธิภาพกระบวนการและการดำเนินงานได้อย่างต่อเนื่อง และสุดท้าย ถ้าไม่มากเกินไปที่จะถาม ฉันหวังว่านี่จะเป็นครั้งสุดท้ายเป็นเวลาอย่างน้อย ปีที่ฉันต้องเขียนบล็อกโพสต์เกี่ยวกับข้อมูลขนาดใหญ่

  • บ้าน
  • Business
  • Data science
  • Marketing
  • Leave a Reply

    Your email address will not be published. Required fields are marked *

    Back to top button