Data science

การทำเหมืองข้อมูลคืออะไร?

การทำเหมืองข้อมูลเป็นส่วนย่อยของการเรียนรู้ของเครื่องและปัญญาประดิษฐ์ที่เก่ากว่า (และปัจจุบันเป็นพันธมิตรกัน) ที่เกี่ยวข้องกับชุดข้อมูลขนาดใหญ่ โดยใช้เทคโนโลยีการจดจำรูปแบบด้วยเทคนิคทางสถิติและคณิตศาสตร์เพื่อคาดการณ์แนวโน้มของธุรกิจและค้นหารูปแบบที่เป็นประโยชน์ “การทำเหมืองข้อมูลเรียกอีกอย่างว่าการค้นพบความรู้ในข้อมูล (KDD)” องค์ประกอบของการขุดข้อมูล การขุดข้อความ วิเคราะห์เอกสารด้วยการวิเคราะห์ข้อความ โดยจัดประเภทเนื้อหาโดยอัตโนมัติเป็น ontology ที่สามารถค้นหาได้ง่าย เทคนิคการทำเหมืองข้อมูลและข้อความประกอบด้วย: การทำโปรไฟล์: การกำหนดลักษณะบรรทัดฐานและการตรวจจับความผิดปกติ การลดข้อมูล: การแทนที่ชุดข้อมูลขนาดใหญ่ด้วยชุดที่เล็กกว่าที่มีข้อมูลสำคัญจำนวนมากในชุดที่ใหญ่ขึ้น เพื่อการประมวลผลและการวิเคราะห์ที่ง่ายขึ้น การเชื่อมโยง: การเชื่อมโยงและการเรียนรู้ เพื่อค้นหาความสัมพันธ์ระหว่างองค์ประกอบการศึกษาตามธุรกรรมที่เกี่ยวข้อง” ซึ่งรวมถึง “การทำเหมืองชุดรายการบ่อยครั้ง การค้นพบกฎ และการวิเคราะห์ตามตลาด” การจัดกลุ่ม: การจัดกลุ่มองค์ประกอบเข้าด้วยกันตามลักษณะที่ใช้ร่วมกัน (เช่น การแบ่งส่วนลูกค้า) แผนที่ที่จัดระเบียบตนเอง: การวิเคราะห์กลุ่มโดยใช้วิธีเครือข่ายประสาทเทียม โดยทั่วไปแล้ว ภาษาคอมพิวเตอร์ Python จะทำเหมืองข้อมูล การทำเหมืองข้อมูลสัญญาว่าจะมีประสิทธิภาพมากขึ้นในฐานะเทคนิคและเครื่องมือของข้อมูลขนาดใหญ่ ปรับปรุงอย่างต่อเนื่อง เช่นเดียวกับความก้าวหน้าในการคาดการณ์ว่าพายุหรือพายุเฮอริเคนจะโจมตีเมื่อใดและที่ใด การขุดข้อมูลยังคงปรับปรุงอย่างต่อเนื่อง เช่น การทำเหมืองข้อมูลที่กำหนดเองสำหรับธุรกิจเฉพาะ คำจำกัดความอื่น ๆ ของการทำเหมืองข้อมูลรวมถึง: “กระบวนการที่ธุรกิจกลั่นกรองข้อมูลเพื่อค้นหาข้อมูลที่เกี่ยวข้อง” (เดวิด แอนเดอร์สัน)”กระบวนการค้นหาความสัมพันธ์ รูปแบบ และแนวโน้มที่มีความหมายโดยการกลั่นกรองข้อมูลจำนวนมากที่จัดเก็บไว้ในที่เก็บข้อมูล การทำเหมืองข้อมูลใช้เทคโนโลยีการจดจำรูปแบบตลอดจนเทคนิคทางสถิติและคณิตศาสตร์” (Gartner IT Glossary)“กระบวนการค้นหารูปแบบและแนวโน้มที่เป็นประโยชน์ในชุดข้อมูลขนาดใหญ่” (OReilly) “สาขาที่เติบโตอย่างรวดเร็วซึ่งเกี่ยวข้องกับเทคนิคการพัฒนาเพื่อช่วยให้ผู้จัดการใช้ประโยชน์จาก” คลังข้อมูลอิเล็กทรอนิกส์อย่างชาญฉลาด ” (MIT)“เทคโนโลยีที่ขาดไม่ได้สำหรับธุรกิจและนักวิจัยในหลากหลายสาขา การทำงานในด้านต่างๆ เช่น สถิติ การเรียนรู้ของเครื่อง การจดจำรูปแบบ ฐานข้อมูล และการประมวลผลประสิทธิภาพสูง การขุดข้อมูลจะดึงข้อมูลที่เป็นประโยชน์” (เอ็มไอที เพรส). กรณีการใช้งาน Data Mining รวมถึง: ผู้ค้าปลีกที่ “พบวิธีที่จะระบุว่าลูกค้ารายใดมีแนวโน้มที่จะใช้จ่ายในระยะยาวเป็นครั้งแรก” บริษัทประกันภัยที่ลดต้นทุนและเร่งการบริการลูกค้าหลังจาก “ค้นพบว่าสำนักงานใดดำเนินการเรียกร้องทั่วไปบางประเภทได้อย่างมีประสิทธิภาพมากขึ้น เหนือสิ่งอื่นใด” หน่วยงานบังคับใช้กฎหมายลดกระบวนการจัดลำดับความสำคัญของคดีที่ไม่มีประสิทธิภาพและทำงานในสิ่งที่ดีกว่า “ผู้ผลิตระบุสัญญาณเตือนการรั่วไหลของสารเคมีโดยให้ข้อมูลที่จำเป็นเพื่อป้องกันอุบัติเหตุในอนาคต ปกป้องสิ่งแวดล้อม และหลีกเลี่ยงการลงทุนและการดำเนินคดีที่มีค่าใช้จ่ายสูง” การขุดข้อมูล ถึง: ช่วยหลีกเลี่ยงความผิดพลาดที่มีค่าใช้จ่ายสูง ทำให้การประมวลผลข้อมูลมีความเกี่ยวข้องมากขึ้นระบุช่องว่างในการเพิ่มผลกำไร คาดการณ์การเคลื่อนไหวของราคาในระยะสั้น รูปภาพที่ใช้ภายใต้สิทธิ์การใช้งานจาก Shutterstock.com

  • บ้าน
  • Business
  • Data science
  • Marketing
  • Leave a Reply

    Your email address will not be published. Required fields are marked *

    Back to top button