Data science

คำถามสัมภาษณ์เกี่ยวกับการเรียนรู้ของเครื่องที่พบบ่อย 10 อันดับแรก

บทความนี้จะนำคุณผ่านคำถามสัมภาษณ์เกี่ยวกับแมชชีนเลิร์นนิง 10 ที่พบบ่อย บริษัทต่างๆ กำลังใช้เทคโนโลยียุคใหม่ เช่น ปัญญาประดิษฐ์ (AI) และแมชชีนเลิร์นนิง (ML) เพื่อให้ผู้ใช้เข้าถึงข้อมูลและบริการได้มากขึ้น เทคโนโลยีเหล่านี้ถูกนำไปใช้ในอุตสาหกรรมต่างๆ เช่น การธนาคาร การเงิน การค้าปลีก การผลิต การดูแลสุขภาพ และอื่นๆ งานขององค์กรที่เป็นที่ต้องการบางส่วนที่ใช้ AI ได้แก่ นักวิทยาศาสตร์ข้อมูล วิศวกรปัญญาประดิษฐ์ วิศวกรการเรียนรู้ของเครื่อง และนักวิเคราะห์ข้อมูล หากคุณต้องการสมัครงานในลักษณะนี้ คุณควรทราบถึงคำถามสัมภาษณ์เกี่ยวกับแมชชีนเลิร์นนิงประเภทต่างๆ ที่นายหน้าและผู้จัดการการจ้างงานสามารถถามได้ บทความนี้จะแนะนำคุณเกี่ยวกับคำถามและคำตอบในการสัมภาษณ์เกี่ยวกับแมชชีนเลิร์นนิงที่พบบ่อยที่สุดบางส่วนที่คุณจะได้พบในการเดินทางเพื่อลงมือได้งานในอุดมคติของคุณ อธิบายว่าปัญญาประดิษฐ์ (AI) แมชชีนเลิร์นนิง (ML) และการเรียนรู้เชิงลึกคืออะไร และหมายถึงอะไร สาขาปัญญาประดิษฐ์ (AI) เกี่ยวข้องกับการสร้างเครื่องจักรอัจฉริยะ ระบบที่สามารถเรียนรู้จากประสบการณ์ (ข้อมูลการฝึกอบรม) จะเรียกว่าการเรียนรู้ของเครื่อง (ML) ในขณะที่ระบบที่เรียนรู้จากประสบการณ์ในชุดข้อมูลขนาดใหญ่จะเรียกว่าการเรียนรู้เชิงลึก (DL) AI อาจถูกมองว่าเป็นส่วนย่อยของการเรียนรู้ของเครื่อง การเรียนรู้เชิงลึก (DL) นั้นคล้ายกับการเรียนรู้ของเครื่อง (ML) แต่เหมาะสำหรับชุดข้อมูลขนาดใหญ่มากกว่า ความสัมพันธ์ระหว่าง AI, ML และ DL นั้นแสดงไว้อย่างคร่าวๆ ในแผนภาพด้านล่าง โดยสรุป DL เป็นเซตย่อยของ ML และทั้งคู่เป็นเซตย่อยของ AI แมชชีนเลิร์นนิงประเภทต่าง ๆ มีอะไรบ้าง วิธีการเรียนรู้ของเครื่องแบ่งออกเป็นสามประเภท การเรียนรู้ภายใต้การดูแล: แมชชีนเรียนรู้ภายใต้การดูแลของข้อมูลที่ติดป้ายกำกับในแนวทางการเรียนรู้ของเครื่องประเภทนี้ เครื่องได้รับการฝึกอบรมในชุดข้อมูลการฝึกอบรม และให้ผลลัพธ์โดยการฝึกอบรม Unsupervised Learning: การเรียนรู้แบบ Unsupervised ประกอบด้วยข้อมูลที่ไม่มีป้ายกำกับ ซึ่งแตกต่างจากการเรียนรู้ภายใต้การดูแล ด้วยเหตุนี้ จึงไม่มีการกำกับดูแลวิธีการประมวลผลข้อมูล การเรียนรู้แบบไม่มีผู้ดูแลคือการค้นหารูปแบบในข้อมูลและจัดกลุ่มรายการที่เกี่ยวข้องออกเป็นกลุ่มๆ เมื่อมีการโหลดข้อมูลป้อนเข้าใหม่ลงในแบบจำลอง จะไม่มีการระบุเอนทิตีอีกต่อไป แทน มันถูกวางไว้ในกลุ่มของวัตถุที่เกี่ยวข้อง การเรียนรู้การเสริมกำลัง: โมเดลที่เรียนรู้และสำรวจเพื่อค้นหาการเคลื่อนไหวที่เป็นไปได้มากที่สุดคือตัวอย่างของการเรียนรู้แบบเสริมกำลัง อัลกอริธึมการเรียนรู้การเสริมแรงถูกสร้างขึ้นในลักษณะที่มีจุดมุ่งหมายเพื่อระบุชุดการกระทำที่เป็นไปได้ที่ดีที่สุดตามหลักการให้รางวัลและการลงโทษ สร้างความแตกต่างระหว่างการทำเหมืองข้อมูลและการเรียนรู้ของเครื่อง การศึกษา การสร้าง และการพัฒนาอัลกอริธึมที่ช่วยให้คอมพิวเตอร์เรียนรู้โดยไม่ต้องสอนอย่างชัดแจ้ง เรียกว่าการเรียนรู้ของเครื่อง ในทางกลับกัน การทำเหมืองข้อมูลเป็นกระบวนการดึงความรู้หรือรูปแบบที่น่าสนใจที่ไม่รู้จักออกจากข้อมูลที่ไม่มีโครงสร้าง อัลกอริทึมการเรียนรู้ของเครื่องถูกนำมาใช้ในขั้นตอนนี้ การเรียนรู้เชิงลึกและการเรียนรู้ของเครื่องแตกต่างกันอย่างไร แมชชีนเลิร์นนิงคือชุดของอัลกอริทึมที่เรียนรู้จากรูปแบบข้อมูลแล้วนำความรู้นั้นไปใช้กับการตัดสินใจ ในทางกลับกัน การเรียนรู้เชิงลึกสามารถเรียนรู้ได้ด้วยตัวเองโดยการประมวลผลข้อมูล เช่นเดียวกับที่สมองของมนุษย์ทำเมื่อรับรู้อะไรบางอย่าง วิเคราะห์ และทำการสรุป ความแตกต่างหลักคือวิธีการให้ข้อมูลกับระบบ อัลกอริธึมการเรียนรู้ของเครื่องมักต้องการอินพุตที่มีโครงสร้าง ในขณะที่เครือข่ายการเรียนรู้เชิงลึกใช้เลเยอร์ของโครงข่ายประสาทเทียม overfitting ในแมชชีนเลิร์นนิงคืออะไร ทำไมมันถึงเกิดขึ้นและคุณจะอยู่ห่างจากสิ่งนี้ได้อย่างไร? Overfitting เกิดขึ้นในแมชชีนเลิร์นนิงเมื่อแบบจำลองทางสถิติอธิบายข้อผิดพลาดแบบสุ่มหรือสัญญาณรบกวนมากกว่าความสัมพันธ์พื้นฐาน Overfitting เป็นเรื่องปกติเมื่อแบบจำลองมีความซับซ้อนมากเกินไป อันเป็นผลมาจากการมีพารามิเตอร์มากเกินไปเกี่ยวกับจำนวนประเภทข้อมูลการฝึกอบรม โมเดลนี้ได้รับการติดตั้งมากเกินไป ส่งผลให้ประสิทธิภาพการทำงานต่ำ การใส่มากเกินไปถือเป็นความเสี่ยงเนื่องจากเกณฑ์ที่ใช้ในการฝึกแบบจำลองไม่เหมือนกับเกณฑ์ที่ใช้ในการประเมินประสิทธิภาพของแบบจำลอง อาจป้องกันการใช้ข้อมูลมากเกินไปได้โดยใช้ข้อมูลจำนวนมาก Overfitting เกิดขึ้นเมื่อคุณมีชุดข้อมูลเพียงเล็กน้อยและพยายามเรียนรู้จากมัน อย่างไรก็ตาม หากคุณมีฐานข้อมูลขนาดเล็ก คุณจะต้องสร้างแบบจำลองตามฐานข้อมูลนั้น การตรวจสอบข้ามเป็นเทคนิคที่อาจใช้ในสถานการณ์นี้ ชุดข้อมูลแบ่งออกเป็นสองส่วนในวิธีนี้: ชุดข้อมูลการทดสอบและการฝึกอบรม ชุดข้อมูลการทดสอบจะทดสอบโมเดลเพียงอย่างเดียว ในขณะที่ชุดข้อมูลการฝึกอบรมจะรวมจุดข้อมูล ในการเรียนรู้ของเครื่อง สมมติฐานคืออะไร การเรียนรู้ของเครื่องช่วยให้คุณใช้ข้อมูลที่คุณต้องเข้าใจฟังก์ชันบางอย่างที่แปลอินพุตเป็นเอาต์พุตได้ดีที่สุด การประมาณฟังก์ชันคือคำศัพท์สำหรับปัญหานี้ คุณต้องใช้ค่าประมาณสำหรับฟังก์ชันเป้าหมายที่ไม่รู้จักซึ่งแปลการสังเกตที่เป็นไปได้ทั้งหมดตามสถานการณ์ที่ให้ไว้อย่างดีที่สุด ในแมชชีนเลิร์นนิง สมมติฐานคือแบบจำลองที่ช่วยในการประมาณฟังก์ชันเป้าหมายและทำการแมปอินพุตกับเอาต์พุตที่จำเป็นให้สมบูรณ์ คุณอาจระบุพื้นที่ของสมมติฐานที่น่าจะเป็นไปได้ซึ่งโมเดลสามารถแสดงได้โดยการเลือกและกำหนดค่าอัลกอริธึม ในการเรียนรู้ของเครื่อง ทฤษฎีบทของ Bayes คืออะไร การใช้ข้อมูลก่อนหน้านี้ ทฤษฎีบทเบย์จะคำนวณความน่าจะเป็นของเหตุการณ์ใดๆ ที่เกิดขึ้น มันถูกกำหนดให้เป็นอัตราบวกที่แท้จริงของเงื่อนไขตัวอย่างเฉพาะหารด้วยผลรวมของอัตราการบวกที่แท้จริงของเงื่อนไขนั้นและอัตราบวกลวงของประชากรทั้งหมดในแง่คณิตศาสตร์ การเพิ่มประสิทธิภาพแบบเบย์และเครือข่ายความเชื่อแบบเบย์เป็นการนำทฤษฎีบทของเบย์มาประยุกต์ใช้ในการเรียนรู้ด้วยเครื่อง ทฤษฎีบทนี้ยังทำหน้าที่เป็นรากฐานสำหรับตัวแยกประเภท Naive Bayes ซึ่งเป็นส่วนหนึ่งของแบรนด์แมชชีนเลิร์นนิง การตรวจสอบข้ามในแมชชีนเลิร์นนิงคืออะไร ในการเรียนรู้ของเครื่อง วิธีการตรวจสอบข้ามช่วยให้ระบบสามารถปรับปรุงประสิทธิภาพของอัลกอริธึมการเรียนรู้ของเครื่องที่กำหนด ซึ่งข้อมูลตัวอย่างจำนวนมากจากชุดข้อมูลจะถูกป้อน ขั้นตอนการสุ่มตัวอย่างนี้ใช้เพื่อแบ่งชุดข้อมูลออกเป็นส่วนเล็ก ๆ โดยมีจำนวนแถวเท่ากัน จากส่วนที่สุ่มเลือกเป็นชุดทดสอบ และส่วนที่เหลือจะคงไว้เป็นชุดรถไฟ วิธีการโฮลด์เอาท์, การตรวจสอบแบบไขว้ K-fold, การตรวจสอบแบบไขว้ k-fold แบบแบ่งชั้น และการตรวจสอบแบบแยกส่วนแบบ p-out เป็นวิธีการบางส่วนที่ใช้ เอนโทรปีในการเรียนรู้ของเครื่องคืออะไร? ในแมชชีนเลิร์นนิง เอนโทรปีเป็นตัวชี้วัดที่ประเมินความไม่แน่นอนของข้อมูลที่จะประมวลผล ยิ่งข้อมูลมีเอนโทรปีมากเท่าไร ก็ยิ่งยากที่จะได้ข้อสรุปที่เกี่ยวข้องจากข้อมูลนั้น ยกตัวอย่างเหตุการณ์พลิกเหรียญ ผลลัพธ์ที่คาดเดาไม่ได้เนื่องจากไม่นิยมหัวหรือก้อย เนื่องจากไม่มีความเชื่อมโยงที่ชัดเจนระหว่างการกระทำของการพลิกกลับและผลลัพธ์ต่างๆ ผลลัพธ์ของการโยนจำนวนเท่าใดก็ได้จึงไม่สามารถคาดเดาได้ง่ายๆ ยุคในการเรียนรู้ของเครื่องคืออะไร? ในแมชชีนเลิร์นนิง คำว่า epoch หมายถึงจำนวนรอบที่อัลกอริธึมแมชชีนเลิร์นนิงได้เสร็จสิ้นในชุดข้อมูลการฝึกอบรมเฉพาะ เมื่อมีข้อมูลจำนวนมาก ก็มักจะถูกแบ่งออกเป็นแบทช์จำนวนมาก การวนซ้ำหมายถึงกระบวนการของแต่ละแบทช์ที่รันผ่านโมเดลที่ให้มา เมื่อขนาดแบทช์เท่ากับขนาดของชุดข้อมูลการฝึกทั้งหมด จำนวนการวนซ้ำจะเท่ากับจำนวนยุค หากมีหลายแบทช์ จะใช้สูตร d*e=i*b โดยที่ 'd' แทนชุดข้อมูล 'e' แทนจำนวนยุค 'i' แทนจำนวนการวนซ้ำ และ 'b' หมายถึง ขนาดแบทช์

  • บ้าน
  • Business
  • Data science
  • Marketing
  • Leave a Reply

    Your email address will not be published. Required fields are marked *

    Back to top button