Data science

บทวิจารณ์หนังสือ: คณิตศาสตร์สำหรับการเรียนรู้ของเครื่อง

บทความนี้นำเสนอตอนต่อไปของการวิจารณ์หนังสือของฉันโดยเน้นที่คณิตศาสตร์ของการเรียนรู้ด้วยเครื่อง ฉันรู้สึกกระปรี้กระเปร่าเกี่ยวกับแหล่งข้อมูลการเรียนรู้ใหม่ๆ ที่ออกมาโดยสอดคล้องกับหัวข้อนี้ ตามที่ฉันบอกกับนักเรียน Introduction to Data Science เป็นสิ่งสำคัญสำหรับนักวิทยาศาสตร์ข้อมูลทุกคนที่จะต้องมีความรู้พื้นฐานทางทฤษฎีสำหรับสาขาของเรา หากปราศจากสิ่งนี้ เราแค่คาดเดาจริงๆ ว่าเมื่อต้องดำเนินการต่างๆ เช่น การปรับแต่งไฮเปอร์พารามิเตอร์ “Mathematics for Machine Learning” โดย Marc Peter Deisenroth, A. Aldo Faisal และ Cheng Soon Ong จัดพิมพ์โดย Cambridge University Press เป็นวิธีที่ยอดเยี่ยมในการเรียนรู้คณิตศาสตร์เบื้องหลังแบบจำลองต่างๆ บทวิจารณ์นี้จะเน้นให้เห็นถึงความพิเศษของหนังสือเล่มนี้ในการแข่งขัน ในบรรดาหนังสือทั้งหมดที่ฉันได้วิจารณ์จนถึงตอนนี้ เล่มนี้เป็นเล่มโปรดของฉัน อ่านต่อเพื่อเรียนรู้ว่าทำไม ความครอบคลุมที่ดีเยี่ยม ตามที่แสดงในสารบัญด้านล่าง หนังสือเล่มนี้มีความครอบคลุมที่ดีเยี่ยมสำหรับหัวข้อที่สำคัญทั้งหมด ฉันพบ Part I, Mathematical Foundations ซึ่งเป็นร้านค้าครบวงจรสำหรับพื้นฐานทางคณิตศาสตร์ทั้งหมดที่จำเป็นต่อการชื่นชมหัวข้อเฉพาะ ML ทั้งหมดในส่วนที่ II ไม่จำเป็นต้องมีตำราหลายเล่มเกี่ยวกับพีชคณิตเชิงเส้นและแคลคูลัสเวกเตอร์ คุณสามารถติดตามหัวข้อเหล่านี้ได้อย่างรวดเร็วโดยการอ่านบทอย่างเป็นระบบ ฉันยังชื่นชมความก้าวหน้าเชิงตรรกะของหัวข้อต่างๆ เนื่องจากมันสมเหตุสมผลสำหรับการได้รับรากฐานที่มั่นคงสำหรับคณิตศาสตร์ของ ML ส่วนที่ 1: บทนำเกี่ยวกับพื้นฐานทางคณิตศาสตร์และแรงจูงใจพีชคณิตเชิงเส้นการวิเคราะห์เรขาคณิตการสลายตัวของเมทริกซ์เวกเตอร์แคลคูลัสความน่าจะเป็นและการกระจายการเพิ่มประสิทธิภาพอย่างต่อเนื่อง ส่วนที่ II: ปัญหาการเรียนรู้ของเครื่องส่วนกลางเมื่อแบบจำลองตรงกับข้อมูลการถดถอยเชิงเส้น การลดมิติด้วยการวิเคราะห์องค์ประกอบหลัก การประมาณความหนาแน่นด้วยแบบจำลองส่วนผสมแบบเกาส์เซียนการจำแนกประเภทที่ผลิตด้วยเครื่องเวกเตอร์ที่คัดลอกแล้วสวยงาม หนังสือเล่มใหม่จากสำนักพิมพ์ ฉันไม่เคยแน่ใจถึงระดับคุณภาพสิ่งพิมพ์ที่ฉันอาจพบเจอ หนังสือบางเล่มบอบบาง บางเล่มแก้ไขได้ไม่ดี และบางเล่มทำเรื่องไร้สาระ เช่น เผยแพร่การแสดงข้อมูลสีเป็นภาพขาวดำ ในทางกลับกันหนังสือเล่มนี้น่าทึ่งมาก! คุณภาพการผลิตสูงมาก และตัวเลข โอ้ ตัวเลข! ฉันไม่เคยเห็นหนังสือคณิตศาสตร์ที่มีชีวิตเหมือนเล่มนี้มาก่อน และกราฟิกที่มีสีสันและผ่านการไตร่ตรองอย่างดีจะป้อนความรู้สึก และช่วยในการสื่อสารเรื่องเชิงลึกและเทคนิคอย่างระมัดระวัง ตัวอย่างเช่น ทุกบทจะมี “Mind Map” ที่เป็นโครงร่างของหัวข้อทั้งหมดที่ครอบคลุม และจะนำไปใช้ในบทต่อๆ ไปอย่างไร เหตุใดหนังสือทุกเล่มจึงไม่มีคู่มือที่เป็นประโยชน์สำหรับการเรียนรู้นี้ Mind Map ของแนวคิดที่นำเสนอในบทที่ 5 เกี่ยวกับ Vector Calculus Mathematical Clarity Visualization ของการคำนวณเกรเดียนต์ของเมทริกซ์ที่เกี่ยวกับเวกเตอร์ หนังสือเล่มนี้ประกอบด้วยคณิตศาสตร์ที่ชัดเจนและรัดกุมมาก โดยไม่มีการ “โบกมือ” ในการสืบทอด แต่ทุกบทนั้นมีความยาวมากกว่า แบบฝึกหัด “ตัวอย่าง” ที่เจาะลึกลงไปในทฤษฎี อีกครั้ง ผู้เขียนได้รวมการสร้างภาพข้อมูลที่สวยงามซึ่งออกแบบมาเพื่อช่วยในการทำความเข้าใจคณิตศาสตร์ดังที่แสดงในรูปที่อยู่ติดกัน นอกจากนี้ แต่ละบทยังมีแบบฝึกหัดที่ออกแบบมาอย่างดีเพื่อช่วยให้ผู้อ่านเข้าใจหัวข้อต่างๆ ได้ดีขึ้น ทรีทเม้นต์ที่ฉันชอบที่สุดในหนังสือเล่มนี้ ได้แก่ การสลายตัวของค่าเอกพจน์ (ส่วนที่ 4.5), การไล่ระดับสีของฟังก์ชันค่าเวกเตอร์ (ส่วนที่ 5.3), การเพิ่มประสิทธิภาพโดยใช้การไล่ระดับสีแบบไล่ระดับสี (ส่วนที่ 7.1), การถดถอยเชิงเส้นแบบเบย์ (ส่วนที่ 9.3) และการลดขนาดด้วย PCA (บท 10). หนังสือมีให้ฟรี เหตุผลสำคัญประการสุดท้ายที่ทำให้ชอบหนังสือเล่มนี้คือสามารถดาวน์โหลดได้ฟรีบนเว็บไซต์ที่ผู้เขียนตั้งค่าไว้ ไซต์นี้ยังมีบทช่วยสอนเกี่ยวกับโน้ตบุ๊ก Jupyter จำนวนมากสำหรับการเรียนรู้และการแก้ปัญหา พร้อมด้วยชุดวิดีโอและสไลด์ที่น่าสนใจจาก NeuralIPS 2020 เกี่ยวกับการผสานรวมและการสร้างความแตกต่าง โดยสรุป ฉันขอแนะนำหนังสือเล่มนี้ให้กับนักวิทยาศาสตร์ด้านข้อมูลที่มีความปรารถนาที่จะได้รับรากฐานที่มั่นคงสำหรับวิธีการทำงานของอัลกอริธึมการเรียนรู้ของเครื่อง นักวิทยาศาสตร์ข้อมูลที่ใช้เนื้อหาสำคัญในหนังสือเล่มนี้ได้สำเร็จจะรู้สึกซาบซึ้งใจกับสิ่งที่เกิดขึ้นภายใน “กล่องดำ” ของอัลกอริทึมที่ได้รับความนิยมมากที่สุด สนับสนุนโดย Daniel D. Gutierrez หัวหน้าบรรณาธิการและนักวิทยาศาสตร์ข้อมูลประจำสำหรับ InsideBIGDATA นอกจากการเป็นนักข่าวสายเทคโนโลยีแล้ว แดเนียลยังเป็นที่ปรึกษาในนักวิทยาศาสตร์ข้อมูล นักเขียน นักการศึกษา และดำรงตำแหน่งเป็นคณะกรรมการที่ปรึกษาของบริษัทสตาร์ทอัพหลายแห่ง ลงทะเบียนเพื่อรับจดหมายข่าว InsideBIGDATA ฟรี เข้าร่วมกับเราบน Twitter: @InsideBigData1 – https://twitter.com/InsideBigData1

  • บ้าน
  • Business
  • Data science
  • Marketing
  • Leave a Reply

    Your email address will not be published. Required fields are marked *

    Back to top button