Data science

Berkeley Lab สร้างความก้าวหน้าในการค้นพบโดยอิสระเพื่อจัดการกับ Data Deluge

การผลิตข้อมูลกำลังแซงหน้าความสามารถของมนุษย์ในการประมวลผลข้อมูลดังกล่าว ไม่ว่าจะเป็นกล้องโทรทรรศน์วิทยุขนาดยักษ์ เครื่องเร่งอนุภาคใหม่ หรือข้อมูล Lidar จากรถยนต์ขับเคลื่อนอัตโนมัติ ข้อมูลที่สร้างขึ้นในปริมาณมากจะนำไปสู่การจัดเก็บข้อมูลขนาดใหญ่ที่ไม่ได้ใช้ ในขณะที่นักวิจัยพยายามแย่งชิงทรัพยากรการคำนวณและพัฒนาอัลกอริทึมเพื่อใช้ประโยชน์จากขุมทรัพย์ข้อมูล . ขณะนี้ นักวิจัยจากห้องปฏิบัติการแห่งชาติ Lawrence Berkeley ได้ก้าวหน้าในด้านที่เรียกว่า “การค้นพบแบบอัตโนมัติ” ซึ่งใช้อัลกอริธึมในการตัดสินใจอย่างมีประสิทธิภาพว่าจะตรวจสอบอะไรเกี่ยวกับชุดข้อมูลที่มีส่วนร่วมของมนุษย์ในระดับต่ำ การค้นพบด้วยตนเองได้แพร่หลายมากขึ้นในช่วงไม่กี่ปีที่ผ่านมา หนึ่งในแนวทางที่โดดเด่นกว่านั้นอาศัยการถดถอยของกระบวนการแบบเกาส์เซียน ซึ่งเป็นวิธีแบบเบย์ซึ่งเหมาะสำหรับชุดข้อมูลขนาดเล็กที่ช่วยให้ค้นพบด้วยตนเองโดยการตรวจสอบข้อมูลส่วนเล็กๆ และมีส่วนร่วมในการจำแนกประเภทความน่าจะเป็น Marcus Noack นักวิทยาศาสตร์ด้านการวิจัยของ CAMERA และผู้เขียนนำรายงานฉบับใหม่ กล่าวว่า “ตรงกันข้ามกับการเรียนรู้อย่างลึกซึ้ง กระบวนการสุ่มสามารถใช้ในการตัดสินใจโดยอิงจากชุดข้อมูลที่มีขนาดค่อนข้างเล็ก และให้ค่าประมาณความไม่แน่นอนซึ่งสามารถเพิ่มประสิทธิภาพกระบวนการเรียนรู้ได้ ในการให้สัมภาษณ์กับ Kathy Kincade ของ Berkeley Lab นักวิจัยจาก Berkeley Lab ในศูนย์คณิตศาสตร์ขั้นสูงสำหรับแอปพลิเคชันการวิจัยพลังงาน (CAMERA) ได้ใช้กระบวนการถดถอยแบบเกาส์เซียนเพื่อพัฒนาเครื่องมือที่เรียกว่า gpCAM ใน CAMERA นักวิจัยได้ใช้ gpCAM สำหรับการทดลองบีมไลน์ซิงโครตรอน – แต่เมื่อเร็ว ๆ นี้ การใช้งานได้ขยายไปสู่พื้นที่อื่นๆ Noack กล่าวว่า “สนามทดลองจำนวนมากขึ้นเรื่อยๆ กำลังใช้ประโยชน์จากการได้มาซึ่งข้อมูลใหม่ที่ดีที่สุดและเป็นอิสระ เพราะเมื่อเป็นเช่นนี้ มักจะเกี่ยวกับการประมาณฟังก์ชันบางอย่าง เมื่อได้รับข้อมูลที่มีเสียงดัง” Noack กล่าว หนึ่งในพื้นที่ใหม่เหล่านั้นคือวัสดุศาสตร์ gpCAM กำลังถูกใช้โดยนักวิจัยใน Molecular Foundry ของ Berkeley Lab เพื่อช่วยให้เข้าใจคุณสมบัติของสารกึ่งตัวนำแบบฟิล์มบาง “แอพพลิเคชั่นระดับนาโนที่ใช้ปัญญาประดิษฐ์และอัลกอริธึมการเรียนรู้ของเครื่อง โดยเฉพาะสำหรับระบบโพรบสแกน ได้รับความสนใจ … มาระยะหนึ่งแล้ว” จอห์น โธมัส นักวิจัยด้านดุษฏีบัณฑิตจาก Foundry กล่าว “เราเริ่มสนใจที่จะใช้กระบวนการเกาส์เซียนในการค้นพบอัตโนมัติในฤดูร้อนของ ” ที่อื่น นักวิจัยกำลังใช้ gpCAM เพื่อตรวจสอบการประกอบ DNA ด้วยตัวเอง “นาโนเทคโนโลยีดีเอ็นเอในการแสวงหาวัสดุที่ทำหน้าที่ประกอบตัวเองมักจะได้รับความทุกข์ทรมานจากความสามารถที่ จำกัด ในการสุ่มตัวอย่างพื้นที่พารามิเตอร์ขนาดใหญ่สำหรับการสังเคราะห์” Aaron Michelson นักวิจัยระดับบัณฑิตศึกษาจากมหาวิทยาลัยโคลัมเบียกล่าว “ทั้งนี้ต้องใช้ข้อมูลจำนวนมากในการเก็บรวบรวมหรือวิธีการแก้ปัญหาการทดลองที่มีประสิทธิภาพมากขึ้น การค้นพบด้วยตนเองสามารถรวมเข้าโดยตรงทั้งในการขุดชุดข้อมูลขนาดใหญ่และแนวทางการทดลองใหม่ วิธีนี้ช่วยให้นักวิจัยหลีกเลี่ยงการทำตัวอย่างเพิ่มเติมโดยไม่ตั้งใจ และทำให้เรานั่งเบาะคนขับเพื่อตัดสินใจได้” และนักวิจัยกล่าวว่า นี่เป็นเพียงจุดเริ่มต้น และ gpCAM มีแอปพลิเคชันต่างๆ ตั้งแต่การศึกษาด้านสิ่งแวดล้อมไปจนถึงการค้นคว้ายา “งานและความเป็นผู้นำของ Noack ได้รวบรวมชุมชนการออกแบบร่วมแบบสหวิทยาการในวงกว้าง” James Sethian ผู้อำนวยการ CAMERA และผู้เขียนร่วมในรายงานกล่าว “การสร้างชุมชนวิทยาศาสตร์ประเภทนี้เป็นหัวใจสำคัญของสิ่งที่ CAMERA พยายามทำ” หากต้องการเรียนรู้เพิ่มเติมเกี่ยวกับงานวิจัยนี้ โปรดอ่านรายงานการวิจัยที่นี่และอ่านรายงานของ Kathy Kincade ของ Berkeley Lab ที่นี่

  • บ้าน
  • Business
  • Data science
  • Marketing
  • Leave a Reply

    Your email address will not be published. Required fields are marked *

    Back to top button