Data science

คลื่นลูกถัดไปของการวิเคราะห์ความรู้ความเข้าใจ: การเรียนรู้ของเครื่องด้วยกราฟ

อุตสาหกรรมโดยรวมเริ่มตระหนักถึงความเชื่อมโยงที่ใกล้ชิดระหว่างปัญญาประดิษฐ์กับรากฐานความรู้ที่ไม่ค่อยมีใครรู้จัก แต่มีศักยภาพเท่าเทียมกัน ความโดดเด่นที่เพิ่มขึ้นของกราฟความรู้ในการวิเคราะห์เกือบทุกรูปแบบ ตั้งแต่โซลูชัน Business Intelligence ทั่วไปไปจนถึงเครื่องมือวิทยาศาสตร์ข้อมูล ชี้ให้เห็นถึงข้อเท็จจริงนี้ เช่นเดียวกับความสนใจที่เพิ่มขึ้นใน Neuro-Symbolic AI ในกรณีการใช้งานเหล่านี้ส่วนใหญ่ กราฟเป็นกรอบการทำงานสำหรับการให้เหตุผลอย่างชาญฉลาดเกี่ยวกับแนวคิดทางธุรกิจที่มีความเข้าใจมากกว่าการเรียนรู้ด้วยเครื่องเพียงอย่างเดียว อย่างไรก็ตาม สิ่งที่องค์กรจำนวนมากยังไม่ตระหนักก็คือ มีการเคลื่อนไหวที่สำคัญเท่าเทียมกันซึ่งดึงดูดฐานความรู้ของ AI ซึ่งช่วยปรับปรุงความสามารถในการเรียนรู้ทางสถิติได้อย่างมาก ทำให้อย่างหลังมีประสิทธิภาพมากขึ้น ในแอพพลิเคชั่นเหล่านี้ กราฟไม่ได้เป็นเพียงการนำเสนอรูปแบบทางเลือกของ AI ให้กับแมชชีนเลิร์นนิงที่เติมเต็มมันอย่างเป็นธรรมชาติ พวกเขาจัดหาการตั้งค่า—ความสามารถในการมองเห็น มิติ และโทโพโลยี—สำหรับการขยายข้อดีของเวกเตอร์ที่แกนหลักของ AI เชิงสถิติด้วยเทคนิคต่างๆ รวมถึงการฝัง การเรียนรู้ที่หลากหลาย และการจัดกลุ่ม การใช้ฐานความรู้ของ AI เพื่อปรับปรุงฐานทางสถิติผ่านความสามารถของกราฟเพื่อเพิ่มความถนัดของการเรียนรู้ด้วยเครื่องเป็นข้อพิสูจน์เพิ่มเติมถึงความจริงที่ไม่มีปัญหาว่าสำหรับ AI “ถ้าคุณไม่ใช้วิธีที่หลากหลาย แสดงว่าคุณกำลังจำกัดตัวเองในภาพรวมของคุณ ระบบ” Ryan Welsh CEO ของ Kyndi กล่าว การฝัง กราฟความรู้ข้อได้เปรียบที่สำคัญสำหรับแมชชีนเลิร์นนิงคือสภาพแวดล้อมที่เข้าใจความสัมพันธ์ในการอธิบายความซับซ้อนทั้งหมดของการเชื่อมต่อระหว่างแต่ละโหนดของข้อมูล เทคนิคที่เรียกว่าการฝังมีประโยชน์อย่างยิ่งในเรื่องนี้ Keshav Pingali ซีอีโอของ Katana Graph กล่าวว่า “การฝังเป็นวิธีค้นหาความสัมพันธ์ระหว่างเอนทิตีที่ไม่ชัดเจนเสมอไป หากคุณดูที่การเชื่อมต่อของกราฟ” ในบางกรณี การฝังจะทำให้ง่ายขึ้น—ถ้าไม่ลบล้าง—ความจำเป็นในการใช้วิศวกรรมคุณลักษณะที่ต้องใช้เวลาเป็นอย่างอื่น ในการปรับใช้เกือบทั้งหมด จะระบุความสัมพันธ์ที่ไม่เป็นเชิงเส้นระหว่างเอนทิตีเพื่อแจ้งผลการสืบค้นและค้นหาแอตทริบิวต์ที่ใช้ในการสร้างแบบจำลองการเรียนรู้ของเครื่อง “ความสวยงามของการฝังคือถ้าคุณทำถูกต้อง โหนดที่ดูเหมือนไม่เกี่ยวข้องซึ่งอยู่ห่างไกลในกราฟจะจบลงใกล้กันในพื้นที่สามมิติ” Pingali ตั้งข้อสังเกต ผลลัพธ์ดังกล่าวมีความสำคัญอย่างยิ่งต่อการสร้างโมเดลแมชชีนเลิร์นนิงด้วยน้ำหนักและการวัดที่เหมาะสม เพื่อเพิ่มการใช้ข้อมูลการฝึกอบรมให้เกิดประโยชน์สูงสุดสำหรับโมเดลที่แม่นยำที่สุด การฝังแผนที่ยังเป็นวิธีการเร่งความสามารถในการค้นหาด้วยความรู้ความเข้าใจเพื่อแสดงผลลัพธ์ที่เหมาะสมกับผู้ใช้ในเวลาเพียงเศษเสี้ยวของเวลาที่จำเป็นในการทำเช่นนั้น Pingali กล่าวว่ามีหลายวิธีในการดำเนินการฝัง ซึ่งบางวิธีเกี่ยวข้องกับ Convolutional Neural Networks และเทคนิค Web to Web “สิ่งที่คุณทำในแบบจำลองพื้นที่เวกเตอร์คือคุณนำทุกโหนดมาและทำแผนที่ไปยังจุดใดจุดหนึ่งในพื้นที่มิติขนาดใหญ่” Pingali เปิดเผย “แล้ววิธีการทำแผนที่ก็คือมีโหนดที่เกี่ยวข้อง โหนดที่มีคุณสมบัติคล้ายกัน ซึ่งอาจไม่เกี่ยวข้องกันในกราฟ” การฝังจัดตำแหน่งโหนดเหล่านั้นเข้าด้วยกัน ดังนั้นโทโพโลยีจึงแสดงความคล้ายคลึงกันตามปัญหาทางธุรกิจ ในพื้นที่เภสัชกรรม วิธีการนี้มีประโยชน์สำหรับ “การสร้างสมมติฐาน” Pingali อธิบาย “การทดลองใช้ยาในห้องแล็บนั้นมีราคาแพงมากเพื่อดูว่ายาได้ผลหรือไม่ ดังนั้นหากคุณจำกัดกลุ่มยาให้แคบลงโดยใช้กราฟและ AI ก็จะช่วยประหยัดได้ เงินจำนวนมหาศาล” การเรียนรู้ที่หลากหลาย ในกรณีการใช้งานอื่นๆ บริษัทสามารถใช้ประโยชน์จากการฝังเพื่อค้นหาองค์ประกอบหรือสารประกอบทางเภสัชกรรมที่เกี่ยวข้องมากที่สุดเพื่อบำบัดปัญหาด้านสุขภาพ เช่น โรคเบาหวาน 2 เป็นต้น การแยกแยะความสัมพันธ์ของการฝังคำยังใช้กันอย่างแพร่หลายในด้านเทคโนโลยีภาษาธรรมชาติ รวมถึง AI การสนทนา การสร้างภาษาธรรมชาติ และอื่นๆ ซึ่งเป็นส่วนหนึ่งของ “การเรียนรู้ด้วยเครื่องทางสถิติที่ช่วยให้เราเรียนรู้ความเกี่ยวข้องระหว่างคำ” เวลส์เปิดเผย ตัวอย่างเช่น แอปพลิเคชันของการฝังคำซึ่งมียูทิลิตีการค้นหาแบบองค์ความรู้สามารถกำหนดความเชื่อมโยงระหว่างคำว่า 'apartment complex' และ 'building' การเรียนรู้ของเครื่องสามารถ “เชื่อมโยงคำสองคำนั้นในพื้นที่มิติล่างที่เรียกว่า แมนิโฟลด์ ซึ่งโดยพื้นฐานแล้ว คุณกำลังฝังความสัมพันธ์เหล่านี้ไว้ในพื้นที่มิติล่างนี้” เวลส์กล่าว การเรียนรู้ที่หลากหลายให้การลดขนาดที่ไม่เป็นเชิงเส้น มีประสิทธิภาพอย่างยิ่งกับชุดข้อมูลที่มีมิติข้อมูลสูงและให้มูลค่าที่ยุติธรรมสำหรับทั้งข้อมูลที่ไม่มีป้ายกำกับและข้อมูลที่ติดป้ายกำกับ การเรียนรู้ที่หลากหลายมักใช้ร่วมกับสภาพแวดล้อมการฝังและกราฟ ส่วนผสมนี้มีส่วนรับผิดชอบโดยตรงต่อเทคโนโลยีภาษาธรรมชาติที่เพิ่มขึ้นมาเมื่อเร็วๆ นี้ การทำคลัสเตอร์เป็นรูปแบบหนึ่งของการเรียนรู้แบบไม่มีผู้ดูแลซึ่งมีความโดดเด่นในการตั้งค่ากราฟ เนื่องจากแสดงถึงความซับซ้อนของความสัมพันธ์ระหว่างโหนด ประเภทข้อมูล และการจัดประเภทในลักษณะที่ยากสำหรับระบบอื่นๆ โดยเฉพาะระบบเชิงสัมพันธ์ เทคนิคการจัดกลุ่มเป็นสิ่งที่มีค่ามากสำหรับการปรับใช้การเรียนรู้ของเครื่องเนื่องจากไม่จำเป็นต้องใช้ข้อมูลการฝึกอบรมที่มีป้ายกำกับซึ่งมักจะป้องกันไม่ให้แอปพลิเคชันการเรียนรู้ภายใต้การดูแลระดับองค์กรนำไปใช้ จากข้อมูลของ Pingali กราฟสภาพแวดล้อมมักถูกค้นหาสำหรับการจัดกลุ่มเมื่อมีข้อมูลแบบลำดับชั้นที่เกี่ยวข้อง (เช่นอนุกรมวิธาน เป็นต้น) “กราฟมาตรงนี้ เพราะเมื่อใดก็ตามที่คุณมีลำดับชั้นและคลัสเตอร์ และอื่นๆ คุณต้องมีการแสดงกราฟ” Pingali กล่าว การแสดงข้อมูลกราฟความรู้ การจัดกลุ่ม Louvain และการฝังมีหน้าที่ในการประมวลผลข้อมูลที่จำเป็นสำหรับ Fintech Space และอื่นๆ อย่างรวดเร็ว Pingali อธิบายกรณีการใช้งาน fintech ซึ่ง “เราสามารถทำคลัสเตอร์ Louvain สำหรับชุดข้อมูลที่มีจุดยอดหลายพันล้านจุดและ 30 พันล้านขอบ โดยใช้เทคโนโลยีกราฟทั้งหมดที่เราใช้ในการฝังกราฟความรู้ เรากำลังดำเนินการคำนวณกราฟทั้งหมดเหล่านี้ในระดับที่ห่างไกลออกไป” ย้อนหลัง ผลกระทบโดยรวมของกราฟความรู้สำหรับการเพิ่มมูลค่าองค์กรของการปรับใช้แมชชีนเลิร์นนิงนั้นแสดงให้เห็นอย่างชัดเจนที่สุดในการหวนกลับของกรณีการใช้งานข้างต้น ในแนวดิ่งของ fintech กราฟรับรู้การประมวลผลทางปัญญามีหน้าที่ในการประมวลผลข้อมูลอย่างรวดเร็วด้วยความเร็วสูงมากซึ่งจำเป็นต่อความสำเร็จของอุตสาหกรรมนี้ ด้วยการขยายแนวทาง แนวทางนี้สามารถทำสิ่งเดียวกันสำหรับ Martech, Insurtech และอุตสาหกรรมบริการที่ขับเคลื่อนด้วยข้อมูลที่กำลังเกิดขึ้นใหม่ การใช้งานในแนวนอนของการเรียนรู้ที่หลากหลายและการฝังคำที่รับรู้ผ่านเทคโนโลยีภาษาธรรมชาติ ซึ่งรวมถึงการค้นหาการสนทนา ความเข้าใจภาษาธรรมชาติ และอื่นๆ นั้นชัดเจนในทันที ฟังก์ชันประเภทนี้กำลังซึมเข้าไปในอาร์เรย์ของ BI หรือเครื่องมือค้นหาอย่างเงียบๆ แม้ว่าฟังก์ชันนี้จะได้รับความช่วยเหลืออย่างมากจากกราฟความรู้อื่นๆ ที่เกี่ยวข้องกับการอนุมานเชิงความหมายก็ตาม สุดท้ายนี้ ในอุตสาหกรรมเภสัชกรรม (เช่นเดียวกับวิธีอื่นๆ อีกหลายวิธี) วิธีการคำนวณทางปัญญานี้กำลังเร่งการสร้างคุณลักษณะสำหรับโมเดลการเรียนรู้ของเครื่องในขณะที่ออกคำสั่งเฉพาะกิจในกรอบเวลาที่รวดเร็ว ความสามารถของกราฟกำลังสนับสนุนการเรียนรู้ของเครื่องโดยรวมอย่างเงียบ ๆ ผลกระทบต่อ AI สาขานี้น่าจะชัดเจนขึ้นในวันข้างหน้าเท่านั้น เกี่ยวกับผู้เขียน Jelani Harper เป็นที่ปรึกษากองบรรณาธิการที่ให้บริการตลาดเทคโนโลยีสารสนเทศ เขาเชี่ยวชาญด้านแอปพลิเคชันที่ขับเคลื่อนด้วยข้อมูลซึ่งมุ่งเน้นไปที่เทคโนโลยีเชิงความหมาย การกำกับดูแลข้อมูล และการวิเคราะห์ เข้าร่วมกับเราบน Twitter: @InsideBigData1 – https://twitter.com/InsideBigData1 ลงทะเบียนเพื่อรับจดหมายข่าว InsideBIGDATA ฟรี

วิทยาศาสตร์ข้อมูล

  • การตลาด
  • Leave a Reply

    Your email address will not be published. Required fields are marked *

    Back to top button