Data science

ความลับของ AI สัญลักษณ์ประสาท การเรียนรู้โดยไม่ได้รับการดูแล และเทคโนโลยีภาษาธรรมชาติ

ปัญญาประดิษฐ์อาจเป็นแนวคิดที่เข้าใจผิดมากที่สุดในการจัดการข้อมูลร่วมสมัย องค์กรส่วนใหญ่ไม่มีความชัดเจนเกี่ยวกับความสัมพันธ์ของ AI กับแมชชีนเลิร์นนิง (ไม่ใช่คำพ้องความหมาย) และความแตกต่างระหว่างการเรียนรู้ภายใต้การดูแลและการเรียนรู้ที่ไม่ได้ดูแล ด้วยเหตุนี้ พวกเขาจึงเห็นข้อดีเพียงเล็กน้อยในการรวมแนวทางการเรียนรู้ของเครื่องทางสถิติเข้ากับฐานความรู้ที่เป็นแก่นสารของ AI จับคู่วิธีการเรียนรู้ภายใต้การดูแลที่ยุ่งยากกับสิ่งที่ไม่ได้รับการดูแลอย่างแท้จริง และการนำ Neuro-Symbolic AI ไปใช้ในกระบวนการเทคโนโลยีความรู้ความเข้าใจ นั่นคือ จนกว่าพวกเขาจะรู้ว่ามันช่วยประหยัดเวลาและเงินได้มากเพียงใดในขณะที่เชี่ยวชาญเทคโนโลยีภาษาธรรมชาติเกือบทุกด้าน โดยเฉพาะอย่างยิ่งการถามและตอบคำถาม “Neuro-Symbolic เป็นการพยักหน้าให้กับคำเชื่อมต่อคนเครือข่ายประสาทซึ่งจากนั้นก็เป็นคนเชิงสัญลักษณ์ด้วย” Ryan Welsh CEO ของ Kyndi อธิบาย “มันน่าสนใจมากจริงๆ เพราะในด้าน AI สิ่งที่ผมจะเรียกว่าสองเผ่าหลักคือผู้เชื่อมโยงและแนวทางเชิงสัญลักษณ์ และพวกเขาเกลียดชังกันจริงๆ แต่เส้นทางข้างหน้าคือพวกเขาทำงานร่วมกัน และมีเพียงไม่กี่คนในโลกนี้เท่านั้นที่สามารถทำเช่นนั้นได้” ผู้ที่ประสบความสำเร็จในการเชื่อมโยงแนวทางการเชื่อมต่อของเทคนิคการเรียนรู้ของเครื่องกับเหตุผลเชิงสัญลักษณ์ที่เน้นย้ำฐานความรู้ของ AI ทำให้เทคโนโลยีเหล่านี้มีประสิทธิภาพ ราคาไม่แพง และมีประสิทธิภาพมากขึ้นสำหรับการประยุกต์ใช้ภาษาธรรมชาติในการประมวลผลเกือบทุกชนิด โดยเฉพาะอย่างยิ่งโดเมนการตอบคำถามที่เข้าใจยากก่อนหน้านี้ (ติดป้ายกำกับ) Training Data Dilemma Machine Learning เป็นตัวกำหนดด้านสถิติของ AI ซึ่งแตกต่างจากการใช้เหตุผลเชิงสัญลักษณ์หรือฐานความรู้ การขาดข้อมูลการฝึกอบรมที่มีป้ายกำกับเฉพาะโดเมนเป็นอุปสรรคต่อองค์กรอย่างต่อเนื่องในการริเริ่มโครงการการเรียนรู้ด้วยเครื่องภายใต้หน้ากากของ 'การทำ AI' เมื่อพวกเขาสามารถหาข้อมูลตัวอย่างเพียงพอสำหรับกรณีการใช้งานของพวกเขา พวกเขาจะต้องผ่านกระบวนการที่ยากลำบากในการอธิบายข้อมูลนั้นสำหรับเทคนิคการเรียนรู้ภายใต้การดูแล ซึ่งจำเป็นต้องมีข้อมูลการฝึกอบรมที่มีป้ายกำกับ อ้างอิงจากสเวลช์ กับ “ผู้ค้ารายใหญ่อีกรายจากซีแอตเทิลที่มีความสามารถในการค้นหาทางปัญญา โดยเฉลี่ยแล้วมีค่าใช้จ่าย $250,000 เพียงเพื่อจ่ายเงินให้ผู้อื่นติดป้ายกำกับข้อมูล หากคุณดูบริษัท AI ที่ประสบความสำเร็จทั้งหมด พวกเขาไม่ใช่บริษัท AI พวกเขาเป็น บริษัท ที่ติดฉลากข้อมูล” มีหลายประเด็นที่ต้องอาศัยแนวทางการเรียนรู้ภายใต้การดูแลอย่างแท้จริงสำหรับการประมวลผลภาษาธรรมชาติ การค้นหา การตอบคำถาม และปฏิสัมพันธ์ทางภาษาแบบเรียลไทม์กับระบบข้อมูล ซึ่งรวมถึง: ในการทำภารกิจนี้ให้สำเร็จ “มันเหมือนกับการเปลี่ยนรถบรรทุกน้ำมันที่คุณต้องติดป้ายข้อมูลมากขึ้น ฝึกระบบใหม่ หวังว่ามันจะถูกต้อง ถ้าป้ายข้อมูลไม่ถูกต้อง ฝึกอบรมระบบอีกครั้ง หวังว่ามันจะถูกต้อง และทำซ้ำต่อไป กระบวนการนั้น” เวลช์ระบุไว้ เวลาต่อมูลค่า: เวลาในการค้นพบที่มีความหมายและการดำเนินการที่ตามมาตามชุดข้อมูลที่หลากหลายนั้นยืดเยื้ออย่างมากด้วยวิธีนี้ ความเข้าใจที่จำกัด: เวลส์ตั้งข้อสังเกตว่าหากไม่มีการเพิ่ม “วิธีการทางสถิติจะมีความเข้าใจภาษาที่ตื้นมาก ความหมายไม่ได้อยู่ที่นั่น” นอกเหนือจากการเสริมการพึ่งพาทางสถิติของแมชชีนเลิร์นนิงด้วยการให้เหตุผลเชิงสัญลักษณ์แล้ว กลไก AI Neuro-Symbolic AI อันดับต้นๆ ยังอาศัยวิธีการเรียนรู้ที่ไม่ได้รับการดูแลเพื่อหลีกเลี่ยงค่าใช้จ่าย ความล่าช้าชั่วคราว และปัญหาอื่นๆ ที่มีความซับซ้อนของข้อมูลการฝึกอบรมที่มีป้ายกำกับของการเรียนรู้ภายใต้การดูแล ตามคำจำกัดความ การเรียนรู้แบบไม่มีผู้ดูแลไม่เกี่ยวข้องกับข้อมูลการฝึกอบรมที่มีป้ายกำกับ และใช้เทคนิคต่างๆ เช่น การจัดกลุ่มเพื่อระบุหมวดหมู่หรือรูปแบบในข้อมูล เมื่อใช้ร่วมกับเทคนิคการอนุมานเชิงความหมายอื่นๆ เช่น กราฟความรู้ โมเดลข้อมูลที่ครอบคลุมหรือออนโทโลจี และคำศัพท์—รวบรวมผ่านการแยกวิเคราะห์ข้อมูลด้วยตนเอง—วิธีการที่ไม่ได้รับการดูแลเหล่านี้จะทำงานร่วมกับการเรียนรู้ภายใต้การดูแลเพื่อทำความเข้าใจภาษาสำหรับการค้นหาความรู้ความเข้าใจ ระบบ AI Neuro-Symbolic ดังกล่าว “ไม่ได้รับการดูแลในการสร้างการแทนความรู้ แต่ใช้แบบจำลองภายใต้การดูแลเพื่อดึงข้อมูลเพื่อสร้างการเป็นตัวแทนนั้น” เวลส์กล่าว “มีบางแบบจำลองที่เราได้ฝึกฝนในการทำข้อมูลหรือดึงความรู้จากข้อมูล แต่เป็นแบบจำลองทั่วไปที่ช่วยให้เราสามารถเรียนรู้ด้วยเครื่องด้วยวิธีที่ไม่ได้รับการดูแลเพื่อสร้างการแทนความรู้” ตัวอย่างของความรู้ที่อ้างอิงเป็นภาษาเวลส์ ได้แก่ คำศัพท์ทางธุรกิจหรือแนวคิด เช่น 'ลูกค้า' ที่ระบุในชุดเอกสารเฉพาะ เพื่อให้ผู้ใช้สามารถถามคำถามเกี่ยวกับเรื่องนี้ได้ เหนือสิ่งอื่นใด ด้วยวิธีนี้ พวกเขาไม่จำเป็นต้องสร้างปัญหาข้อมูลการฝึกอบรมที่มีป้ายกำกับใหม่โดยสร้างอนุกรมวิธานที่ละเอียดถี่ถ้วนล่วงหน้า ซึ่งก็คือ “ปัญหาการติดฉลากข้อมูล แต่สำหรับเทคโนโลยีเชิงความหมาย ซึ่งตอนนี้คุณต้องการผู้เชี่ยวชาญที่เป็นมนุษย์ และจดการแทนความรู้ทั้งหมดนั้น ที่อาจใช้เวลานานและบางครั้งระบบเหล่านั้นก็เปราะบางมาก” เวลส์เตือน การให้เหตุผลเชิงสัญลักษณ์ การผสมผสานเทคนิคการเรียนรู้ที่ไม่มีผู้ดูแลและอยู่ภายใต้การดูแลด้วยการใช้เหตุผลเชิงสัญลักษณ์ช่วยให้องค์กรสามารถนำเสนอความรู้ที่จำเป็นในการทำความเข้าใจข้อความของตนโดยไม่ต้องสร้างอนุกรมวิธานล่วงหน้าหรือจ่ายให้กับชุดข้อมูลติดป้ายกำกับ โดยนัยของกระบวนการนี้คือ “การนำสิ่งที่ดีที่สุดของทั้งสองโลกจากเทคโนโลยีความหมายและเทคโนโลยีการเรียนรู้ของเครื่องและกำจัดข้อ จำกัด ของทั้งสอง” เวลส์ตั้งข้อสังเกต การให้เหตุผลเชิงสัญลักษณ์ ฐานความรู้ของ AI มีหน้าที่รับผิดชอบโดยตรงในการทำความเข้าใจการแทนค่าความรู้ ความหมายในการสืบค้น และความสัมพันธ์ของคำศัพท์หรือแนวคิดต่างๆ ที่เกี่ยวข้องกันผ่านเทคโนโลยีกราฟ คำศัพท์และคำจำกัดความที่ดึงมาจากข้อความขององค์กรจะถูกสืบค้นอย่างรวดเร็วในกราฟความรู้ เพื่อที่ว่า “จากมุมมองการตอบคำถามและมุมมองความเข้าใจภาษาธรรมชาติ คุณจะเข้าใจความหมายของภาษามากขึ้นเมื่อเทียบกับวิธีการเรียนรู้ด้วยเครื่อง” เวลส์เปิดเผย ยิ่งกว่านั้น ไม่มีระยะเวลาการฝึกอบรมแบบจำลองที่ยืดเยื้อในนามของผู้ใช้ปลายทาง ในขณะที่ความเข้าใจตามบริบทของความรู้ที่ AI มอบให้นี้ เหมาะอย่างยิ่งสำหรับการแยกแยะข้อเท็จจริงที่ผู้ใช้ไม่ได้ระบุอย่างชัดเจนสำหรับข้อมูลที่ระบบเห็นในตอนแรก “บริษัทผู้ผลิตจากเยอรมนีได้สร้างระบบการเรียนรู้ของเครื่องภายใน” เวลส์เล่า “พวกเขาใช้เวลาแปดปีในการสร้างมัน และข้อมูลจำนวนมากที่มีป้ายกำกับ นักวิทยาศาสตร์ด้านข้อมูลจำนวนหนึ่งที่ทำงานเกี่ยวกับมัน และ นอกกรอบมีผล F1 ที่เหนือกว่าระบบของพวกเขา” พึงระลึกไว้เสมอว่า แม้ว่าการเรียนรู้ด้วยเครื่องจะสนับสนุนทุกอย่างตั้งแต่การมองเห็นด้วยคอมพิวเตอร์ไปจนถึงการประมวลผลภาษาธรรมชาติบางประเภท แต่การเรียนรู้ของเครื่องก็เป็นเพียงสาขาหนึ่งของ AI ความสามารถทางสถิติทำงานได้ดีขึ้นมากเมื่อรวมกับฐานความรู้ของ AI ที่เกี่ยวข้องกับการอนุมานเชิงความหมาย กราฟความรู้ ออนโทโลจีเชิงพรรณนา และอื่นๆ แมชชีนเลิร์นนิงเพียงอย่างเดียว—โดยเฉพาะอย่างยิ่งเมื่อปรากฏเป็นการเรียนรู้ภายใต้การดูแล—ไม่เพียงพอที่จะจัดการกับการตอบคำถามที่ซับซ้อนและการประยุกต์ใช้เทคโนโลยีภาษาธรรมชาติในระดับองค์กร ความเร็ว และความสามารถในการจ่ายได้ บรรดาผู้ที่พึ่งพาแนวทางนี้อย่างไม่เหมาะสมกำลังใช้ศักยภาพของ AI เพียงครึ่งเดียวในการแก้ปัญหาทางธุรกิจด้วยวิธีการที่เป็นนวัตกรรมใหม่ Neuro-Symbolic AI ใช้เทคนิคการเรียนรู้แบบไม่มีผู้ดูแลและควบคุมด้วยสถิติของแมชชีนเลิร์นนิงทางสถิติด้วยวิธีการให้เหตุผลเชิงสัญลักษณ์เพื่อเพิ่มมูลค่าองค์กรของ AI เป็นสองเท่า การแสดงออกทั้งหมดของ AI ทำให้เกิดศักยภาพอย่างเต็มที่สำหรับการค้นหาทางปัญญา แอปพลิเคชันข้อความ และเทคโนโลยีภาษาธรรมชาติ เป็นวิธีการแก้ปัญหาความตึงเครียดระหว่างการเชื่อมต่อและแนวทางเชิงสัญลักษณ์ที่ขัดขวางไม่ให้พวกเขาทำงานร่วมกันในระบบไอทีขององค์กรสมัยใหม่ “ในขณะที่ระบบความรู้ไม่มีความสามารถในการเรียนรู้ แต่ระบบการเรียนรู้ไม่มีความสามารถในการให้เหตุผล” เวลส์กล่าว “เป็นเรื่องที่น่าสนใจจริงๆ ที่ AI เกือบจะมีความหมายเหมือนกันกับการเรียนรู้เชิงลึกและโดยเฉพาะอย่างยิ่งแมชชีนเลิร์นนิง เมื่อแมชชีนเลิร์นนิงเป็นเพียงร่มภายใต้ AI และยังมีเทคนิคอื่นๆ อีกมากมายที่ผู้คนไม่ได้ใช้” เกี่ยวกับผู้เขียน Jelani Harper เป็นที่ปรึกษากองบรรณาธิการที่ให้บริการตลาดเทคโนโลยีสารสนเทศ เขาเชี่ยวชาญด้านแอปพลิเคชันที่ขับเคลื่อนด้วยข้อมูลซึ่งมุ่งเน้นไปที่เทคโนโลยีเชิงความหมาย การกำกับดูแลข้อมูล และการวิเคราะห์ เข้าร่วมกับเราบน Twitter: @InsideBigData1 – https://twitter.com/InsideBigData1 ลงทะเบียนเพื่อรับจดหมายข่าว InsideBIGDATA ฟรี

วิทยาศาสตร์ข้อมูล

  • การตลาด
  • Leave a Reply

    Your email address will not be published. Required fields are marked *

    Back to top button