Data science

แอปพลิเคชั่นอันน่าทึ่งของโครงข่ายกราฟนิวรัล

ความสามารถในการทำนายของแมชชีนเลิร์นนิงได้รับการยกย่องอย่างกว้างขวางว่าเป็นสุดยอดของปัญญาประดิษฐ์ทางสถิติ ได้รับการชื่นชมจากความสามารถในการปรับปรุงทุกอย่างตั้งแต่การบริการลูกค้าไปจนถึงการดำเนินงาน โครงข่ายประสาทเทียมจำนวนมาก หลายรุ่น และการปรับใช้การเรียนรู้เชิงลึกถือเป็นหลักประกันสำหรับองค์กรในการหากำไรจากข้อมูล แต่ตามคำกล่าวของ Jans Aasman ซีอีโอของ Franz มีปัญหาเล็กๆ น้อยๆ เพียงอย่างเดียวกับค่านิยมอันสูงส่งนี้ ซึ่งถูกต้องเป็นอย่างอื่น โดยส่วนใหญ่ “ใช้ได้เฉพาะกับชุดข้อมูลแบบยุคลิเดียนเท่านั้น ซึ่งคุณสามารถดูสถานการณ์ได้ และแยกข้อมูลสำคัญออกมาจำนวนหนึ่ง จากนั้นเปลี่ยนมันเป็นตัวเลขในเวกเตอร์ จากนั้นคุณได้ควบคุมการเรียนรู้และการเรียนรู้แบบไม่มีผู้ดูแล และทั้งหมดนั้น” จริงอยู่ที่ ข้อมูลองค์กรส่วนหนึ่งเป็น Euclidian และแปลงเวกเตอร์ได้ง่าย อย่างไรก็ตาม มีข้อมูลหลายมิติที่ไม่ใช่ Euclid มากมายซึ่งทำหน้าที่เป็นตัวเร่งปฏิกิริยาสำหรับกรณีการใช้งานแมชชีนเลิร์นนิงที่น่าประหลาดใจ เช่น: การพยากรณ์เครือข่าย: การวิเคราะห์ความสัมพันธ์ที่แตกต่างกันทั้งหมดระหว่างหน่วยงานหรือเหตุการณ์ในเครือข่ายโซเชียลที่ซับซ้อนของเพื่อนและศัตรูให้ผลที่แม่นยำอย่างน่าประหลาดใจ การคาดการณ์ว่าเหตุการณ์ใดๆ (เช่น ลูกค้าเฉพาะรายที่ซื้อผลิตภัณฑ์บางอย่าง) จะส่งผลต่อผู้เข้าร่วมเครือข่ายอย่างไร ข่าวกรองนี้สามารถปรับปรุงทุกอย่างตั้งแต่แนวทางการตลาดและการขายไปจนถึงข้อบังคับ (รู้จักลูกค้าของคุณ การต่อต้านการฟอกเงิน ฯลฯ) การรักษาพยาบาล การบังคับใช้กฎหมาย และอื่นๆ การจัดประเภทนิติบุคคล: ศักยภาพในการจำแนกหน่วยงานตามเหตุการณ์ต่างๆ เช่น ความล้มเหลวของชิ้นส่วนหรือความล้มเหลวของระบบสำหรับรถยนต์ที่เชื่อมต่อ ตัวอย่างเช่น เป็นสิ่งสำคัญสำหรับการบำรุงรักษาเชิงคาดการณ์ ความสามารถนี้มีความหมายที่ชัดเจนสำหรับการจัดการกลุ่มยานพาหนะ การตรวจสอบสินทรัพย์อุปกรณ์ และแอปพลิเคชัน Internet of Things อื่นๆ คอมพิวเตอร์วิทัศน์ การประมวลผลภาษาธรรมชาติ: การทำความเข้าใจความสัมพันธ์หลายมิติของคำต่อกันหรือรูปภาพในฉากจะเปลี่ยนการปรับใช้โครงข่ายประสาทเทียมทั่วไปสำหรับ NLP หรือคอมพิวเตอร์วิทัศน์ อย่างหลังสนับสนุนการสร้างฉากซึ่งแทนที่จะใช้เครื่องจักรในการดูฉากของรถที่วิ่งผ่านถังดับเพลิงโดยมีสุนัขนอนอยู่ใกล้ ๆ สิ่งเหล่านี้สามารถอธิบายสิ่งเหล่านี้ได้เพื่อให้เครื่องสร้างภาพนั้นขึ้น กรณีการใช้งานแต่ละกรณีเกี่ยวข้องกับข้อมูลมิติสูงที่มีความสัมพันธ์หลายแง่มุมระหว่างเอนทิตีหรือโหนดในระดับที่น่าทึ่งซึ่ง “การเรียนรู้ของเครื่องปกติล้มเหลว” Aasman กล่าว อย่างไรก็ตาม เหมาะสำหรับโครงข่ายนิวรัลแบบกราฟ ซึ่งเชี่ยวชาญในการปรับใช้ข้อมูลมิติสูงเหล่านี้และอื่นๆ เครือข่ายนิวรัลกราฟข้อมูลมิติสูงบรรลุผลสำเร็จเหล่านี้เนื่องจากแนวทางของกราฟมุ่งเน้นไปที่ความสัมพันธ์ที่แยกแยะระหว่างข้อมูล ความสัมพันธ์ในชุดข้อมูลแบบยุคลิเดียนไม่ซับซ้อนเท่ากับในชุดข้อมูลมิติสูง เนื่องจาก “ทุกอย่างที่เป็นเส้นตรงหรือพื้นผิวเรียบสองมิติสามารถกลายเป็นเวกเตอร์ได้” Aasman ตั้งข้อสังเกต ตัวเลขหรือเวกเตอร์เหล่านี้เป็นพื้นฐานสำหรับการสร้างคุณลักษณะสำหรับกรณีการใช้งานแมชชีนเลิร์นนิงทั่วไป ตัวอย่างของชุดข้อมูลที่ไม่ใช่แบบยุคลิเดียนรวมถึงสิ่งต่าง ๆ เช่น ความสัมพันธ์มากมายของระบบเครื่องบิน 100 กับอีกระบบหนึ่ง การเชื่อมโยงระหว่างกลุ่มลูกค้าหนึ่งกลุ่มกับอีกสี่กลุ่มเพิ่มเติม และการพึ่งพาอาศัยกันมากมายของ เชื่อมโยงระหว่างกลุ่มเพิ่มเติมเหล่านั้น ข้อมูลนี้ไม่สามารถแปลงเวกเตอร์ได้ง่ายและหลีกเลี่ยงความสามารถของการเรียนรู้ด้วยเครื่องและโครงข่ายประสาทเทียมแบบกราฟ “ตัวเลขแต่ละตัวในเวกเตอร์จริง ๆ แล้วขึ้นอยู่กับส่วนอื่น ๆ ของกราฟ ดังนั้นมันจึงซับซ้อนเกินไป” Aasman ให้ความเห็น “เมื่อสิ่งต่าง ๆ เข้าสู่กราฟเบาบาง และคุณมีเครือข่ายของสิ่งต่าง ๆ เครือข่ายของยา และยีน และโมเลกุลของยา มันกลายเป็นเรื่องยากมากที่จะคาดเดาได้ว่ายาตัวใดตัวหนึ่งขาดการเชื่อมโยงไปยังสิ่งอื่น” การคาดคะเนความสัมพันธ์ เมื่อบริบทระหว่างโหนด เอนทิตี หรือเหตุการณ์มีความสำคัญจริงๆ (เช่น ในกรณีการใช้งานทางเภสัชกรรมที่อ้างอิงถึง Aasman หรือแอปพลิเคชันเครือข่ายที่ซับซ้อนอื่นๆ) โครงข่ายประสาทแบบกราฟจะให้ความแม่นยำในการทำนายโดยการทำความเข้าใจความสัมพันธ์ของข้อมูล คุณภาพนี้แสดงให้เห็นในสามวิธีหลัก ได้แก่: การทำนายลิงก์: โครงข่ายประสาทกราฟมีความเชี่ยวชาญในการทำนายการเชื่อมโยงระหว่างโหนดเพื่อให้เข้าใจได้ง่ายว่าเอนทิตีมีความเกี่ยวข้องกันอย่างไร และความสัมพันธ์นั้นจะมีผลอย่างไรต่อวัตถุประสงค์ทางธุรกิจ ข้อมูลเชิงลึกนี้เป็นกุญแจสำคัญในการตอบคำถาม เช่น “เหตุการณ์บางอย่างเกิดขึ้นบ่อยขึ้นสำหรับผู้ป่วย สำหรับเครื่องบิน หรือในเอกสารข้อความ และฉันสามารถคาดเดาเหตุการณ์ถัดไปได้จริงหรือไม่” Aasman เปิดเผย การจำแนกประเภทเอนทิตี: ง่ายต่อการจัดประเภทเอนทิตี ขึ้นอยู่กับคุณสมบัติ กราฟโครงข่ายประสาทเทียมทำสิ่งนี้ในขณะที่พิจารณาความเชื่อมโยงระหว่างเอนทิตี ส่งผลให้เกิดการจำแนกประเภทใหม่ที่ยากต่อความสำเร็จหากไม่มีกราฟ แอปพลิเคชั่นนี้เกี่ยวข้องกับการเรียนรู้ภายใต้การดูแล การคาดคะเนความสัมพันธ์ทำให้เกิดการเรียนรู้แบบไม่มีผู้ดูแล กลุ่มกราฟ: ความสามารถนี้บ่งชี้ว่ามีกราฟจำนวนเท่าใดในกราฟหนึ่งๆ และมีความสัมพันธ์กันอย่างไร ข้อมูลเชิงทอพอโลยีนี้อิงจากการเรียนรู้แบบไม่มีผู้ดูแล การรวมคุณสมบัติเหล่านี้เข้ากับแบบจำลองข้อมูลที่มีข้อมูลชั่วคราวที่แพร่หลาย (รวมถึงเวลาของเหตุการณ์ เช่น เมื่อลูกค้าทำการซื้อ) จะสร้างตัวอย่างที่เหมาะสมของการเรียนรู้ด้วยเครื่อง วิธีการนี้สามารถแสดงให้เห็นอนาคตทางการแพทย์ของผู้ป่วยโดยอิงจากอดีตของเขาหรือเธอและเหตุการณ์ที่เกี่ยวข้องทั้งหมดซึ่งประกอบด้วย “คุณสามารถพูดได้ว่าให้ผู้ป่วยรายนี้ ให้โรคต่อไปแก่ฉัน และโอกาสต่อไปที่คุณจะได้รับโรคนั้นโดยเรียงลำดับโอกาสจากมากไปน้อย” อาสมันตั้งข้อสังเกต องค์กรสามารถทำสิ่งเดียวกันสำหรับการเลิกราของลูกค้า ความล้มเหลวของเงินกู้ การฉ้อโกงบางประเภท หรือกรณีการใช้งานอื่นๆ การจำแนกข้อความเชิงทอพอโลยี กราฟความเข้าใจรูปภาพ โครงข่ายประสาทเทียมทำให้เกิดผลลัพธ์ของการเปลี่ยนแปลง เมื่อการแยกแยะความสัมพันธ์ที่ไม่มีใครเทียบได้มุ่งเน้นไปที่แง่มุมต่างๆ ของ NLP และการมองเห็นด้วยคอมพิวเตอร์ สำหรับอดีตนั้นรองรับการจำแนกข้อความทอพอโลยีซึ่งเป็นพื้นฐานสำหรับความเข้าใจภาษาเขียนที่รวดเร็วและละเอียดยิ่งขึ้น การแยกเอนทิตีแบบธรรมดาสามารถระบุคำสำคัญในข้อความได้ “แต่ในประโยค สิ่งต่าง ๆ สามารถอ้างถึงคำก่อนหน้าไปยังคำในภายหลังได้” Aasman อธิบาย “การแยกเอนทิตีไม่ได้พิจารณาถึงสิ่งนี้เลย แต่โครงข่ายประสาทแบบกราฟจะพิจารณาโครงสร้างของประโยค แล้วคุณจะทำสิ่งต่างๆ ได้มากขึ้นในแง่ของความเข้าใจ” วิธีการนี้ยังสนับสนุนความเข้าใจของภาพ ซึ่งกราฟโครงข่ายประสาทเทียมจะเข้าใจวิธีที่ภาพต่างๆ ในภาพเดียวมีความสัมพันธ์กัน หากไม่มีสิ่งเหล่านี้ แมชชีนเลิร์นนิงก็สามารถระบุวัตถุต่างๆ ในฉากได้ กับพวกเขา มันสามารถรวบรวมว่าวัตถุเหล่านั้นมีปฏิสัมพันธ์หรือเกี่ยวข้องกันอย่างไร “ แมชชีนเลิร์นนิงไม่ได้ทำเช่นนั้น” อาสมันระบุ “ไม่ใช่ว่าทุกสิ่งในฉากนั้นเข้ากันได้ดีเพียงใด” โครงข่ายประสาทเทียมแบบกราฟการประกบกับโครงข่ายประสาทเทียมแบบเดิมสามารถอธิบายภาพในฉากต่างๆ ได้อย่างครบถ้วน และในทางกลับกัน จะสร้างฉากที่มีรายละเอียดจากคำอธิบาย กราฟแนวทาง กราฟโครงข่ายประสาทเทียมขึ้นอยู่กับโครงข่ายประสาทเทียมที่คิดค้นขึ้นครั้งแรกในศตวรรษที่ 20 อย่างไรก็ตาม วิธีการของกราฟช่วยให้รูปแบบแรกสามารถเอาชนะข้อจำกัดของการทำให้เป็นเวกเตอร์เพื่อดำเนินการกับชุดข้อมูลที่มีมิติสูงและไม่ใช่แบบยุคลิเดียน เทคนิคกราฟเฉพาะ (และเทคนิคที่คล้อยตามกราฟ) ที่ช่วยในความพยายามนี้ ได้แก่ ดัชนี Jaccard: เมื่อพยายามกำหนดว่าควรมีลิงก์ที่ขาดหายไประหว่างชุดของโหนดหนึ่งหรือชุดของโหนดอื่น ตัวอย่างเช่น ดัชนี Jaccard สามารถแจ้งการตัดสินใจนี้โดยเปิดเผยว่า “โหนดสองโหนดมีความคล้ายคลึงกันในกราฟในระดับใด” Aasman กล่าว เอกสารแนบพิเศษ: แนวคิดทางสถิตินี้เป็น “เทคนิคที่พวกเขาเรียกว่าผู้ชนะใช้เวลาทั้งหมดที่คุณสามารถคาดเดาได้ว่าใครจะได้ทุกอย่างหรือ คุณจะไม่ได้อะไรเลย” อาสมันกล่าว ไฟล์แนบพิเศษจะวัดว่าโหนดอยู่ใกล้กันมากเพียงใด ศูนย์กลาง: ศูนย์กลางคือตัวบ่งชี้ว่าโหนดมีความสำคัญเพียงใดในเครือข่าย ซึ่งสัมพันธ์กับโหนดที่อยู่ระหว่างโหนดอื่น แนวทางกราฟเหล่านี้และวิธีอื่นๆ ช่วยให้โครงข่ายกราฟนิวรัลทำงานกับข้อมูลมิติสูงโดยไม่ต้องแปลงเวกเตอร์ จึงเป็นการขยายยูทิลิตี้โดยรวมของแอปพลิเคชันการเรียนรู้ของเครื่องระดับองค์กร มาตราส่วนการเรียนรู้ด้วยเครื่องแบบหลายมิติ ความแตกต่างที่สำคัญในการใช้โครงข่ายประสาทแบบกราฟกับกรณีการใช้งานที่กล่าวข้างต้นและการนำวิธีการเรียนรู้ของเครื่องทั่วไปมาใช้ คือความซับซ้อนของความสัมพันธ์ที่วิเคราะห์—และขนาดของความซับซ้อนนั้น Aasman อธิบายกรณีการใช้งานที่โครงข่ายประสาทเทียมแบบกราฟคาดการณ์ได้อย่างแม่นยำเกี่ยวกับการกระทำของผู้นำโลกโดยพิจารณาจากปัจจัยการผลิตที่ครอบคลุมช่วงที่ดีกว่าของปี 20,000 เอนทิตีและเกือบครึ่งล้านเหตุการณ์ การมองการณ์ไกลดังกล่าวอยู่ไกลจากนักวิชาการเมื่อเปลี่ยนไปใช้พฤติกรรมของลูกค้า การรักษาพยาบาล หรือการปรับใช้ภารกิจที่สำคัญอื่นๆ ดังนั้นจึงอาจส่งผลกระทบต่อการปรับใช้การประมวลผลทางปัญญาได้เร็วกว่าที่องค์กรรับรู้ เกี่ยวกับผู้เขียน Jelani Harper เป็นที่ปรึกษากองบรรณาธิการที่ให้บริการตลาดเทคโนโลยีสารสนเทศ เขาเชี่ยวชาญด้านแอปพลิเคชันที่ขับเคลื่อนด้วยข้อมูลซึ่งมุ่งเน้นไปที่เทคโนโลยีเชิงความหมาย การกำกับดูแลข้อมูล และการวิเคราะห์ ลงทะเบียนเพื่อรับจดหมายข่าว InsideBIGDATA ฟรี เข้าร่วมกับเราบน Twitter: @InsideBigData1 – https://twitter.com/InsideBigData1

วิทยาศาสตร์ข้อมูล

  • 20การตลาด
  • Leave a Reply

    Your email address will not be published. Required fields are marked *

    Back to top button