Data science

กรณีศึกษา: PrecisionProfile พัฒนาการวิเคราะห์ด้านการดูแลสุขภาพด้วยการเตรียมข้อมูลที่ได้รับการปรับปรุง

มีวลีหนึ่งที่ผู้คนไม่ต้องการที่จะได้ยินจากแพทย์ของพวกเขา: “ฉันขอโทษ แต่คุณเป็นมะเร็ง” ตามที่สถาบันมะเร็งแห่งชาติ ประมาณ 1,735,350 ผู้ป่วยโรคมะเร็งรายใหม่จะได้รับการวินิจฉัยในสหรัฐอเมริกา ปีนี้และ 609,640 คนจะเสียชีวิตจากโรคนี้ โชคดีที่แม้จะมีสถิติเหล่านี้ มะเร็งหลายชนิดสามารถรักษาได้และมีอัตราการรอดชีวิตสูง แต่ยังมีโอกาสที่จะปรับปรุงผลลัพธ์เพิ่มเติมสำหรับผู้ป่วยมะเร็งทุกประเภท และอาศัยการช่วยเหลือนักวิทยาศาสตร์ด้านข้อมูลและแพทย์ให้ทำงานอย่างชาญฉลาดยิ่งขึ้นกับข้อมูลขนาดใหญ่ นั่นคือสิ่งที่ PrecisionProfile ตั้งเป้าจะทำ มะเร็งเกิดจากการกลายพันธุ์ในจีโนมมนุษย์ และมะเร็งรูปแบบต่างๆ มาจากการกลายพันธุ์หนึ่งหรือหลายครั้งในการจัดแต่งจีโนมของบุคคล แม้ว่าจะเป็นหลักการที่เข้าใจกันดี แต่ก็สามารถทำได้เมื่อเร็ว ๆ นี้เนื่องจากการลดต้นทุนในการจัดลำดับเนื้องอกมะเร็งเนื่องจากราคาอยู่ที่ประมาณ 1 ดอลลาร์ 000 หรือน้อยกว่านั้น ตามที่ Dave Parkhill ผู้ร่วมก่อตั้ง PrecisionProfile กล่าว ความนิยมที่เพิ่มขึ้นในการจัดลำดับเนื้องอกมะเร็งส่งผลให้เกิดแหล่งข้อมูลขนาดใหญ่ใหม่ที่อาจเก็บข้อมูลข่าวกรองที่ไม่เคยมีมาก่อนสำหรับชุมชนด้านการดูแลสุขภาพ และแพลตฟอร์มบิ๊กดาต้าใหม่จากยักษ์ใหญ่ด้านเทคโนโลยีอย่าง Google, Facebook และ Twitter ทำให้สามารถจัดเก็บและประมวลผลข้อมูลปริมาณมากได้ แต่การเปลี่ยนข้อมูลดิบให้เป็นข้อมูลที่พร้อมใช้งานยังคงเป็นเรื่องท้าทาย PrecisionProfile ทำหน้าที่รวบรวมข้อมูลจีโนมและข้อมูลในเครือ และใช้เทคโนโลยีการจัดการบิ๊กดาต้า เพื่อให้สามารถดึงข้อมูลจีโนมได้หลากหลายรูปแบบจากระบบข้อมูลคลินิกทั้งภายในและภายนอก เมื่อรวบรวมแล้วสามารถจัดโครงสร้างให้กลายเป็นสิ่งที่มีประโยชน์สำหรับนักวิจัยในการวิเคราะห์และจากที่ผู้เชี่ยวชาญด้านเนื้องอกวิทยาสามารถสรุปได้ การใช้แพลตฟอร์ม Oncology Workbench ของ PrecisionProfile ช่วยให้ระบบและนักชีววิทยาระดับโมเลกุลสามารถดำเนินการวิจัยเกี่ยวกับจีโนมหรืออื่น ๆ เกี่ยวกับการเปลี่ยนแปลงที่ขับเคลื่อนโรคต่างๆ เช่น มะเร็ง หรือโรคที่เกิดจากจีโนมได้ จากนั้น การฝึกผู้เชี่ยวชาญด้านเนื้องอกวิทยาสามารถกลั่นข้อมูลเกี่ยวกับไบโอมาร์คเกอร์ การวินิจฉัยระดับโมเลกุล และโปรโตคอลการรักษาที่เกี่ยวข้อง ควบคู่ไปกับแนวทางการทดลองทางคลินิกที่เกี่ยวข้อง นักวิจัยด้านเภสัชกรรมสามารถใช้ระบบได้เช่นกัน ไม่ว่าจะมองหาเป้าหมายของยาหรือจัดการโปรไฟล์จีโนมและฟีโนไทป์เพื่อวัตถุประสงค์ในการทดลองทางคลินิก มุ่งเป้าไปที่การรักษาโรคให้ดีขึ้น ในกรณีของโรคมะเร็ง เมื่อผู้เชี่ยวชาญด้านเนื้องอกวิทยายืนยันการวินิจฉัยเฉพาะของผู้ป่วย – มะเร็งปอดชนิดเซลล์ไม่เล็ก (NSCLC) เป็นต้น – เครื่องมือปรับแต่งเนื้องอกวิทยาของ PrecisionProfile ช่วยแพทย์ในการประเมินทางเลือกในการรักษาที่เหมาะสมที่สุด เพื่อนำไปใช้กับผู้ป่วยรายนั้น สิ่งนี้ต้องขอโปรไฟล์ระดับโมเลกุล (ลำดับจีโนม) ของเนื้องอกของผู้ป่วย การกินรายงานการวินิจฉัยระดับโมเลกุลของผู้ป่วย นำเสนอข้อมูลนั้นด้วยชุดข้อมูลผู้ป่วยที่โหลดไว้ล่วงหน้าซึ่งระบุว่ามีความคลาดเคลื่อนของจีโนมที่คล้ายคลึงกัน จากนั้นจึงรวมข้อมูลดังกล่าวกับข้อมูลของบุคคลที่สามเพิ่มเติมเกี่ยวกับการรักษาที่ทราบและผลลัพธ์สำหรับผู้ป่วยที่มีลักษณะทางพันธุกรรม ฟีโนไทป์ และโมเลกุลคล้ายคลึงกัน แนวคิดของยาที่แม่นยำไม่ใช่เรื่องใหม่ แต่ก่อนหน้านี้ต้องใช้เวลาหลายสัปดาห์ หลายสัปดาห์ของความพยายาม เทคโนโลยีที่หลากหลาย และทีมงานของผู้คนในการรวบรวมและจัดโครงสร้างข้อมูลสำหรับกระบวนการทั้งหมด ตาม PrecisionProfile การใช้เทคโนโลยีช่วยลดเวลานั้นให้เหลือเพียงไม่กี่ชั่วโมง ส่วนสำคัญของซอฟต์แวร์ Oncology Workbench คือการใช้โซลูชันการเตรียมข้อมูลของ Paxata: Paxata Adaptive Information Platform.. แพลตฟอร์มการจัดการข้อมูลระดับองค์กรรองรับการเตรียมข้อมูลแบบบริการตนเองสำหรับข้อมูลขนาดใหญ่ในขนาดและความเร็ว และให้ PrecisionProfile ด้วย ความสามารถในการแยกช่วงขององค์ประกอบข้อมูลหลายส่วนอย่างรวดเร็วและมีประสิทธิภาพซึ่งเครื่องมือทางอณูชีววิทยาส่วนใหญ่มักจะยัดเยียดเข้าด้วยกันในฟิลด์เดียวเป็นต้น ที่สำคัญกว่านั้นคือช่วยให้ PrecisionProfile รวม ล้าง และกำหนดรูปแบบ Big Data เพื่อให้มีประโยชน์สำหรับ Analytics การรวมอัลกอริธึมของ Paxata เข้ากับ Oncology Workbench แสดงถึงการประหยัดเวลาครั้งใหญ่สำหรับนักวิเคราะห์การวิจัยทางอณูชีววิทยา ซึ่งสามารถใช้จ่ายมากกว่า 50 ถึง 80 เปอร์เซ็นต์ของเวลาที่มีการโต้แย้งข้อมูล “พวกเขากำลังใช้เวลานั้นในการหาแหล่งข้อมูลต่างๆ ปรับโครงสร้างใหม่ จากนั้นจัดรูปแบบเพื่อวิเคราะห์ ด้วยเครื่องมือแบบดั้งเดิม ใช้เวลาเพียงร้อยละ 20 ในการวิเคราะห์ข้อมูลเพื่อทำการวิจัยที่จะนำไปใช้กับงานที่นักเนื้องอกวิทยาดำเนินการ พาร์คฮิลล์กล่าว “มีโอกาสที่แท้จริงที่จะช่วยให้ Data Scientists เอาชนะความน่าเบื่อหน่ายของการสร้างข้อมูล และหลีกเลี่ยงการเขียน JavaScript เพื่อให้เข้าใจชุดข้อมูลขนาดมหึมาเหล่านี้” PrecisionProfile ให้ความสามารถในการกรองแบบโต้ตอบที่ซับซ้อนและการนำเสนอด้วยภาพที่ช่วยให้ผู้เชี่ยวชาญด้านเนื้องอกวิทยาตรวจสอบ แยกแยะ และใช้ผลลัพธ์ข้อมูลได้ง่ายขึ้นเช่นกัน จากข้อมูลของ Parkhill โซลูชันไม่ได้พยายามที่จะทะเยอทะยานเท่ากับปัญญาประดิษฐ์ของ IBM Watson ที่อยู่ในพื้นที่ด้านการดูแลสุขภาพ เมื่อพูดถึงการประเมินและใช้ข้อมูลที่รวบรวมและสอดคล้องกันของ Oncology Workbench “เราปล่อยให้การตัดสินใจในการรักษาอยู่ในมือของการฝึกปฏิบัติด้านเนื้องอกวิทยา” เขากล่าว “เป้าหมายคือการให้ข้อมูลทั้งหมดที่พวกเขาต้องการเพื่อตัดสินใจการรักษาสำหรับผู้ป่วยแต่ละราย เราต้องการส่งผลกระทบต่อผลลัพธ์ของผู้ป่วยโรคมะเร็งด้วยการช่วยให้ผู้เชี่ยวชาญด้านเนื้องอกวิทยาประหยัดเวลา รับข้อมูลที่แม่นยำยิ่งขึ้น และวางแผนการรักษาได้รวดเร็วยิ่งขึ้น” PrecisionProfile ดำเนินโครงการนำร่องดั้งเดิมกับมหาวิทยาลัยโคโลราโด ซึ่งเกี่ยวข้องกับการรวมขนาดตัวอย่างที่มีนัยสำคัญของข้อมูลเนื้องอกมะเร็งกระเพาะปัสสาวะที่ได้รับการจัดลำดับเพื่อให้สามารถระบุการกลายพันธุ์ด้วยข้อมูลจาก Cancer Genome Atlas เมื่อรวมกันในตอนแรก ชุดข้อมูลมีจำนวนทั้งหมดประมาณ 18 เทราไบต์ แต่หลังจากใช้ Paxata แล้ว PrecisionProfile ก็ลดขนาดลงเหลือสองร้อยกิกะไบต์ ซึ่ง ทำให้นักวิจัยทำงานได้ง่ายขึ้นมาก “ชุมชนอณูชีววิทยากล่าวว่าข้อมูลจีโนมจะเป็นปัญหาของบิ๊กดาต้า เนื่องจากสามารถเรียกใช้ในระดับเพทาไบต์ได้อย่างง่ายดาย ไม่จำเป็นต้องพูดเลย นั่นทำให้แอปพลิเคชั่นบิ๊กดาต้าอื่น ๆ ล้นหลาม” Parkhill กล่าว ที่ซึ่ง PrecisionProfile มุ่งไปที่ไฟล์ประเภทใดก็ตาม Parkhill กล่าวว่าพวกเขาประหยัดเวลาได้ประมาณสองถึงสามเดือนในการเตรียมใช้งาน “ปัญหาในการจัดเตรียมข้อมูลนี้มีอยู่ในขอบเขตจีโนมเนื่องจากมีมาตรฐานและเทคโนโลยีน้อยมากที่พัฒนาอย่างรวดเร็ว” เขากล่าว “กระบวนการทั้งหมดในการวิเคราะห์โปรไฟล์จีโนมของใครบางคนนั้นขับเคลื่อนด้วยซอฟต์แวร์โดยมีการวิเคราะห์ความน่าจะเป็นที่สำคัญฝังลึกอยู่ในกระบวนการ” ในแต่ละปีอาจมีการเพิ่มเติมฟิลด์ที่รวมอยู่ในไฟล์หรือการเปลี่ยนแปลงในความหมายของหมวดหมู่ฟิลด์ และรูปแบบจะเปลี่ยนไปตามที่เกิดขึ้น “พวกเขาช่วยให้เราซึมซับการเปลี่ยนแปลงเหล่านั้นได้ค่อนข้างง่าย” เขากล่าว ก้าวไปข้างหน้า PrecisionProfile และ Paxata กำลังคิดล่วงหน้าถึงความสามารถในการวิเคราะห์แบบบริการตนเองสำหรับผู้ที่ทำการวิจัยโรคมะเร็งหรือจีโนม “เราจะไปถึงที่นั่น 350 เปอร์เซ็นต์” Parkhill กล่าว “แต่ตอนนี้ถ้าเราสามารถตัด 50 เป็น 20 เปอร์เซ็นต์ของ กระบวนการเตรียมข้อมูลถือเป็นชัยชนะครั้งใหญ่ที่ผู้คนสามารถกลับไปที่ห้องแล็บและทำการค้นพบ และผู้เชี่ยวชาญด้านเนื้องอกวิทยาสามารถพบผู้ป่วยจำนวนมากขึ้นและวางแผนการรักษาได้รวดเร็วยิ่งขึ้น” เครดิตภาพ: Shutterstock.com

  • บ้าน
  • Business
  • Data science
  • Marketing
  • Leave a Reply

    Your email address will not be published. Required fields are marked *

    Back to top button