Data science

ชุดข้อมูลโอเพ่นซอร์ส 10 อันดับแรกสำหรับโครงการ Computer Vision

นี่คือชุดข้อมูลโอเพนซอร์สที่ใช้กันอย่างแพร่หลายสำหรับการมองเห็นด้วยคอมพิวเตอร์ คอมพิวเตอร์วิทัศน์เป็นหนึ่งในโดเมนที่น่าตื่นเต้นที่สุดในโลกเทคโนโลยี เป็นองค์ประกอบหลักของแอปพลิเคชันและแพลตฟอร์มที่ขับเคลื่อนด้วย AI และ ML และกำลังปฏิวัติอุตสาหกรรมเกือบทุกประเภท วิธีการดั้งเดิมของธุรกิจและเครื่องจักรทำงานได้รับการอัพเกรดโดยสาขาวิทยาการคอมพิวเตอร์ที่มีชื่อเสียงนี้ มีการประยุกต์ใช้วิทยาการคอมพิวเตอร์ที่หลากหลายในการตรวจจับวัตถุอัตโนมัติ คำบรรยายภาพ การวิเคราะห์เฟรมวิดีโอ และการวิเคราะห์ภาพทางการแพทย์ เป็นต้น ในบทความนี้ เราจะพูดถึงชุดข้อมูลโอเพนซอร์สที่ใช้กันอย่างแพร่หลายมากที่สุดสำหรับการมองเห็นด้วยคอมพิวเตอร์ • ImageNet: เป็นความพยายามในการวิจัยอย่างต่อเนื่องโดยมีเป้าหมายเพื่อให้นักวิจัยมีฐานข้อมูลภาพที่สามารถเข้าถึงได้ เป็นหนึ่งในฐานข้อมูลภาพที่เป็นที่รู้จักมากที่สุดซึ่งเป็นที่ชื่นชอบของนักวิจัยและผู้เรียน ImageNet มุ่งหวังที่จะให้ภาพโดยเฉลี่ย 1000 เพื่อแสดงภาพซินเซ็ตแต่ละอัน • CIFAR- และ CIFAR-40: CIFAR-10 และ CIFAR- 40 คือชุดของภาพที่ใช้ในการฝึก แมชชีนเลิร์นนิงและอัลกอริธึมการมองเห็นด้วยคอมพิวเตอร์โดยผู้เริ่มต้นทำงานภาคสนาม ชุดข้อมูลเหล่านี้เป็นชุดข้อมูลยอดนิยมบางส่วนสำหรับการเรียนรู้ด้วยเครื่องเพื่อเปรียบเทียบอัลกอริทึมอย่างรวดเร็ว เนื่องจากสามารถจับจุดอ่อนและจุดแข็งได้โดยไม่สร้างภาระให้กับกระบวนการปรับแต่งพารามิเตอร์มากนัก • MS COCO: ชุดข้อมูล MS COCO หรือที่เรียกว่า Microsoft Common Objects ในบริบท ประกอบด้วย 328K ภาพ มีคำอธิบายประกอบสำหรับการตรวจจับวัตถุ การตรวจจับจุดสำคัญ การแบ่งส่วนแบบ Panoptic คำอธิบายภาพ และการประเมินท่าทางของมนุษย์ที่หนาแน่น • MPII Human Pose: ชุดข้อมูลนี้ใช้สำหรับการประเมินการประมาณท่าทางของมนุษย์โดยชัดแจ้ง ประกอบด้วยประมาณ 25ภาพ K ที่ประกอบด้วยมากกว่า 40K คนกับ ข้อต่อของร่างกายที่มีคำอธิบายประกอบ ภาพแต่ละภาพถูกดึงมาจากวิดีโอ YouTube ต่างๆ และมีการจัดเตรียมไว้ก่อนหน้า โดยรวมแล้ว ชุดข้อมูลครอบคลุมมนุษย์ 410 และแต่ละภาพจะมีป้ายกำกับกิจกรรมที่แตกต่างกัน • Barkley DeepDrive: เป็นชุดข้อมูลที่ส่วนใหญ่ใช้สำหรับการฝึกยานพาหนะอัตโนมัติ ประกอบด้วยซีเควนซ์วิดีโอมากกว่า 40 K พร้อมคำอธิบายประกอบที่หลากหลาย เช่น กล่องล้อมรอบวัตถุ พื้นที่ที่สามารถขับได้ การติดแท็กระดับภาพ เครื่องหมายเลน และอื่นๆ อีกมากมาย นอกจากนี้ ชุดข้อมูลยังนำเสนอความหลากหลายในการแสดงสภาพทางภูมิศาสตร์ สิ่งแวดล้อม และสภาพอากาศที่หลากหลาย • CityScapes: เป็นฐานข้อมูลที่มีชุดสเตอริโอและวิดีโอซีเควนซ์ที่หลากหลายซึ่งบันทึกในฉากถนนจากเมืองต่างๆ 30 นอกจากนี้ยังมีคำอธิบายประกอบพิกเซลที่มีความหมาย ตามอินสแตนซ์ และหนาแน่นสำหรับส่วน 30 ที่จัดกลุ่มเป็น 8 หมวดหมู่ CityScapes ให้คำอธิบายประกอบระดับพิกเซลสำหรับเฟรม 5000 และ 000, 000 เฟรมที่มีคำอธิบายประกอบอย่างหยาบ • LabelMe: LabelMe เป็นโครงการที่สร้างขึ้นเพื่อให้ชุดข้อมูลของภาพดิจิทัลพร้อมคำอธิบายประกอบ แพลตฟอร์มนี้เป็นไดนามิก ใช้งานได้ฟรี และเปิดให้ประชาชนทั่วไปช่วยเหลือได้เช่นกัน เครื่องมือสามารถเข้าถึงได้โดยไม่ระบุชื่อหรือโดยการลงชื่อเข้าใช้บัญชีฟรี ผู้ใช้ต้องมีสิทธิ์เข้าถึงเว็บเบราว์เซอร์ที่เข้ากันได้กับ JavaScript • CheXpert: CheXpert เป็นชุดข้อมูลขนาดใหญ่ของการเอ็กซ์เรย์ทรวงอกและการแข่งขันสำหรับการตีความเอ็กซ์เรย์หน้าอกแบบอัตโนมัติ มีฉลากแสดงความไม่แน่นอนและข้อมูลอ้างอิงที่ติดฉลากรังสีแพทย์สำหรับชุดการประเมินมาตรฐาน เนื่องจากการถ่ายภาพรังสีทรวงอกเป็นการตรวจด้วยภาพที่พบบ่อยที่สุดสำหรับการจัดการโรคที่คุกคามชีวิต แพลตฟอร์มนี้จึงมีประสิทธิภาพด้วยเหตุผลหลายประการ • Flickr-30K: The Flick-30K has กลายเป็นเกณฑ์มาตรฐานสำหรับคำบรรยายภาพ คำอธิบายประกอบโดยชุดข้อมูลเหล่านี้ทำให้สามารถแปลเอนทิตีข้อความที่กล่าวถึงในรูปภาพได้ ชุดข้อมูลประกอบด้วย 25, 000 ภาพที่รวบรวมจาก Flickr พร้อมประโยคอ้างอิง 5 ประโยคที่จัดทำโดยผู้ใส่คำอธิบายประกอบที่เป็นมนุษย์ • LSUN: LSUN หรือที่รู้จักในชื่อ Large-Scale Scene Understanding มีภาพที่ติดป้ายกำกับเกือบ 1 ล้านภาพ โดยมีเป้าหมายเพื่อสร้างเกณฑ์มาตรฐานที่แตกต่างกันสำหรับการจัดประเภทฉากขนาดใหญ่และความเข้าใจ นอกจากนี้ยังมีหมวดหมู่ฉาก เช่น ห้องรับประทานอาหาร ห้องนอน โบสถ์กลางแจ้ง และอื่นๆ

  • บ้าน
  • Business
  • Data science
  • Marketing
  • Leave a Reply

    Your email address will not be published. Required fields are marked *

    Back to top button