Data science

Data เป็นตัวสร้างความแตกต่างให้กับธุรกิจของคุณหรือไม่? ถ้าเป็นเช่นนั้น OCR แบบดั้งเดิมก็ไม่สามารถเป็นคำตอบได้

หากธุรกิจของคุณขับเคลื่อนด้วยข้อมูล Optical Character Recognition (OCR) — อย่างที่พวกเราส่วนใหญ่ทราบ — ไม่ใช่คำตอบ สำหรับผู้ที่มองว่า OCR เป็นวัตถุดิบหลักของอุตสาหกรรมสำหรับการประมวลผลเอกสาร ให้ฉันอธิบาย OCR เป็นเทคโนโลยีที่มีมานานแล้ว และยังคงมีอยู่ในการประมวลผลรูปแบบเอกสารที่ไม่มีโครงสร้าง เช่น PDF, รูปภาพ และรูปแบบข้อความอื่นๆ ที่ไม่สามารถแก้ไขได้แบบดิจิทัล ผู้ใช้สามารถแปลงไฟล์เหล่านั้นเป็นเอกสารที่แก้ไขได้อย่างรวดเร็ว กล่าวโดยย่อ เป็นเทคโนโลยีที่ยอดเยี่ยมในการช่วยให้คุณแก้ไขและค้นหาไฟล์ที่อาจ “ค้าง” การใช้ OCR ทำให้การแก้ไขง่ายขึ้น และที่สำคัญกว่านั้นคือช่วยลดความผิดพลาดของมนุษย์ และเป็นการเริ่มขจัดงานการประมวลผลข้อมูลที่ซ้ำซากจำเจ เช่น แบบฟอร์มการประกัน เอกสารด้านการดูแลสุขภาพ และรายงานบริการทางการเงินที่เราพูดถึงก่อนหน้านี้ แม้จะยังคงเป็นเครื่องมือสำคัญสำหรับองค์กร แต่ OCR ก็ไม่ได้ปรับขยายเพื่อตอบสนองความต้องการที่แข็งแกร่งยิ่งขึ้น การดึงข้อมูลที่มีโครงสร้างที่ใช้งานได้จากเอกสารมีหลายขั้นตอน มักถือว่า OCR จัดการกับขั้นตอนเหล่านั้นทั้งหมด — ไม่ได้เป็นเช่นนั้น OCR ไม่ได้กล่าวถึงการดึงข้อความหรือหลังการประมวลผล ซึ่งช่วยขจัดผลลัพธ์ที่ไม่ถูกต้องและรับประกันคุณภาพผลลัพธ์ที่ดีขึ้น นอกจากนี้ ในขณะที่มีผลกับข้อความที่พิมพ์ ความถูกต้องของการอ่านข้อความที่เขียนด้วยลายมือนั้นไม่สอดคล้องกัน ซึ่งจะต้องได้รับการแก้ไขผ่านเทคโนโลยีอื่น OCR ระบุเฉพาะการแปลงพิกเซลเป็นอักขระข้อความ เป็นการเรียกชื่อผิดในอุตสาหกรรมที่จัดการการแยกข้อความ – กระบวนการระบุข้อความและจับคู่ข้อความกับฟิลด์ที่ต้องการ – และการประมวลผลภายหลัง ซึ่งเกี่ยวข้องกับการประมวลผลข้อความที่แยกออกมาเพิ่มเติม รวมถึงการทำให้เป็นมาตรฐาน (เช่น การแปลง “1,

” 4” กับตัวเลข 1234) การต่อกัน (เช่น การรวม “231 ” “Avery” “Lane” เป็น “231 Avery Lane”) และการตีความ (เช่น การใช้การจดจำเอนทิตีที่มีชื่อเพื่อแยกการวินิจฉัยออกจากย่อหน้าของข้อความ) สองขั้นตอนนี้มีความสำคัญสำหรับธุรกิจสมัยใหม่ ซึ่งกำลังมองหาการใช้ประโยชน์จากข้อมูลของตนอย่างต่อเนื่องเพื่อสร้างความแตกต่างในองค์กร ใช้ประโยชน์สูงสุดจากการลงทุน OCR ของคุณด้วย AutoML ถึงจุดนี้ คุณไม่ต้องสงสัยเลยว่าฉันได้ระบุความท้าทายมากมายให้คุณพิจารณา นี่ไม่ใช่การปลูกฝังความกลัว แต่เป็นการขจัดความสับสนเกี่ยวกับสิ่งที่เทคโนโลยี AI สามารถทำได้และไม่สามารถทำได้ ความสับสนนั้นยังคงนำไปสู่ความล้มเหลวมากมายที่เราเห็นด้วยความคิดริเริ่มด้าน AI: บริษัทใช้เงินเป็นจำนวนมากในโซลูชัน AI ที่ได้รับการฝึกอบรมล่วงหน้า ใช้เวลาและเงินเป็นจำนวนมากในทรัพยากรด้านวิทยาศาสตร์ข้อมูลเพื่อนำไปใช้ และท้ายที่สุด พบว่าวิธีแก้ปัญหาไม่เพียงพอสำหรับการแก้ปัญหาที่ธุรกิจมี โซลูชันที่ใช้งานได้จริงได้เกิดขึ้นแล้ว: Automated Machine Learning (AutoML) เป็นเทคโนโลยีปัญญาประดิษฐ์ (AI) ที่เพิ่งเริ่มต้นซึ่งแสดงพลังของการเรียนรู้ด้วยเครื่อง (ML) ต่อผู้ชมในวงกว้างกว่านักวิทยาศาสตร์ข้อมูลและเทคโนโลยี แทนที่จะเตรียมรับทุกสถานการณ์ที่เป็นไปได้ AutoML จะเรียนรู้จากเอกสารของคุณ โดยให้ประโยชน์ทั้งหมดของแนวทางที่ขับเคลื่อนด้วย AI เหนือชุดเอกสารใดๆ ที่คุณต้องการทำงานด้วย คุณไม่ได้จำกัดอยู่เพียงเอกสารที่ผลิตภัณฑ์พบก่อนเวลา และเนื่องจากเอกสารและข้อมูลของคุณเองมีวิวัฒนาการ อัลกอริทึมที่ตีความเอกสารเหล่านั้นก็เช่นกัน ถูกต้อง ผลลัพธ์ที่ได้คือประสบการณ์ผู้ใช้ที่มอบความเรียบง่ายให้กับผู้ใช้ทางธุรกิจ ถูกต้อง: AutoML ไม่ต้องการปริญญาวิศวกรรมคอมพิวเตอร์หรือวิทยาศาสตร์ข้อมูล เทคโนโลยีให้ความรับผิดชอบกับผู้เชี่ยวชาญเฉพาะด้านที่มีความเข้าใจโดยธรรมชาติของกระบวนการที่เป็นไปโดยอัตโนมัติและสามารถสอนวิธีแก้ปัญหาได้ AutoML ได้ถูกนำไปใช้กับปัญหาจำนวนหนึ่งแล้ว รวมถึงการติดป้ายรูปภาพ การคาดการณ์อนุกรมเวลา และการรับรู้เอนทิตี ในบริบทของการประมวลผลเอกสาร วิธีการแบบอิง AutoML จะช่วยให้เครื่องมือเรียนรู้ความแตกต่างของเอกสารของคุณได้ทันที นำประโยชน์ของแนวทางที่ใช้ AI มาใช้กับชุดเอกสารใดๆ ที่คุณต้องการประมวลผลและวิเคราะห์ ปลดปล่อย AutoML เพื่อจัดการกับฝันร้ายในการประมวลผลเอกสารของคุณ แนวทางที่ใช้ AutoML ให้ประโยชน์จาก OCR, แพลตฟอร์ม IDP และการเรียนรู้ของเครื่อง (ML) ซึ่งทำให้ได้รับความแตกต่างของเอกสารของคุณอย่างต่อเนื่อง และแตกต่างจาก Robotic Processing Automation (RPA) ที่แท้ทรู AutoML สามารถ “ปิดสคริปต์” และเรียนรู้ได้ทันทีกับผู้ใช้ของคุณ สามารถใช้ AutoML ได้ด้วยตัวเองหรือควบคู่กับโซลูชัน RPA เพื่อทำให้กระบวนการที่ซับซ้อนเป็นแบบอัตโนมัติทั้งหมด นี่คือวิธีที่ AutoML ช่วยให้คุณจินตนาการถึงการประมวลผลเอกสารของคุณอีกครั้ง: ความเร็วที่เพิ่มขึ้น AutoML คิดค้นการป้อนข้อมูลด้วยตนเองขึ้นใหม่ ซึ่งเป็นกระบวนการที่เต็มไปด้วยข้อผิดพลาดซึ่งต้องใช้ความแม่นยำอย่างอุตสาหะ ระบบอัตโนมัติเพิ่มความเร็วจากชั่วโมงเป็นนาที ใช้ประโยชน์จากทุนมนุษย์ได้ดีขึ้น AutoML ไม่ได้มาแทนที่ผู้คน อันที่จริง พนักงานด้านข้อมูลของคุณมีความจำเป็นมากกว่าที่เคยในการฝึกโมเดลและรับรองความถูกต้องอย่างต่อเนื่อง กลับไปทำงาน กระบวนการทำงานอัตโนมัติอย่างมีประสิทธิภาพ ทำให้คุณมีอิสระที่พนักงานที่มีความรู้ของคุณมีสมาธิกับสิ่งที่คุณจ่ายให้พวกเขาทำ รับคำตอบเร็วขึ้น ผู้ปฏิบัติงานที่มีความรู้ของคุณพร้อมที่จะให้ข้อมูลแก่ธุรกิจแต่ทำไม่ได้หากพวกเขามุ่งเน้นไปที่การป้อนข้อมูลด้วยตนเองหรือถูกบังคับให้ใช้เทคโนโลยีที่ล้าสมัยอื่น ๆ เพื่อประมวลผลเอกสารที่ซับซ้อน เช่น PDF วิดีโอ และรูปแบบข้อมูลที่มีโครงสร้างและไม่มีโครงสร้างอื่นๆ . AutoML ให้อำนาจพวกเขาในการฝึกอบรมระบบอัจฉริยะเพื่อทำงานให้กับพวกเขา หากคุณลงทุนไปมากในโซลูชัน OCR ของคุณ อย่ากังวลไป ยังคงมีประโยชน์เมื่อจับคู่กับ AutoML เกี่ยวกับผู้เขียน Ankur Goyal เป็น CEO และผู้ร่วมก่อตั้ง Impira Ankur เป็นผู้เชี่ยวชาญชั้นนำด้าน AI เชิงปฏิบัติและการประยุกต์ใช้ในด้านบริการทางการเงิน เขาเป็นอดีตผู้รับของ Forbes' 30 Under 30 ( ). ลงทะเบียนเพื่อรับจดหมายข่าว InsideBIGDATA ฟรี เข้าร่วมกับเราบน Twitter: @InsideBigData1 – https://twitter.com/InsideBigData1

  • บ้าน
  • Business
  • Data science
  • Marketing
  • Leave a Reply

    Your email address will not be published. Required fields are marked *

    Back to top button