OCR คืออะไร?
OCR (การรู้จำอักขระด้วยแสง) มีผลกับการจดจำข้อความ เป็นกระบวนการซอฟต์แวร์ที่จดจำและแยกข้อความจากเอกสารในรูปแบบที่ไม่ใช่ข้อความ เช่น รูปภาพ (JPG, PNG, BMP เป็นต้น) และ PDF มีความสามารถในการ "อ่าน" ข้อความในรูปภาพ หรืออีกนัยหนึ่งคือเพื่อแปลงรูปภาพของคำเป็นอักขระข้อความจริง ซึ่งช่วยให้ผู้ใช้สามารถคัดลอกหรือแก้ไขข้อความต้นฉบับในเอกสารได้อย่างง่ายดาย แทนที่จะต้องถอดเสียงข้อความด้วยตนเอง
การรู้จำอักขระด้วยแสงทำงานอย่างไร
โดยทั่วไปการรู้จำอักขระด้วยแสงจะประมวลผลภาพล่วงหน้าโดยการลดความอิ่มตัวของสีและปรับคอนทราสต์เพื่อปรับคอนทราสต์ระหว่างพื้นที่มืดและสว่างให้เหมาะสม ดังนั้นสิ่งที่เป็นสีดำทั้งหมดถือเป็นอักขระและสิ่งที่เป็นสีขาวถือเป็นพื้นหลังของตัวละครเหล่านั้น จากนั้นอัลกอริธึมการรู้จำรูปแบบและวิธีการอื่นๆ รวมถึงการตรวจจับคุณลักษณะจะถูกนำมาใช้เพื่อจดจำโครงสร้างการมองเห็นของข้อความในรูปภาพ ตั้งแต่ย่อหน้า ไปจนถึงบรรทัด ประโยค คำ และอื่นๆ ไปจนถึงอักขระตัวเดียว กระบวนการเหล่านี้มักใช้ปัญญาประดิษฐ์ซึ่งสามารถเรียนรู้ที่จะจดจำข้อความในรูปภาพโดยฝึกกับรูปภาพนับพันด้วยข้อความในแบบอักษร ขนาด และภาษาต่างๆ
ประโยชน์ของการใช้ OCR คืออะไร?
ข้อดีของการใช้การรู้จำอักขระด้วยแสงคือประหยัดเวลาในการแปลงข้อความเป็นดิจิทัลในรูปภาพ เปรียบเทียบเวลาที่ใช้ในการพิมพ์ข้อความด้วยตนเองจากหนังสือเพื่อสแกนหนังสือและประมวลผลการสแกนด้วยซอฟต์แวร์ OCR ที่สามารถแยกข้อความได้ในเวลาไม่กี่วินาที
เราจัดการไฟล์ของคุณอย่างไร
ไฟล์ที่คุณเลือกจะถูกส่งทางอินเทอร์เน็ตไปยังเซิร์ฟเวอร์ของเราเพื่อดำเนินการ OCR กับไฟล์เหล่านั้น
ไฟล์ที่ส่งไปยังเซิร์ฟเวอร์ของเราจะถูกลบทันทีหลังจากการแปลงเสร็จสิ้นหรือล้มเหลว
การเข้ารหัส HTTPS จะใช้เมื่อส่งไฟล์ของคุณและเมื่อดาวน์โหลดข้อความที่ดึงมาจากไฟล์เหล่านั้น
แอปออนไลน์นี้ใช้เว็บเบราว์เซอร์ของคุณทั้งหมด ไม่จำเป็นต้องติดตั้งซอฟต์แวร์
คุณสามารถใช้แอปฟรีนี้กี่ครั้งก็ได้โดยไม่ต้องลงทะเบียน
ทำงานบนอุปกรณ์ใดก็ได้ที่มีเว็บเบราว์เซอร์ รวมทั้งโทรศัพท์มือถือ แท็บเล็ต และคอมพิวเตอร์เดสก์ท็อป