واقعاً چنین چیزی امکان دارد؟ واقعاً میشود تصاویر را به متن تبدیل کرد؟
در یک کلمه، بله! امکان دارد. شما میتوانید بهجای تایپ کردن دستی متن نوشتهها، تصاویر آنها را به متن تبدیل کنید. اما به لحاظ فنی، اتفاقی که میافتد «تبدیل کردن» نیست؛ بلکه «شناسایی حروف» و «بازسازی متن» است.
نام این فناوری، OCR است.
واژه OCR مخفف عبارت optical charachter recognition است یعنی «بازشناسی حروف توسط الگوهای نوری» که معادل فارسی آن میشود: «نویسهخوان نوری». این فناوری ابتدا حروف را توسط الگوریتمهای خود تشخیص میدهد، سپس به کمک فرهنگ زبانی که در اختیار دارد واژگان را بازسازی میکند. بنابراین، برای پشتیبانی از هر زبانی، باید الگوریتم و فرهنگ واژگان زبان را در اختیار داشته باشد.
نویسهخوان فارسی هم داریم؟
بله! در آغاز، این فناوری برای زبانهای لاتین مانند انگلیسی فراهم شد و زبانهای «راست به چپ» مانند زبان فارسی که الفبای آن «پیوسته» است فاقد این فناوری بود. اما خوشبختانه این فناوری بهطور گسترده برای زبان و الفبای فارسی هم توسعه یافته و امروزه، فارسیزبانان هم از این موهبت برخوردار هستند.
با این فناوری میشود چهکار کرد؟
فناوری OCR به ما کمک میکند «چرخ را دوباره اختراع نکنیم!» یعنی متنی که قبلاً تایپ شده است را دوباره تایپ نکنیم! بهجای اینکه چندین کاربر، یک متن را بارها و بارها تایپ کنند، میتوان یک متن را یکبار تایپ کرد و دفعات بعد، همان متن را «بازسازی»(OCR) کرد و دوباره استفاده کرد.
بهطور مثال، کتاب، مجله، روزنامه، مقاله، شعر یا هر چیز دیگری که قبلاً یکبار حروفچینی و منتشر شده است، دیگر نیازی به تایپ دوباره ندارد. بلکه نیاز به «بازشناسی» و «بازسازی» دوباره دارد. بنابراین، شما با در اختیار داشتن تصاویر متن، میتوانید بازسازی متن را انجام دهید.
چه نوع تصاویری؟
اگر شما با گوشی خود از یک متن عکس بگیرید یا با اسکنر، از یک متن تصویربرداری کنید و آن را با فرمتهای تصویری مختلف مانند pdf، jpg و … ذخیره کنید، بازهم میتوانید با کمک OCR، متن مندرج در این تصاویر را «بازسازی» یا بهاصطلاح دیگر «استخراج» کنید. البته استخراج متن از فرمتهایی که سازگاری بهتری با نرمافزار OCR دارند، راحتتر است. بهطور مثال فرمت رایج jpg.
کیفیت تصویر تأثیری در بازسازی متن دارد؟
– مسلماً کیفیت تصویر نقش مهمی در کیفیت بازسازی متن دارد. شما با افزایش کیفیت تصویر یا عکس خود میتوانید در بازسازی متن نهایی، به OCR کمک کنید. بنابراین، رابطه شما و OCR دوطرفه است! اگر شما به OCR کمک کنید، OCR هم به شما کمک میکند. حتماً این جمله معروف را شنیدهاید که «اگر به رایانه زباله بدهید، رایانه هم به شما زباله تحویل میدهد.» خوب، OCR هم از این قاعده مستثنا نیست.
برای شروع OCR از کجا شروع کنیم؟
از تصویر! تصاویر متن را تهیه کنید! کیفیت عکسها را بالا ببرید! یک سامانه OCR خوب با پشتیبانی از زبان فارسی پیدا کنید! فناوری را به خانه ببرید!
باید پول هم بدهیم؟
فناوریها معمولاً رایگان نیستند. شرکتهای تولیدکننده نرمافزار، محصول خود را رایگان ارائه نمیکنند. در حال حاضر، چندین سامانه OCR فارسی برای نصب بر روی ویندوز رایانه تهیهشده که برای استفاده از آنها باید هزینه خرید آنها را بپردازید. سامانههای آنلاین OCR فارسی هم وجود دارد که به ازای هر صفحه، از شما هزینه دریافت میکنند!
اگر عباراتی مانند «نویسهخوان هوشمند»، «تبدیل PDF به Word آنلاین»، «تبدیل عکس به متن»، «تبدیل تصویر به متن»، «تعرفه سامانه OCR» یا امثال آن را در گوگل جستجو کنید به نمونههای بسیاری برمیخورید.
سامانه OCR رایگان هم وجود دارد!
گاهی اوقات، فناوری رایگان هم ارائه میشود. شرکت گوگل، بنیانگذار بسیاری از فناوریهای رایگان است. ازجمله خدمات رایگان این شرکت، ارائه خدمات OCR رایگان برای زبان فارسی است. جالب اینکه گوگل هیچ خدمات خاصی با عنوان «سامانه نویسهخوان فارسی» یا «OCR فارسی» ارائه نمیکند بلکه این خدمات، محصول جانبی دو سرویس رایگان گوگل است: گوگل درایو و گوگل داکس (Google Docs).
آشنایی با گوگل درایو و گوگل داکس
گوگل درایو (Google Drive) درواقع فضای ذخیرهسازی اطلاعات است و برخلاف آنچه در وب فارسی تبلیغ میشود، ارتباط مستقیمی با OCR ندارد. گوگل درایو یک فضای میزبان ابری است که از فایلها و اطلاعات کاربران نگهداری میکند. گوگل درایو بهطور پیشفرض مقدار 15 گیگ فضای رایگان در اختیار کاربر قرار میدهد.
فضای گوگل درایو
رایجترین خدمات گوگل که معمولاً بیشتر کاربران از آن استفاده میکنند، خدمات پست الکترونیک جیمیل (Gmail) است. اگر به حساب کاربری خود در جیمیل وارد شوید میتوانید از تمامی خدمات رایگان گوگل، ازجمله گوگل درایو استفاده کنید.
فهرست خدمات رایگان گوگل
گوگل داکس (Google Docs) یک ویرایشگر متن شبیه مایکروسافت آفیس است که بهصورت آنلاین، امکان تایپ و ذخیره متنهای آفیس را فراهم میسازد. البته تواناییهای نهفته این ویرایشگر بسیار فراتر از «ویرایش» متن است. درواقع گوگل داکس، بدون آنکه از قبل خبر دهد، توانایی «شناسایی» و «بازسازی» متن تصاویر را در خود دارد. یعنی همان چیزی که به آن OCR میگوییم.
گوگل داکس مانند آفیس است.
اگر ما تصویر یک نوشته را در گوگل درایو بارگذاری کنیم و آن را با گوگل داکس باز کنیم، عملیات OCR شروع میشود و متن تایپشده آن در اختیار ما قرار میگیرد.
چند فایل در گوگل داکس
چه خوب!
شاید نخستین واکنش شما به این موضوع این باشد: چه خوب!
– البته! چقدر خوب!
بنابراین، حالا شما هم یک OCR رایگان در اختیار دارید! بدون هیچ محدودیتی!
اما…..
اما موضوع اینجاست که این قابلیت چه کاربردی برای ما دارد؟ در چه مقیاسی کار ما را انجام میدهد؟ چه محدودیتهایی دارد؟ ووو
اگر هدف شما «تبدیل» چند صفحه باشد، مشکلی وجود ندارد. اما اگر قصد دارید از این خدمات در سطح وسیع استفاده کنید، مثلاً یک متن بلند یا بیکیفیت را استخراج کنید، موضوع یککم سخت میشود! فرض کنید میخواهید یک کتاب 100 صفحهای با فرمت pdf را به متن تبدیل کنید! یا مثلاً 100 تصویر اسکن را! برای گوگل داکس فرقی نمیکند یک عکس را تبدیل کند یا 100 عکس را! اما برای شما فرق میکند!
برای تبدیل هر تصویر در گوگل درایو، باید هر تصویر را یکبار آپلود، یکبار تبدیل و یکبار ذخیره کنید! بهعبارتدیگر برای یک فایل 100 صفحهای باید 300 بار این عملیات را انجام دهید و وقت بگذارید! حالا فرض کنید فایل شما 300 صفحه شود! آنوقت چه؟
با این شرایط، قرار است چند بار مهمان گوگل درایو باشید؟
به فکر ویرایش و بازخوانی متن هم باشید!
هر متنی پس از تایپ دستی یا OCR حتماً باید ویرایش و بازخوانی شود! تصاویر و نمودارهای درون متن باید جداگانه کار شود. جداول را باید «دستی» طراحی کنید. بنابراین، OCR پایان راه نیست! شروع راه است!
برای انجام OCR هم باید مهارت داشته باشید!
انجام OCR هم نیازمند مهارتهای خاص خود است. درست همانطور که کار با فتوشاپ، اتوکد یا ویرایشگرهای آفیس نیازمند مهارت است، در اختیار داشتن یک سامانه پیشرفته OCR هم به این معنا نیست که شما بتوانید از تمام قابلیتها و ظرفیتهای آن استفاده کنید! بلکه علاوه بر در اختیار داشتن آن، باید مهارت استفاده از آن را هم داشته باشید و با ظرفیتها، محدودیتها و «قلقها»ی آن آشنا باشید! همه میتوانند یک دوربین خوب داشته باشند، اما همه نمیتوانند عکس خوب بگیرند.
باید آموزش ببینید!
برای استفاده عملی از OCR باید بهطور عملی با این فناوری آشنا شوید و از جایی شروع کنید که از OCR بهعنوان ابزار کاربردی استفاده میشود، نه بهعنوان دستگرمی یا سرگرمی! OCR یک ابزار بازتولید محتواست. بنابراین، یک سایت تولید محتوا که عملاً از OCR استفاده میکند الگوی عملی خوبی است. بطورمثال، سایت ایپابفا یک سایت تولید محتواست و می تواند مثال خوبی باشد.
سایت ایپابفا یک سایت بازتولید کتابهای قصه و داستان است. این سایت با بهرهگیری از فناوری OCR، متن کتابهای قدیمی را بازسازی میکند و به کتابهای مرده و فراموششده جان میبخشد. مسلم است که انجام چنین کاری با تایپ دستی امکانپذیر نیست؛ چراکه هم هزینه بسیاری دارد و هم وقت زیادی میطلبد. لذا این سایت، بهجای «اختراع دوباره چرخ» و «تایپ کردن متنهایی که قبلاً تایپ شده» با استفاده از OCR، متنهای قدیمی را بازسازی و عرضه میکند. بنابراین، واحد تولید محتوای این سایت، بهخوبی با کارکردهای OCR و نکات و ریزهکاریهای آن آشناست و بهخوبی از انجام این کار برمیآید. لذا، تجربیات این سایت در زمینه OCR، بهتر از هر آموزش نظری دیگر، میتواند در استفاده از OCR راه گشای شما باشد.
دوره آموزش ویدیویی OCR فارسی
واحد تولید محتوای سایت ایپابفا در جهت آشنایی دیگر کاربران با قابلیتهای OCR و استفاده از ظرفیتهای رایگان خدمات گوگل، اقدام به تهیه یک دوره آموزش ویدیویی OCR فارسی نموده است که بهطور جامع، به موضوع تبدیل تصاویر به متن قابلویرایش پرداخته و با ارائه روشهای کار، چندین نمونه عملی و پروژه محور را بهصورت ویدیویی تهیه و در اختیار کاربران گذاشته است.
محتوای این آموزش هم جنبه نظری و همه جنبه عملی دارد. مروری بر سرفصلهای آموزشی این دوره نشان میدهد که تمرکز این دوره آموزشی، بیشتر معطوف به کاربردهای عملی OCR در استخراج متن تصاویر میباشد.
این دوره آموزشی، علاوه بر آموزش استفاده از OCR رایگان، چند موضوع مهم ازجمله آمادهسازی تصاویر در محیط فتوشاپ، ویرایش متن در محیط آفیس، استفاده کاربردی از نرمافزار ویراستیار و بازخوانی متن پس از ویرایش را موردتوجه قرار داده است.
بنابراین، اگر علاقهمند به یادگیری OCR و کاهش هزینه های تایپ و بازتولید محتوای نگارشی هستید، این دوره آموزشی کمک بزرگی برای شما خواهد بود و جزئیات و ترفندهایی را در اختیار شما قرار میدهد که کمتر به آن اشاره شده است.
[button color=”red” size=”big” link=”https://www.epubfa.ir/?p=16115″ icon=”” target=”true”]بازدید از دوره آموزش ویدیویی OCR فارسی[/button]
***
(این نوشته در تاریخ 30 آگوست 2023 بروزرسانی شد.)