نویسه خوان فارسی - تبدیل تصویر به متن

دیگه تایپ نکنید: تصاویر را به متن تبدیل کنید!

دوره آموزش نویسه‌خوان هوشمند-تبدیل PDF به Word آنلاین- تبدیل عکس به متن-تبدیل تصویر به متن-تعرفه سامانه ocr -ایپابفا ارشیو قصه و داستان

واقعاً چنین چیزی امکان دارد؟ واقعاً می‌شود تصاویر را به متن تبدیل کرد؟

در یک کلمه، بله! امکان دارد. شما می‌توانید به‌جای تایپ کردن دستی متن نوشته‌ها، تصاویر آن‌ها را به متن تبدیل کنید. اما به لحاظ فنی، اتفاقی که می‌افتد «تبدیل کردن» نیست؛ بلکه «شناسایی حروف» و «بازسازی متن» است.

دوره آموزش نویسه‌خوان هوشمند-تبدیل PDF به Word آنلاین- تبدیل عکس به متن-تبدیل تصویر به متن-تعرفه سامانه ocr -ایپابفا ارشیو قصه و داستان

نام این فناوری، OCR است.

واژه OCR مخفف عبارت optical charachter recognition است یعنی «بازشناسی حروف توسط الگوهای نوری» که معادل فارسی آن می‌شود: «نویسه‌خوان نوری». این فناوری ابتدا حروف را توسط الگوریتم‌های خود تشخیص می‌دهد، سپس به کمک فرهنگ زبانی که در اختیار دارد واژگان را بازسازی می‌کند. بنابراین، برای پشتیبانی از هر زبانی، باید الگوریتم و فرهنگ واژگان زبان را در اختیار داشته باشد.

دوره آموزش نویسه‌خوان هوشمند-تبدیل PDF به Word آنلاین- تبدیل عکس به متن-تبدیل تصویر به متن-تعرفه سامانه ocr -ایپابفا ارشیو قصه و داستان

نویسه‌خوان فارسی هم داریم؟

بله! در آغاز، این فناوری برای زبان‌های لاتین مانند انگلیسی فراهم شد و زبان‌های «راست به چپ» مانند زبان فارسی که الفبای آن «پیوسته» است فاقد این فناوری بود. اما خوشبختانه این فناوری به‌طور گسترده برای زبان و الفبای فارسی هم توسعه یافته و امروزه، فارسی‌زبانان هم از این موهبت برخوردار هستند.

با این فناوری می‌شود چه‌کار کرد؟

فناوری OCR به ما کمک می‌کند «چرخ را دوباره اختراع نکنیم!» یعنی متنی که قبلاً تایپ شده است را دوباره تایپ نکنیم! به‌جای اینکه چندین کاربر، یک متن را بارها و بارها تایپ کنند، می‌توان یک متن را یک‌بار تایپ کرد و دفعات بعد، همان متن را «بازسازی»(OCR) کرد و دوباره استفاده کرد.

دوره آموزش نویسه‌خوان هوشمند-تبدیل PDF به Word آنلاین- تبدیل عکس به متن-تبدیل تصویر به متن-تعرفه سامانه ocr -ایپابفا ارشیو قصه و داستان

به‌طور مثال، کتاب، مجله، روزنامه، مقاله، شعر یا هر چیز دیگری که قبلاً یک‌بار حروف‌چینی و منتشر شده است، دیگر نیازی به تایپ دوباره ندارد. بلکه نیاز به «بازشناسی» و «بازسازی» دوباره دارد. بنابراین، شما با در اختیار داشتن تصاویر متن، می‌توانید بازسازی متن را انجام دهید.

دوره آموزش نویسه‌خوان هوشمند-تبدیل PDF به Word آنلاین- تبدیل عکس به متن-تبدیل تصویر به متن-تعرفه سامانه ocr -ایپابفا ارشیو قصه و داستان

چه نوع تصاویری؟

اگر شما با گوشی خود از یک متن عکس بگیرید یا با اسکنر، از یک متن تصویربرداری کنید و آن را با فرمت‌های تصویری مختلف مانند pdf، jpg و … ذخیره کنید، بازهم می‌توانید با کمک OCR، متن مندرج در این تصاویر را «بازسازی» یا به‌اصطلاح دیگر «استخراج» کنید. البته استخراج متن از فرمت‌هایی که سازگاری بهتری با نرم‌افزار OCR دارند، راحت‌تر است. به‌طور مثال فرمت رایج jpg.

دوره آموزش نویسه‌خوان هوشمند-تبدیل PDF به Word آنلاین- تبدیل عکس به متن-تبدیل تصویر به متن-تعرفه سامانه ocr -ایپابفا ارشیو قصه و داستان

کیفیت تصویر تأثیری در بازسازی متن دارد؟

– مسلماً کیفیت تصویر نقش مهمی در کیفیت بازسازی متن دارد. شما با افزایش کیفیت تصویر یا عکس خود می‌توانید در بازسازی متن نهایی، به OCR کمک کنید. بنابراین، رابطه شما و OCR دوطرفه است! اگر شما به OCR کمک کنید، OCR هم به شما کمک می‌کند. حتماً این جمله معروف را شنیده‌اید که «اگر به رایانه زباله بدهید، رایانه هم به شما زباله تحویل می‌دهد.» خوب، OCR هم از این قاعده مستثنا نیست.

دوره آموزش نویسه‌خوان هوشمند-تبدیل PDF به Word آنلاین- تبدیل عکس به متن-تبدیل تصویر به متن-تعرفه سامانه ocr -ایپابفا ارشیو قصه و داستان

برای شروع OCR از کجا شروع کنیم؟

از تصویر! تصاویر متن را تهیه کنید! کیفیت عکس‌ها را بالا ببرید! یک سامانه OCR خوب با پشتیبانی از زبان فارسی پیدا کنید! فناوری را به خانه ببرید!

باید پول هم بدهیم؟

فناوری‌ها معمولاً رایگان نیستند. شرکت‌های تولیدکننده نرم‌افزار، محصول خود را رایگان ارائه نمی‌کنند. در حال حاضر، چندین سامانه OCR فارسی برای نصب بر روی ویندوز رایانه تهیه‌شده که برای استفاده از آن‌ها باید هزینه خرید آن‌ها را بپردازید. سامانه‌های آنلاین OCR فارسی هم وجود دارد که به ازای هر صفحه، از شما هزینه دریافت می‌کنند!

اگر عباراتی مانند «نویسه‌خوان هوشمند»، «تبدیل PDF به Word آنلاین»، «تبدیل عکس به متن»، «تبدیل تصویر به متن»، «تعرفه سامانه OCR» یا امثال آن را در گوگل جستجو کنید به نمونه‌های بسیاری برمی‌خورید.

سامانه OCR رایگان هم وجود دارد!

گاهی اوقات، فناوری رایگان هم ارائه می‌شود. شرکت گوگل، بنیان‌گذار بسیاری از فناوری‌های رایگان است. ازجمله خدمات رایگان این شرکت، ارائه خدمات OCR رایگان برای زبان فارسی است. جالب اینکه گوگل هیچ خدمات خاصی با عنوان «سامانه نویسه‌خوان فارسی» یا «OCR فارسی» ارائه نمی‌کند بلکه این خدمات، محصول جانبی دو سرویس رایگان گوگل است: گوگل درایو و گوگل داکس (Google Docs). دوره آموزش نویسه‌خوان هوشمند-تبدیل PDF به Word آنلاین- تبدیل عکس به متن-تبدیل تصویر به متن-تعرفه سامانه ocr -ایپابفا ارشیو قصه و داستان

آشنایی با گوگل درایو و گوگل داکس

گوگل درایو (Google Drive) درواقع فضای ذخیره‌سازی اطلاعات است و برخلاف آنچه در وب فارسی تبلیغ می‌شود، ارتباط مستقیمی با OCR ندارد. گوگل درایو یک فضای میزبان ابری است که از فایل‌ها و اطلاعات کاربران نگهداری می‌کند. گوگل درایو به‌طور پیش‌فرض مقدار 15 گیگ فضای رایگان در اختیار کاربر قرار می‌دهد.

دوره آموزش نویسه‌خوان هوشمند-تبدیل PDF به Word آنلاین- تبدیل عکس به متن-تبدیل تصویر به متن-تعرفه سامانه ocr -ایپابفا ارشیو قصه و داستان

فضای گوگل درایو

رایج‌ترین خدمات گوگل که معمولاً بیشتر کاربران از آن استفاده می‌کنند، خدمات پست الکترونیک جیمیل (Gmail) است. اگر به حساب کاربری خود در جیمیل وارد شوید می‌توانید از تمامی خدمات رایگان گوگل، ازجمله گوگل درایو استفاده کنید.

دوره آموزش نویسه‌خوان هوشمند-تبدیل PDF به Word آنلاین- تبدیل عکس به متن-تبدیل تصویر به متن-تعرفه سامانه ocr -ایپابفا ارشیو قصه و داستان

فهرست خدمات رایگان گوگل

گوگل داکس (Google Docs) یک ویرایشگر متن شبیه مایکروسافت آفیس است که به‌صورت آنلاین، امکان تایپ و ذخیره متن‌های آفیس را فراهم می‌سازد. البته توانایی‌های نهفته این ویرایشگر بسیار فراتر از «ویرایش» متن است. درواقع گوگل داکس، بدون آنکه از قبل خبر دهد، توانایی «شناسایی» و «بازسازی» متن تصاویر را در خود دارد. یعنی همان چیزی که به آن OCR می‌گوییم.

دوره آموزش نویسه‌خوان هوشمند-تبدیل PDF به Word آنلاین- تبدیل عکس به متن-تبدیل تصویر به متن-تعرفه سامانه ocr -ایپابفا ارشیو قصه و داستان

گوگل داکس مانند آفیس است.

اگر ما تصویر یک نوشته را در گوگل درایو بارگذاری کنیم و آن را با گوگل داکس باز کنیم، عملیات OCR شروع می‌شود و متن تایپ‌شده آن در اختیار ما قرار می‌گیرد.

دوره آموزش نویسه‌خوان هوشمند-تبدیل PDF به Word آنلاین- تبدیل عکس به متن-تبدیل تصویر به متن-تعرفه سامانه ocr -ایپابفا ارشیو قصه و داستان

چند فایل در گوگل داکس

چه خوب!

شاید نخستین واکنش شما به این موضوع این باشد: چه خوب!

– البته! چقدر خوب!

بنابراین، حالا شما هم یک OCR رایگان در اختیار دارید! بدون هیچ محدودیتی!

اما…..

اما موضوع اینجاست که این قابلیت چه کاربردی برای ما دارد؟ در چه مقیاسی کار ما را انجام می‌دهد؟ چه محدودیت‌هایی دارد؟ ووو

اگر هدف شما «تبدیل» چند صفحه باشد، مشکلی وجود ندارد. اما اگر قصد دارید از این خدمات در سطح وسیع استفاده کنید، مثلاً یک متن بلند یا بی‌کیفیت را استخراج کنید، موضوع یک‌کم سخت می‌شود! فرض کنید می‌خواهید یک کتاب 100 صفحه‌ای با فرمت pdf را به متن تبدیل کنید! یا مثلاً 100 تصویر اسکن را! برای گوگل داکس فرقی نمی‌کند یک عکس را تبدیل کند یا 100 عکس را! اما برای شما فرق می‌کند!

برای تبدیل هر تصویر در گوگل درایو، باید هر تصویر را یک‌بار آپلود، یک‌بار تبدیل و یک‌بار ذخیره کنید! به‌عبارت‌دیگر برای یک فایل 100 صفحه‌ای باید 300 بار این عملیات را انجام دهید و وقت بگذارید! حالا فرض کنید فایل شما 300 صفحه شود! آن‌وقت چه؟

دوره آموزش نویسه‌خوان هوشمند-تبدیل PDF به Word آنلاین- تبدیل عکس به متن-تبدیل تصویر به متن-تعرفه سامانه ocr -ایپابفا ارشیو قصه و داستان

با این شرایط، قرار است چند بار مهمان گوگل درایو باشید؟

به فکر ویرایش و بازخوانی متن هم باشید!

هر متنی پس از تایپ دستی یا OCR حتماً باید ویرایش و بازخوانی شود! تصاویر و نمودارهای درون متن باید جداگانه کار شود. جداول را باید «دستی» طراحی کنید. بنابراین، OCR پایان راه نیست! شروع راه است!

برای انجام OCR هم باید مهارت داشته باشید!

انجام OCR هم نیازمند مهارت‌های خاص خود است. درست همان‌طور که کار با فتوشاپ، اتوکد یا ویرایشگرهای آفیس نیازمند مهارت است، در اختیار داشتن یک سامانه پیشرفته OCR هم به این معنا نیست که شما بتوانید از تمام قابلیت‌ها و ظرفیت‌های آن استفاده کنید! بلکه علاوه بر در اختیار داشتن آن، باید مهارت استفاده از آن را هم داشته باشید و با ظرفیت‌ها، محدودیت‌ها و «قلق‌ها»ی آن آشنا باشید! همه می‌توانند یک دوربین خوب داشته باشند، اما همه نمی‌توانند عکس خوب بگیرند.

دوره آموزش نویسه‌خوان هوشمند-تبدیل PDF به Word آنلاین- تبدیل عکس به متن-تبدیل تصویر به متن-تعرفه سامانه ocr -ایپابفا ارشیو قصه و داستان

باید آموزش ببینید!

برای استفاده عملی از OCR باید به‌طور عملی با این فناوری آشنا شوید و از جایی شروع کنید که از OCR به‌عنوان ابزار کاربردی استفاده می‌شود، نه به‌عنوان دست‌گرمی یا سرگرمی! OCR یک ابزار بازتولید محتواست. بنابراین، یک سایت تولید محتوا که عملاً از OCR استفاده می‌کند الگوی عملی خوبی است. بطورمثال، سایت ایپابفا یک سایت تولید محتواست و می تواند مثال خوبی باشد.

دوره آموزش نویسه‌خوان هوشمند-تبدیل PDF به Word آنلاین- تبدیل عکس به متن-تبدیل تصویر به متن-تعرفه سامانه ocr -ایپابفا ارشیو قصه و داستان

سایت ایپابفا یک سایت بازتولید کتاب‌های قصه و داستان است. این سایت با بهره‌گیری از فناوری OCR، متن کتاب‌های قدیمی را بازسازی می‌کند و به کتاب‌های مرده و فراموش‌شده جان می‌بخشد. مسلم است که انجام چنین کاری با تایپ دستی امکان‌پذیر نیست؛ چراکه هم هزینه بسیاری دارد و هم وقت زیادی می‌طلبد. لذا این سایت، به‌جای «اختراع دوباره چرخ» و «تایپ کردن متن‌هایی که قبلاً تایپ شده» با استفاده از OCR، متن‌های قدیمی را بازسازی و عرضه می‌کند. بنابراین، واحد تولید محتوای این سایت، به‌خوبی با کارکردهای OCR و نکات و ریزه‌کاری‌های آن آشناست و به‌خوبی از انجام این کار برمی‌آید. لذا، تجربیات این سایت در زمینه OCR، بهتر از هر آموزش نظری دیگر، می‌تواند در استفاده از OCR راه گشای شما باشد.

دوره آموزش ویدیویی OCR فارسی

واحد تولید محتوای سایت ایپابفا در جهت آشنایی دیگر کاربران با قابلیت‌های OCR و استفاده از ظرفیت‌های رایگان خدمات گوگل، اقدام به تهیه یک دوره آموزش ویدیویی OCR فارسی نموده است که به‌طور جامع، به موضوع تبدیل تصاویر به متن قابل‌ویرایش پرداخته و با ارائه روش‌های کار، چندین نمونه عملی و پروژه محور را به‌صورت ویدیویی تهیه و در اختیار کاربران گذاشته است.

دوره آموزش نویسه‌خوان هوشمند-تبدیل PDF به Word آنلاین- تبدیل عکس به متن-تبدیل تصویر به متن-تعرفه سامانه ocr -ایپابفا ارشیو قصه و داستان محتوای این آموزش هم جنبه نظری و همه جنبه عملی دارد. مروری بر سرفصل‌های آموزشی این دوره نشان می‌دهد که تمرکز این دوره آموزشی، بیشتر معطوف به کاربردهای عملی OCR در استخراج متن تصاویر می‌باشد.

این دوره آموزشی، علاوه بر آموزش استفاده از OCR رایگان، چند موضوع مهم ازجمله آماده‌سازی تصاویر در محیط فتوشاپ، ویرایش متن در محیط آفیس، استفاده کاربردی از نرم‌افزار ویراستیار و بازخوانی متن پس از ویرایش را موردتوجه قرار داده است.

بنابراین، اگر علاقه‌مند به یادگیری OCR و کاهش هزینه های تایپ و بازتولید محتوای نگارشی هستید، این دوره آموزشی کمک بزرگی برای شما خواهد بود و جزئیات و ترفندهایی را در اختیار شما قرار می‌دهد که کمتر به آن اشاره شده است.

[button color=”red” size=”big” link=”https://www.epubfa.ir/?p=16115″ icon=”” target=”true”]بازدید از دوره آموزش ویدیویی OCR فارسی[/button]

***

(این نوشته در تاریخ ۸ شهریور ۱۴۰۲ بروزرسانی شد.)



***

  •  

***

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *