Scan болон OCR

Сайн байна уу

Цаасан баримтыг цахим хэлбэрт орчуулах шаардлагатай үед бид бүгдээрээ даалгавартай тулгарч байсан байх. Энэ нь ялангуяа суралцаж буй хүмүүст баримт бичигтэй ажиллах, электрон толь бичиг ашиглан текстийг орчуулах, ялангуяа шаардлагатай.

Энэ өгүүлэлд би энэ үйл явцын зарим үндсийг хуваалцахыг хүсч байна. Ер нь ихэнх үйл ажиллагаа гараар хийх хэрэгтэй болохоор сканердах, текстийг таних нь ихээхэн цаг хугацаа шаарддаг. Яагаад, яагаад, яагаад гэдгийг бид мэдэх болно.

Хүн бүр нэг зүйлийг нэн даруй ойлгодоггүй. Скан хийхдээ (сканер дээрх бүх хуудсыг тааруулах) хэлбэрээр BMP, JPG, PNG, GIF форматтай зурагнууд байх болно (бусад формат байж болно). Тэгэхээр энэ зурагнаас та текстийг авах хэрэгтэй. Энэ процедурыг таних гэж нэрлэдэг. Энэ дарааллаар, доор үзүүлэв.

Контент

  • 1. Сканнердах, хүлээн зөвшөөрөхөд юу хэрэгтэй вэ?
  • 2. Текст скан хийх сонголтууд
  • 3. Баримт бичгийн текстийг хүлээн зөвшөөрөх
    • 3.1 Текст
    • 3.2 зураг
    • 3.3 Хүснэгт
    • 3.4 Шаардлагагүй зүйлс
  • 4. PDF / DJVU файлуудыг хүлээн зөвшөөрөх
  • 5. Ажлын үр дүнг хэмнэж, хэмнэх

1. Сканнердах, хүлээн зөвшөөрөхөд юу хэрэгтэй вэ?

1) Сканнер

Хэвлэмэл материалыг текст хэлбэрт хөрвүүлэхийн тулд эхлээд сканнер хэрэгтэй, тэгээд түүнтэй хамт явсан "уугуул" програмууд болон жолооч хэрэгтэй болно. Тэдгээрийг ашиглан та баримтыг сканнердаж цаашид цааш нь боловсруулах боломжтой.

Та бусад аналогийг ашиглаж болно, гэхдээ хэрэгсэл дэх сканертай хамт ирдэг програм нь илүү хурдан ажилладаг бөгөөд илүү олон сонголттой байдаг.

Ямар төрлийн сканнерээс хамаарч - ажлын хурд өөр өөр байж болно. 10 секундын дотор зургийг авах боломжтой сканерууд байдаг бөгөөд 30 секундэд авах боломжтой байдаг. Хэрэв та 200-300 хуудсан дээр номыг хайлт хийвэл - цаг хугацааны өөрчлөлтийг хэдэн удаад тооцох нь хэцүү биш гэж бодож байна уу?

2) Хүлээн зөвшөөрөх хөтөлбөр

Манай нийтлэлд би ABBYY FineReader-ыг баримтжуулах, олж авах шилдэг програмуудын нэгийг танд үзүүлэх болно. Учир нь хөтөлбөр нь төлөгдөж, дараа нь би кубаны маягтыг түүний үнэгүй аналогийг нэн даруй холбох болно. Нарийвчилсан, FineReader бүх талаараа ялж байгаагаас болж үүнийг харьцуулахыг би хүсэхгүй байна.

ABBYY FineReader 11

Албан ёсны сайт: //www.abbyy.ru/

Энэ төрлийн шилдэг хөтөлбөрүүдийн нэг. Энэ зураг дээрх текстийг таних зорилготой. Олон сонголт, боломжуудыг бий болгосон. Энэ нь гараар бичсэн хувилбарыг дэмжиж чаддаг, хэдийгээр би үүнийг биечлэн туршиж үзээгүй боловч, гар бичмэлийн хувилбарыг нь төгс уран бичлэгийн гар бичмэл байхгүй л бол сайн гэж боддог. Түүнтэй хамтран ажиллах талаар дэлгэрэнгүй мэдээлэл авах болно. Мөн нийтлэл нь 11 хувилбарт ажилд хамаарах болно гэдгийг энд тэмдэглэж авлаа.

Дүрмээр бол, ABBYY FineReader-ийн өөр хувилбарууд бие биенээсээ огт өөр юм. Та нөгөө талдаа ижил зүйлийг хийж болно. Үндсэн ялгаа нь хөтөлбөрийн хурд, түүний чадамжид байж болно. Жишээ нь, өмнөх хувилбарууд PDF файлыг нээж, DJVU ...

3) Скан хийх баримтууд

Тиймээ, энд би баримтуудыг тусад нь баганаар гаргаж авахаар шийдсэн. Ихэнх тохиолдолд сурах бичиг, сонин, нийтлэл, сэтгүүл гэх мэтийг шалга Эдгээр номууд болон эрэлт хэрэгцээтэй номнууд. Би яах ёстой вэ? Хувийн туршлагаас би хайлт хийхийг хүсч байгаагаа хэлж чадна. Хэдэн удаа би нэг номыг олж сүлжээгээ сканнердсаныг олж мэдсэн. Би текстийг документ руу хуулж, цааш нь үргэлжлүүлээрэй.

Энгийн зөвлөгөө аваарай - ямар нэг зүйлийг скан хийхийн өмнө хэн нэгэн үүнийг аль хэдийн сканнердсан эсэхийг шалгаад цаг хугацаагаа алдахгүй байх хэрэгтэй.

2. Текст скан хийх сонголтууд

Эндээс би сканердахын тулд жолооч нарынхаа тухай ярихгүй, хөтөлбөртэй нь хамт явдаггүй. Учир нь сканнерын бүх загварууд өөр өөр байдаг. Програм хангамж нь хаа сайгүй өөр өөр байдаг бөгөөд таах, үйл ажиллагааг хэрхэн яаж гүйцэтгэхийг харуулах нь бодит бус юм.

Гэхдээ бүх сканерууд нь таны ажлын хурд, чанарт ихээхэн нөлөөлдөг ижил байрлалтай байдаг. Тэдний тухай эндээс би энд ярих болно. Би дарааллаар жагсаах болно.

1) Scan чанар - DPI

Эхлээд сканерийн чанарыг 300 DPI-с доошгүй сонголтонд тохируулна. Боломжтой бол арай илүү зүйлийг тавихыг зөвлөж байна. DPI-ийн үзүүлэлт өндөр байгаа нь таны зургийг илүү тодорхой болгож, илүү боловсронгуй болгох болно. Үүнээс гадна сканнерын чанар өндөр байх нь хожим таны засч залруулах алдаануудаас арай өндөр байдаг.

Хамгийн сайн сонголт нь ихэвчлэн 300-400 DPI байдаг.

2) хроматик чанар

Энэ параметр нь скан хийх хугацаа ихээхэн нөлөөлдөг (ингэснээр, DPI нь бас нөлөөлдөг, гэхдээ тэдгээр нь маш хүчтэй байдаг, зөвхөн хэрэглэгч өндөр үнэ тогтоодог үед л).

Ихэвчлэн гурван горим байдаг:

- хар ба цагаан (цэвэр текстийн хувьд төгс);

- саарал (хүснэгт, зурагтай текст хэрэглэхэд тохиромжтой);

- өнгө (өнгөт сэтгүүл, ном, ерөнхий, өнгө чухал ач холбогдолтой баримт бичиг).

Ихэвчлэн скан хийх хугацаа нь өнгө сонгохоос хамаарна. Эцсийн эцэст, хэрэв та том хэмжээний баримт бичигтэй бол хуудсан дээрх нэмэлт 5-10 секунд ч гэсэн зохистой цагийг бий болгоно ...

3) Зураг

Та баримтыг зөвхөн сканердахаас гадна зураг авах замаар авч болно. Дүрмээр бол, энэ тохиолдолд та өөр бусад асуудлуудтай байх болно: image distortion, бүдэгрүүлэх. Үүний улмаас энэ нь хүлээн авсан текстийг дахин засварлах, боловсруулалт хийхийг шаардаж болох юм. Би хувьдаа энэ бизнест зориулж камер ашиглахыг зөвлөдөггүй.

Учир нь эдгээр бүх баримтыг хүлээн зөвшөөрөхгүй гэдгийг анхаарах нь чухал юм скан чанар маш бага байх боломжтой ...

3. Баримт бичгийн текстийг хүлээн зөвшөөрөх

Бид таны хүлээн авсан сканнердсан хуудсыг хүлээн авсан гэж таамаглаж байна. Тэд ихэнхдээ форматууд байдаг: tif, bmb, jpg, png. Ерөнхийдөө ABBYY FineReader - энэ нь маш чухал биш ...

ABBYY FineReader-ийн зургийг нээсний дараа, програм дээр дүрмээр, машин дээр талбар сонгож эхэлдэг. Гэхдээ заримдаа тэр буруу зүйл хийдэг. Үүний тулд бид хүссэн газруудыг гараар сонгох асуудлыг авч үзнэ.

Энэ нь чухал юм! Хөтөлбөрт баримт бичгийг нээсний дараа бүгд эх кодыг цонхны зүүн талд харуулахыг та бүхэн ойлгож чадахгүй байна. "Хүлээн зөвшөөрөх" товчлуур дээр дарснаар баруун талын цонхон дахь програм нь танд эцсийн текстийг хүргэх болно. Үүнийг хүлээн зөвшөөрсний дараа яг ижил FineReader дахь алдааны текстийг шалгахыг зөвлөж байна.

3.1 Текст

Энэ талбарыг текст тодруулах зорилгоор ашигладаг. Зураг, хүснэгтийг хасах хэрэгтэй. Ховор ба ер бусын фонтууд гараар оруулах ёстой ...

Текстийн талбарыг сонгохдоо FineReader-ийн дээд хэсэгт самбарт анхаарлаа хандуулаарай. "T" гэсэн товчлуур байна (доорх дэлгэцийн агшин, хулганы заагч зөвхөн энэ товч дээр байна). Дарна уу, доорх зурган дээр текст байрлах нягтралтай тэгш өнцөгт хэсгийг сонгоно уу. Дашрамд хэлэхэд, зарим тохиолдолд та 2-3 хуудас текстийг үүсгэх хэрэгтэй, заримдаа хуудас бүрт 10-12, учир нь Текст формат нь ялгаатай байж болох бөгөөд бүх талбарыг нэг тэгш өнцөгтөөр сонгоогүй байна.

Зураг нь текстийн талбарт багтахгүй гэдгийг анхаарах нь чухал! Ирээдүйд энэ нь танд маш их цагийг хэмнэх болно ...

3.2 зураг

Чанаргүй, ер бусын фонтоор танихад хэцүү байгаа зургууд болон тэдгээрийг танихад ашиглагддаг газар.

Доорх зурган дээр хулганын заагч "зураг" хэсгийг сонгоход ашигладаг товч дээр байрладаг. Дашрамд хэлэхэд, энэ талбайн аль ч хэсэгт энэ талбарт сонгогдож болох бөгөөд FineReader нь баримтыг жирийн дүрээр оруулах болно. Ий Зүгээр л "тэнэг" ...

Ерөнхийдөө энэ хэсэг нь стандарт бус текст, үсгийн фонт, зургууд өөрсдийгөө тодруулахын тулд муухан сканнердсан хүснэгтүүдийг тодруулахад ашигладаг.

3.3 Хүснэгт

Доорх зурган дээр хүснэгтийг тодруулах товчийг харуулав. Би ерөнхийдөө үүнийг маш ховор ашигладаг. Хамгийн гол нь хүснэгтийн мөр бүрийг тогтмол зурж, хөтөлбөрийг хэрхэн, хэрхэн харуулахыг харуулаарай. Хэрвээ хүснэгт нь бага, чанар муутай бол "зураг" -ыг энэ зорилгоор ашиглахыг зөвлөж байна. Ингэснээр маш олон цагийг хэмнэх, дараа нь зураг дээр үндэслэн Үгэн дээр хүснэгтийг хурдан гаргах боломжтой.

3.4 Шаардлагагүй зүйлс

Тэмдэглэх нь чухал. Заримдаа текстийг танихад хэцүү болгодог хуудсан дээр шаардлагагүй элементүүд байдаг, эсвэл хүссэн хэсгийг сонгохыг зөвшөөрөхгүй. Тэдгээрийг "баллуур" -г ашиглан устгаж болно.

Үүнийг хийхийн тулд зургийн засварлах горим руу ор.

Баллуур хэрэгслийг сонгоод хүсээгүй газар сонго. Энэ нь устгагдах бөгөөд түүний оронд цагаан цаас байх болно.

Дашрамд хэлэхэд, би энэ хувилбарыг танд аль болох олон удаа ашиглахыг санал болгож байна. Таны сонгосон текстийг үзээрэй, танд текстийн хэсэг хэрэггүй, эсвэл шаардлагагүй цэгүүд, бүдэг бадаг, гажуудал зэргийг баллуур ашиглан устгана. Энэхүү хүлээн зөвшөөрөгдсөн ачаар илүү хурдан болно!

4. PDF / DJVU файлуудыг хүлээн зөвшөөрөх

Ерөнхийдөө энэ таних формат нь бусдаас огт өөр байх болно - i.e. Та зурагтай адилхан ажиллах боломжтой. Хэрэв та PDF / DJVU файлуудыг нээхгүй бол програм нь хэтэрхий хуучин хувилбар байх албагүй цорын ганц зүйл бол хувилбараа 11-ийг нь шинэчил.

Бага зэрэг зөвлөгөө. FineReader дээр баримтыг нээсний дараа энэ баримтыг автоматаар таних болно. Ихэнхдээ PDF / DJVU файлд хуудасны тодорхой талбар нь бүхэл бүтэн баримт бичигт шаардагдахгүй. Бүх хуудсан дээрх ийм талбайг устгахын тулд дараах зүйлсийг хийх хэрэгтэй:

1. Зураг засварлах хэсэг рүү оч.

2. "шүргэх" сонголтыг идэвхжүүл.

3. Бүх хуудсанд хэрэгтэй хэсгийг сонго.

4. Бүх хуудсанд дарна уу.

5. Ажлын үр дүнг хэмнэж, хэмнэх

Бүх газрууд сонгогдоход бэрхшээлтэй байж магадгүй юм шиг санагдаж байна - үүнийг аваад авраач ... Тэр байхгүй!

Нэгдүгээрт, бид баримтыг шалгах хэрэгтэй!

Үүнийг идэвхжүүлэхийн тулд, баруун талд байгаа цонхонд "шалгах" товч, доорх дэлгэцийн зургийг харна уу. Үүнийг товшсоны дараа FineReader програм нь програмын алдаатай талууд, тэдгээрийг нэг буюу хэд хэдэн тэмдэгтээр тодорхойлох найдвартай биш гэдгийг автоматаар харуулах болно. Та зөвхөн сонгох ёстой, эсвэл хөтөлбөрийн үзэл бодлыг хүлээн зөвшөөрөх эсвэл зан авираа оруулна.

Дашрамд хэлэхэд, хагас тохиолдолд, хөтөлбөр нь танд бэлэн үг зөв үгийг санал болгох болно - та хулганаа ашиглахыг хүссэн сонголтоо сонгох хэрэгтэй.

Хоёрдугаарт, та ажлынхаа үр дүнг хадгалах форматыг сонгох хэрэгтэй.

Энд FineReader нь танд хамгийн бүрэн эргэлт өгөх боломжийг олгодог: та зүгээр л Word-ээр нэг нэгээр нь дамжуулж болох бөгөөд та үүнийг хэдэн арван хэлбэрээр хадгалах боломжтой. Гэхдээ өөр нэг чухал зүйлийг онцлон тэмдэглэхийг хүсч байна. Ямар төрлийн форматыг сонгох вэ, хуулбарыг сонгох нь илүү чухал юм! Хамгийн сонирхолтой сонголтуудыг авч үзье ...

Онцгой хуулбар

Хүлээн зөвшөөрөгдсөн документ доторх хуудсан дээр сонгосон бүх хэсгүүд нь эх баримт бичигт яг таарах болно. Текст форматлахаа алдахгүй байх нь танд маш тохиромжтой сонголт юм. Дашрамд хэлэхэд, фонтууд нь эх загвартай маш төстэй байх болно. Би энэ баримтыг Word руу шилжүүлэхийг зөвлөж байна.

Editable copy

Энэ сонголт нь сайн текстийн аль хэдийн форматтай хувилбарыг авах болно. Ий Километр нь анхны баримт бичигт орсон байж магадгүй юм. Мэдээллийг ихээхэн засварлахад ашигтай сонголтууд.

Хэрэв та загварын дизайн, фонт, индессийн хэв загварыг хадгалах нь чухал бол сонголтыг сонгох ёсгүй. Заримдаа, хэрэв таних нь амжилтанд хүрэхгүй бол таны баримт бичиг өөрчлөгдсөн форматын улмаас "хачин" болно. Энэ тохиолдолд яг хуулбарыг сонгох нь зүйтэй.

Энгийн текст

Бусад бүх зүйлгүйгээр хуудсан дээрх текстийг зөвхөн хэрэгцээтэй хүмүүст зориулсан сонголт. Зураг, хүснэгтийн баримтанд тохиромжтой.

Энэ нь баримтын сканнердах, хүлээн зөвшөөрөх нийтлэлийг төгсгөнө. Эдгээр энгийн зөвлөгөөний тусламжтайгаар та өөрийн асуудлыг шийдэж чадна гэдэгт найдаж байна ...

Сайн аз!

Видео үзэх: ABBYY FineReader 11 CE programm suulgah hicheel (Дөрөвдүгээр Сар 2024).