Текстийг онлайн PDF файлаар таних.


Ердийн хуулбарыг ашиглан PDF файлаас текстийг задлах боломжгүй байдаг. Ихэнхдээ эдгээр баримт бичгийн хуудсууд нь цаасан хувилбаруудын сканнердсан агуулга байдаг. Эдгээр файлыг бүрэн засварлах боломжтой текст рүү хөрвүүлэхийн тулд Оприк Тэмдэгтийн таних (OCR) функцтэй тусгай програмуудыг ашигладаг.

Иймэрхүү шийдэл нь хэрэгжүүлэхэд маш хэцүү бөгөөд учир нь маш их мөнгө зардаг. Хэрэв та PDF текстийг тогтмол танихыг хүсвэл зохих програмыг худалдан авах нь зүйтэй. Ховор тохиолдлын хувьд ижил төстэй функцуудтай байгаа онлайн үйлчилгээнүүдийн аль нэгийг ашиглах нь илүү логик байх болно.

Текстийг PDF дээрээс хэрхэн таних талаар

Мэдээжийн хэрэг, OCR онлайн үйлчилгээ онцлог багц бүрэн ширээний шийдлүүдтэй харьцуулахад илүү хязгаарлагдмал юм. Гэхдээ ийм нөөцтэйгээр үнэ төлбөргүйгээр, эсвэл нэрлэсэн үнэтэйгээр ажиллах боломжтой. Хамгийн гол нь холбогдох вэбсайтууд нь тэдний гол үүрэг даалгавар, текстийг танихад ч хамаатай юм.

Арга 1: ABBYY FineReader Онлайн

Үйлчилгээ хөгжүүлэх компани нь оптикийн баримт бичиг хүлээн зөвшөөрөх салбарт тэргүүлэгчдийн нэг юм. Windows болон Mac-ийн ABBYY FineReader нь PDF текстийг хөрвүүлэх, түүнтэй ажиллахад маш хүчирхэг шийдэл юм.

Хөтөлбөрийн вэбсайт нь мэдээжийн хэрэг ажиллах чадвартай байдаг. Гэсэн хэдий ч, энэхүү үйлчилгээ нь 190 гаруй хэл дээрх сканнер, гэрэл зурагнаас текстийг хүлээн зөвшөөрч чаддаг. PDF файлыг PDF, Word, Excel зэрэг хөрвүүлэхийг дэмждэг.

ABBYY FineReader Онлайн онлайн үйлчилгээ

  1. Хэрэгтэйгээр ажиллаж эхлэхээсээ өмнө сайт дээрээс данс нээх эсвэл Facebook, Google эсвэл Microsoft дансаа ашиглан нэвтрэн орно уу.

    Нэвтрэх цонх руу очихын тулд товчин дээр дарна уу. "Нэвтрэх" дээд цэсний хэсэгт.
  2. Нэвтэрсэн бол, хүссэн PDF баримтыг FineReader дээр товчлуурыг ашиглан импортол "Файл оруулах".

    Дараа нь товшино уу "Хуудасны дугаар сонгох" текстийг хүлээн зөвшөөрөхөд шаардагдах зайг тодорхойлно.
  3. Дараа нь баримт бичигт байгаа хэлийг сонгоод үр дүнг нь форматлаж, товчин дээр дарна уу "Таних".
  4. Боловсруулсаны дараа, үргэлжлэх хугацаа нь баримт бичгийн хэмжээнээс бүрэн хамаарна, та дууссан файлаа текст датаг ашиглан түүний нэр дээр дарж татаж авч болно.

    Эсвэл боломжтой үүлний үйлчилгээнд шилжүүлээрэй.

Үйлчилгээ нь зураг, PDF файлд хамгийн зөв текст таних алгоритмаар тодорхойлогддог. Гэвч харамсалтай нь, үнэгүй ашиглах нь сар бүр боловсруулсан таван хуудас хүртэл хязгаарлагддаг. Илүү их баримт бичигтэй ажиллахын тулд та нэг жилийн хугацаатай захиалга авах шаардлагатай.

Гэсэн хэдий ч, OCR функц маш ховор тохиолдолд ABBYY FineReader Online нь жижиг PDF файлаас текстийг задлахад маш тохиромжтой хувилбар юм.

Арга 2: Чөлөөт Онлайн OCR

Текстийг дижитал болгоход хялбар, тохиромжтой үйлчилгээ. Бүртгэл хийх шаардлагагүй бол эх үүсвэр нь 15 бүтэн PDF-хуудсыг нэг цагт таних боломжийг олгоно. Чөлөөт Online OCR нь 46 хэл дээр бичиг баримтуудтай ажилладаг бөгөөд зөвшөөрөлгүйгээр DOCX, XLSX, TXT гэсэн гурван текст экспортын форматыг дэмждэг.

Бүртгүүлэх үед хэрэглэгч олон хуудас баримт бичгийг боловсруулж чаддаг боловч эдгээр ширхэгийн үнэ төлбөргүй тоо нь 50 нэгжээр хязгаарлагддаг.

Чөлөөт Online OCR онлайн үйлчилгээ

  1. Текстийг PDF дотроос "зочин" гэсэн хэлбэрээр олж авахыг зөвшөөрөхийн тулд нөөцийн талаар зөвшөөрөлгүйгээр сайтын үндсэн хуудсан дээр тохирох маягтыг ашиглана уу.

    Уг товчлуурыг ашиглан хүссэн документаа сонгоно уу "Файл", үндсэн текст хэл, гаралтын форматыг зааж дараа нь файлыг ачаалж, дарж хүлээх хэрэгтэй "Хөрвүүлэх".
  2. Дижиталчлох процессын төгсгөлд дарж, товшино уу "Гаралтын файлыг татаж авах" Компьютер дээрх тексттэй эцсийн документыг хадгалах.

Эрх бүхий хэрэглэгчийн хувьд үйл ажиллагааны дараалал нь ялгаатай байна.

  1. Товчийг ашиглана уу "Бүртгэл" эсвэл "Нэвтрэх" Дээд цэсний мөрөнд тус тусдаа Free Online OCR данс үүсгэх эсвэл түүн рүү ороорой.
  2. Хүлээн зөвшөөрөх самбар дээр зөвшөөрсний дараа түлхүүрийг дар "CTRL", жагсаалтад орсон эх баримтаас хоёр хэл рүү сонгох.
  3. Текстийг PDF хэлбэрээр задлах болон товчлуур дээр дарахад нэмэлт сонголтуудыг зааж өгнө үү. "Файл сонго" документыг үйлчилгээнд ачаалах.

    Дараа нь хүлээн зөвшөөрөхийг эхлүүлэхийн тулд товшино уу "Хөрвүүлэх".
  4. Баримт бичгийг боловсруулсны дараа харгалзах баганын гаралтын файлын нэртэй холбоос дээр дарна уу.

    Хүлээн зөвшөөрлийн үр дүн таны компьютерын санах ойд нэн даруй хадгалагдана.

Хэрэв та PDF файлаас жижиг текстийг задлах хэрэгтэй бол дээр дурдсан хэрэгслийг ашиглан аюулгүйгээр ашиглах боломжтой. Том хэмжээтэй файлуудтай ажиллахын тулд та үнэгүй онлайн OCR дээр нэмэлт тэмдэгтүүдийг худалдан авах эсвэл өөр шийдэлд оруулах хэрэгтэй болно.

Арга 3: NewOCR

Бүрэн OCR-үйлчилгээ нь DjVu, PDF гэх мэт график болон цахим баримтын текстийг задлах боломжтой. Нөөц нь хүлээн зөвшөөрөгдсөн файлуудын хэмжээ, тоо хэмжээг хязгаарлахгүй, бүртгүүлэхийг шаарддаггүй бөгөөд өргөн хүрээний холбогдох функцүүдийг санал болгодог.

NewOCR нь 106 хэлийг дэмждэг бөгөөд бүр бага чанартай баримт бичгийг хянаж чаддаг. Текстийг хүлээн зөвшөөрөх талбарыг гараар сонгож болно.

Онлайн үйлчилгээ НьюООР

  1. Тиймээс, та нэн даруй нөөцтэйгээ ажиллаж, шаардлагагүй үйлдэл хийх шаардлагагүй.

    Гол хуудсан дээр шууд баримтыг тухайн сайтад оруулах маягт бий. NewOCR руу файл байршуулахын тулд товчлуурыг ашиглана уу "Файл сонго" хэсэгт "Файлаа сонгоно уу". Дараа нь талбайд "Хүлээн зөвшөөрөх хэл (үүд)" эх баримтаас нэг буюу хэд хэдэн хэл сонгох, дараа нь товшино уу "Upload + OCR".
  2. Өөрийн таалагдсан хүлээн зөвшөөрөх тохиргоогоо тохируулаарай, хүссэн хуудсыг сонгон текстийг задлах, товчийг дарна уу. "OCR".
  3. Бага зэрэг доош гүйлгээд товчийг олоорой. Татаж авах.

    Уг товчин дээр дарж, татаж авах жагсаалтыг татаж авахад шаардагдах баримтын хэлбэрийг сонго. Үүний дараагаар задлагдсан тексттэй файлыг таны компьютерт татаж авах болно.

Багаж хэрэгсэл нь тохиромжтой, бүх тэмдэгтийг хангалттай чанартайгаар хүлээн зөвшөөрдөг. Гэсэн хэдий ч, импортын PDF баримт бичгийн хуудсан тус бүрийн боловсруулалтыг бие даан эхлүүлж, тусдаа файлд байршуулна. Та мэдээжийн үр дүнг клипон дээр шууд хуулж, тэдгээрийг нэгтгэж болно.

Гэсэн хэдий ч, дээр дурьдсанчлан NewOCR-ыг ашиглан их хэмжээний текстийг олборлоход маш хэцүү байдаг. Жижиг файлуудтай ижил үйлчилгээнүүд нь "bang with."

Арга 4: OCR.Space

Текстийг дижитал болгох энгийн бөгөөд ойлгомжтой эх сурвалж нь PDF баримтыг таньж, үр дүнг TXT файлд гаргана. Хуудасны тоог хязгаарладаггүй. Нэг хязгаарлалт нь оролтын баримт бичгийн хэмжээ 5 мегабайтаас хэтрэх ёсгүй юм.

OCR.Space онлайн үйлчилгээ

  1. Бүртгүүлэхийн тулд багажийг ажиллуулах шаардлагагүй.

    Дээрх холбоос дээр дарж, PDF баримтыг товчлуур ашиглан таны компьютерээс вэбсайтад байршуулна уу "Файл сонго" эсвэл сүлжээнээс лавлагаа ашиглана.
  2. Завсрын жагсаалтад "OCR хэлийг сонгох" Импортын баримтын хэлийг сонгох.

    Дараа нь товчлуур дээр дарж текст таних процессыг эхлүүлнэ. "OCR эхлэх!".
  3. Файлын боловсруулалтын төгсгөлд үр дүнг үзнэ үү "OCR" үр дүн болон дарна уу Татаж авахTXT документыг татаж авах.

Хэрэв та PDF текстийг задлах хэрэгтэй бөгөөд эцсийн формат нь чухал биш бол OCR.Space бол сайн сонголт юм. Зөвхөн хоёр буюу түүнээс дээш хэл дээрх үйлчилгээг нэг дор хүлээн зөвшөөрөөгүй тул зөвхөн баримт бичиг нь "ганцаарчилсан" байх ёстой.

Үзнэ үү: Free analogues FineReader

Өгүүлэлд үзүүлсэн онлайн хэрэгслүүдийг үнэлэх нь ABBYY-аас FineReader Онлайнаар OCR функцыг хамгийн зөв, зөв ​​хийдэг гэдгийг тэмдэглэх нь зүйтэй. Хэрэв танд текстийг таних нь хамгийн чухал бол энэ сонголтыг онцгойлон авч үзэх хэрэгтэй. Гэхдээ үүнийг төлөхийн тулд заавал төлөх ёстой.

Хэрэв та жижиг баримт бичгүүдийг дижитал хэлбэрт оруулах хэрэгтэй бөгөөд өөрөө өөртөө алдаа засах шаардлагатай бол NewOCR, OCR.Space эсвэл Free Online OCR ашиглах хэрэгтэй.