Иногда так бывает, что мы получаем текст в формате изображения JPG, полученного, к примеру, с помощью фотоаппарата, который нам необходимо отредактировать в качестве документа Microsoft Word. Как правило, для большенства пользователей компьютера такая задача является трудноразрешимой, если не сказать невыполнимой. Однако, на сегодняшний день существуют способы ее решения, в основном основанные на оптическом распозновании текста.

Технология оптического распознования текста (сокр. OCR — Optical Character Recognition) позволяет распознавать текст, в том числе, на изображениях (файлах) с расширением jpg. Более того, изобилие программ распознования текста очень велико и, подчас, выбрать и установить одну из них тоже представляет определенную техническую сложность, особенно, если вы не самый опытный пользователь компьютера и интернета. Кроме того, подобные задачи редактирования текста возникают довольно спонтанно и время на их решение зачастую не хватает. В таком случае, самым оптимальным вариантом являются онлайн-сервисы, которые помогут извлечь текст с изображения (картинки) и сохранить его в документе Microsoft word.
Сегодня в интернете существует множество онлайн сервисов, которые могут переводить текст с изображений JPG в word-документы для редактирования. Существует как платные, так и бесплатные варианты. Вот примеры таких сервисов:
ZAMZAR
- https://www.zamzar.com/ru/convert/jpg-to-doc/
- Выходные форматы (Word, Excel, Текстовый и многие другие)
Convertio
- https://convertio.co/ru/jpg-doc/
- Выходные форматы (Word, Excel, Текстовый и многие другие)
Шаг 1 (ПОДГОТОВКА). Подготовьте jpeg-файл на компьютере. Также вы должны знать, где он находится, чтобы выбрать его во время загрузки.
Шаг 2 (ЗАГРУЗКА). В случае использования сервиса Convertio, вам необходимо:
- Перейти на указанный выше веб-сайт.
- Выбрать открыть диспетчер файлов на компьютере, найти файл и перетащить его в окно веб-браузера. В результате вы увидите следующее и вам необходимо будет нажать кнопку Конвертировать.
После завершения операции конвертации, вам будет предложено сохранить (с помощью кнопки Скачать) полеченный word-файл у себя на компьютере для дальнейшего редактирования.
У каждого из таких сервисов есть и платные тарифы, которые существенно расширяют ваши возможности по распознаванию текста. К числу таких возможностей относятся:
- увеличенная скорость распознавания;
- онлайн-хранилище файлов;
- возможность одновременного распознования файлов;
- загрузка больших изображения (более 100 МБайт) для распознавания;
- отсутствие рекламы;
- извещения на почту и т.д.
В конечном итоге, вам предстоит принять такое решение самостоятельно, исходя из своих потребностей. Как показывает практика, конечно многие пользователи интернета обходятся бесплатными тарифами, по скольку их объемы и частоты задач по распознованию текста весьма малы. Платные тарифи подходят, скорее, для профессиональной деятельности, когда потребность перевести файл jpeg в word возникает постоянно.
Оптическое распознавание символов или оптическое считывание символов (OCR) — это электронное или механическое преобразование изображений рукописного или печатного текста в машинный код, будь то отсканированный документ, фотография документа, фотография сцены (например, текст на знаках и рекламных щитах на альбомной фотографии) или из текста субтитров, наложенного на изображение (например, из телевизионной трансляции).
Широко используется как форма ввода данных из печатных бумажных данных, будь то паспортные документы, накладные, банковские выписки, компьютеризированные квитанции, визитные карточки, почта, распечатки статических данных или любая подходящая документация — это распространенный метод оцифровки печатных текстов, чтобы их можно было редактировать, искать, хранить в электронном виде более компактно, отображается в режиме онлайн и используется в машинных процессах, таких как когнитивные вычисления, машинный перевод, (извлеченный) преобразование текста в речь, ключевые данные и анализ текста. OCR — это область исследований в области распознавания образов, искусственного интеллекта и компьютерного зрения.
В ранних версиях нужно было тренироваться с изображениями каждого персонажа и работать с одним шрифтом за раз. В настоящее время распространены современные системы, способные обеспечить высокую степень распознавания для большинства шрифтов, с поддержкой различных входных форматов файлов цифровых изображений. Некоторые системы способны воспроизводить форматированный вывод, который близко соответствует исходной странице, включая изображения, столбцы и другие нетекстовые компоненты.
Преобразование отсканированных документов и изображений в редактируемые форматы Word, Pdf, Excel и Txt (простой текст)
Доступно страниц: 10 (Вы уже использовали 0 страниц)
Если вам нужно распознать больше страниц, пожалуйста, зарегистрируйтесь
Загрузите файлы для распознавания или перетащите их на эту страницу
Поддерживаемые форматы файлов:
pdf, jpg, bmp, gif, jp2, jpeg, pbm, pcx, pgm, png, ppm, tga, tiff, wbmp
- Китайский OCR
- Немецкий OCR
- Нидерландский OCR
- Английский OCR
- Французский OCR
- Итальянский OCR
Как распознать текст с изображения?
Шаг 1
Загрузите изображения или PDF-файлы
Выберите файлы с компьютера, Google Диска, Dropbox, по ссылке или перетащив их на страницу
Шаг 2
Язык и формат
Выберите все языки, используемые в документе. Кроме того, выберите .doc или любой другой формат, который вам нужен в результате (поддерживается больше 10 текстовых форматов)
Шаг 3
Конвертируйте и скачивайте
Нажмите «Распознать», и вы можете сразу загрузить распознанный текстовый файл
В процессе работы с текстовым процессором Word у пользователей иногда возникает необходимость обработать не только набранный ими (или другими людьми) текст, но и редактировать отсканированные фрагменты. Например, чтобы не перепечатывать вручную какой-либо текст, письмо или что-нибудь другое, сканированное и полученное в таком виде. Раньше, пока не были в ходу системы распознавания, так называемые OCR, как раз и приходилось заниматься такой нудной работой. Сегодня же можно просто использовать не только многочисленные сторонние программы, но и встроенные средства Windows и, в частности, Microsoft Office. Это даже удобнее, ведь не нужно держать под рукой установленный софт, быть привязанным к одному компьютеру и т. п. А в современном мире это достаточно много значит.
Итак, есть отсканированный текст и задача вставить его в собственный документ так, чтобы после этот фрагмент можно было править. Есть два пути; рассмотрим оба.
Первый путь
Он заключается в том, чтобы использовать встроенные средства Microsoft Word. Дело в том, что если вставить сканированный фрагмент без дополнительных действий, то он будет просто картинкой. Основной текст его будет обтекать, и редактировать вы сможете разве что размер и прозрачность. Это особенно досадно, когда нужно переделать всего-то пару строчек. Но если вставить этот отсканированный фрагмент как объект Microsoft Image Viewer в Word, то он вставится как обычный, доступный для редактирования текст. Для этого нужно проследить, чтобы файл был с расширением .tiff, а если нет, то воспользоваться Paint, открыв его и перезаписав в нужном формате. После этого в дело вступает специальный компонент платформы Microsoft Office, о котором мы упоминали чуть выше. Именно его вам следует открыть в главном меню. Если его нет, то придётся покопаться в панели управления.
Найдите в ней пункт «Установка и удаление программ», найдите в открывшемся списке Office и перейдите к выбору компонентов. Среди них вы как раз и найдёте Image Viewer, необходимый нам для выполнения задачи. После установки он появится в главном меню.
Так вот, после его открытия, drag’n’drop’ом или через меню окна, откройте в этой программе сканированный файл. Нужно будет подождать пару минут, так как на экране появится прогресс-бар, отображающий ход распознавания. По завершении процесса, собственно, откроется окно с распознанным текстом. Его вы можете скопировать в Word для дальнейшего редактирования. Конечно, вы должны учитывать, что распознавание текста, искажённого сканированием, может пройти не идеально, так что стоит провести так называемую «вычитку», то есть отредактировать его, исправляя неправильно распознанные символы. Гораздо хуже дело обстоит с рукописным текстом, вероятность, что его удастся отредактировать, сильно коррелирует с цветом бумаги и чернил, качеством сканирования и, конечно, разборчивостью почерка. Но такая работа достаточно редко проводится с рукописным текстом, обычно всё же речь идёт о напечатанном.
Второй путь
В общем говоря, второй способ состоит в том же самом, что и первый, с той только разницей, что для включения режима распознавания текста и его редактирования используется сначала сторонний софт, а потом уже Word. Потребуется установленная программа. Возможно, она даже будет работать лучше, чем решение от Microsoft, так как подобные программы разрабатываются и проектируются специально для этой задачи. Авторы обещают практически 100% точность в работе с печатным текстом и чуть более скромные цифры, когда речь заходит о рукописном. Но чтобы отделить маркетинговые уловки от истинного положения вещей, придётся ступить на стезю эмпирической проверки.
Программа ABBYY FineReader
На практике оказывается, что разрыв не столь велик. Да, кому-то может показаться удобным, что не нужно включать режим редактирования текста через связку Microsoft Image Viewer — Microsoft Word, но ведь для этого придётся использовать другую связку программ, а точность распознавания символов будет для печатных документов и так стабильно высокой. Поэтому причины платить больше за одну из этих программ, когда есть решение, встроенное в пакет Office — весьма туманны. Другое дело, если вы имеете дело с частными случаями. Например, у вас есть много отсканированных в плохом качестве документов, которые нужно оцифровать и подготовить для режима редактирования. Тогда узкоспециализированный софт, настроенный под работу с шумом и искажениями в таких изображениях, разумеется, будет предсказуемо лучше. Он точнее обработает лист с символами, корректнее распознает их и передаст в Word для дальнейшей работы. Но таких случаев не так уж много и, как правило, рядовой пользователь с ними не сталкивается. Поэтому для типовых задач этот путь уже практически не используется.
Программа Скан Корректор А4
Особенности корректировки текстовых документов
Однако под редактированием может подразумеваться не только исключительно правка отсканированных документов, но и вообще любая корректура. Начнём с самого простого — удаления символов. Для этого предусмотрены клавиши Backspace и Delete. Первый вариант удаляет символ, стоящий слева от курсора мыши. Второй, соответственно, тот, что находится правее курсора.
Также нам может понадобиться отделить друг от друга отдельные абзацы для повышения общей читабельности. Используем для этой цели клавишу ввода Enter. Если мы хотим выполнить обратную процедуру, то занимаем место в самом начале второго абзаца. Нажатие кнопки Delete пододвинет второй абзац вплотную к предыдущему.
Ещё возникает потребность работать сразу с целым текстовым фрагментом. Например, нам нужно перенести кусок текста в другую часть документа. Для этого мы выделяем его левой кнопкой мышки. После этого делаем один щелчок правой её кнопкой. Из выпавшего перечня действий выбираем «копировать» или «вырезать». Переходим на то место, куда нужно перенести фрагмент. Клик правой кнопкой мыши — выбираем команду «вставить». Теперь текст переместится на новое место.
Во время набора текста обязательно случаются ошибки, а порой, сразу целая серия. В этой ситуации очень удобно отменить свои действия, чтобы не удалять вручную каждый неверный символ. Этот момент можно значительно упростить, если знать, как действовать. На главной панели вверху нужно найти стрелочку, показывающую обратное направление. Она может выглядеть по-разному в различных версиях Word. Или же воспользоваться горячей комбинацией клавиш «Ctrl+Z». Происходит отмена последнего набранного символа.
Может возникнуть потребность вставки в имеющийся текст специальных символов. Для этого в редакторе от Майкрософт предусмотрена «Вставка», а в ней ищем вкладку «Символы». Осталось лишь выбрать тот символ, который необходимо вставить, и он будет применён ко всему документу. Ещё один случай — заменить конкретное слово другим по всему тексту. Вручную делать это много раз очень долго, однако разработчики Word позаботились и упростили эту задачу. Сначала выбираем комбинацию Ctrl+H. После этого всплывает окошко, в котором нам предлагается выбрать то слово, что подлежит замене. В соседнем окошке указываем новое слово и нажимаем «применить».
Опция исправления ошибок позволит отредактировать не только орфографические ошибки, но и синтаксис. Редактор и сам подчеркнёт неправильную орфографию при помощи красной волнистой линии, а грамматические ошибки выделяются зелёной линией. Это существенно облегчает задачу пользователю, которому следует перейти в раздел с названием Рецензирование. После этого переходим во вкладку «Правописание». Редактор сам будет предлагать заменить неправильные слова или те, которых нет в предусмотренном словаре, на правильные.
При редактировании у пользователя появляется широкий выбор изменения шрифтов, которые находятся во вкладке с соответствующим названием. Их создано десятки видов, а некоторые даже в старинных стилях, наподобие готического, однако наиболее популярным является Times New Roman. Для работы выбирают различный размер шрифта, но более востребованными являются №№12 и 14. А готовый шрифт можно сделать жирным, отметить подчеркиванием, сделать курсивом.
Многим, кто работает с большими объёмами текстов по учёбе и работе, приходится делать нумерацию страниц в пределах одного документа. Для того чтобы пронумеровать их, перейдём во вкладку «Вставка», где предусмотрено немало интересных инструментов. Выберем «номер страницы», а затем место, куда будет проставлена нумерация на каждой из страниц документа. В большинстве случаев это бывает внизу посередине. Это основные функции, о которых следует знать начинающему редактору при работе с Word любой версии.
Послесловие
Пакет Office представляет собой широкий набор инструментов для решения самых разнообразных задач. У каждой из входящих в него программ есть своя функциональность, и они дополняют друг друга при выполнении офисных работ. В частности, для редактирования отсканированных документов в Word потребуется программа распознавания, и в пакете она представлена. Такая структура «всё-в-одном» весьма удобна, так как не приходится думать, где найти и как установить сторонний софт, не нужно разбираться с особенностями его интерфейса: есть решения, выполненные в едином стиле. Поэтому Office был и остаётся стандартом де-факто для офисной работы.
Что же касается возможности вставить изображение напрямую в Word и редактировать его прямо оттуда, то пока что такой режим не поддерживается. Однако учитывая тенденции на объединение программ внутри пакета и уход в онлайн (мы имеем в виду Office365), стоит этого вскоре ожидать. Сейчас же нужно будет установить требуемый компонент (если он ещё не был установлен) и работать именно так.
Download Article
Free steps to turn a picture into a Word document that you can edit
Download Article
- Using OnlineOCR
- Using a PDF on Windows
- Using a PDF on Mac
- Tips
- Warnings
|
|
|
|
Don’t you wish you could open a JPEG image in Microsoft Word and make changes to the text? While that might seem impossible, we’ve actually found two easy ways to get the job done—one is to scan for text using an online OCR tool, and the other is to simply «print» the JPEG to a PDF and then convert it to a Word document that you can edit. This wikiHow article teaches you how to easily convert a JPEG into an editable Word document.
Things You Should Know
- Use an online service, like OnlineOCR, to convert your images into editable Word documents. Just go to the website and select your JPEG to convert to PDF.
- For Mac or Windows computers, use Preview or Photos to change your JPEG to PDF.
- Once the JPEG is a PDF, you can open it in Word to edit the text!
-
1
Open OnlineOCR. Go to https://www.onlineocr.net/ in your computer’s web browser. This website will allow you to convert a few different file types (JPEG included) into a Word document.
- You can also use other online services if you don’t want to use OnlineOCR. Try Small PDF or a similar PDF converter.
-
2
Click Select file…. It’s in the lower-left side of the webpage. Doing so opens a File Explorer (Windows) or Finder (Mac) window in which you can select your JPEG file.
Advertisement
-
3
Select your JPEG file. Go to the folder in which your JPEG is stored, then click once the JPEG file you want to convert.
-
4
Click Open. It’s in the bottom-right corner of the window. Doing so uploads the JPEG file to the OnlineOCR website.
- On a Mac, you may click Choose here.
-
5
Select a language. If you want to use a language other than the one listed in the middle text box, click the current language and then click the language you want to use.
-
6
Make sure you’re converting to a Word document. If the third text box doesn’t have «Microsoft Word (docx)» written in it, click the text box and then click Microsoft Word (docx) in the drop-down menu.
-
7
Click CONVERT. It’s on the far-right side of the page. Doing so prompts OnlineOCR to begin converting your JPEG file into a Word document.
-
8
Click Download Output File. This link is below the Select file… button. Your converted Word document will download onto your computer.
- Depending on your browser’s settings, you may need to select a save location or confirm the download before the file will download.
-
9
Open your new Word document. Double-click the converted Word document to do so.
-
10
Click Enable Editing. It’s in a yellow bar at the top of the Word document. Doing so will make the Word document editable.
- This is necessary because, since you downloaded the Word document from the Internet, Word views it as potentially dangerous.
- Remember to save any changes you make by pressing Ctrl+S (Windows) or ⌘ Command+S (Mac).
Advertisement
-
1
Open the JPEG file you want to convert. Double-click the JPEG file to do so. This will open the JPEG file in the Photos app.
-
2
Click the «Print»
icon. It’s the printer-shaped icon in the top-right corner of the window. Doing so opens the Print window.
- Don’t panic if you don’t have a printer attached to your computer—you won’t actually be printing anything.
-
3
Click the «Printer» drop-down box. This is at the top of the Print window. A drop-down menu will appear.
-
4
Click Microsoft Print to PDF. It’s in the drop-down menu.
-
5
Click Print. This is at the bottom of the window. A pop-up window will appear.
-
6
Enter a name. In the «Name» text field, type in the name you want to use for your converted document.
-
7
Select a save location. Click a folder name (e.g., Desktop) on the left side of the window.
-
8
Click Save. It’s at the bottom of the window. Doing so saves a PDF version of your JPEG file in your selected folder.
-
9
Go to the PDF’s location. You’ll find it in the folder you selected before saving the PDF.
-
10
Right-click the PDF. Doing so prompts a drop-down menu.
-
11
Select Open with. This is in the drop-down menu. A pop-out menu will appear.
- If you don’t see Open with in the drop-down menu, click anywhere to close the drop-down menu, then click once the PDF to select it before you right-click it again.
-
12
Click Word. It’s in the pop-out menu. Microsoft Word will open.
-
13
Click OK when prompted. Word will begin attempting to convert the PDF into a Word document.
- This may take a few minutes.
-
14
Review your Word document. The PDF-to-Word conversion process isn’t perfect, so you may need to clean up some of the text or remove images that aren’t properly positioned.[1]
- If your document isn’t entirely editable or a large group of the document’s text is inaccurate, you might want to use Online OCR instead.
Advertisement
-
1
Select your JPEG file. Go to the folder location of the JPEG file that you want to convert, then click once the file to select it.
-
2
Click File. It’s a menu item at the top of the screen. A drop-down menu will appear.
-
3
Select Open With. This is in the File drop-down menu. Selecting it prompts a pop-out menu to appear.
-
4
Click Preview. It’s in the pop-out menu. Doing so opens the JPEG file in Preview.
-
5
Click File again. The drop-down menu will reappear.
-
6
Click Export as PDF…. This is in the drop-down menu. Clicking it prompts a new window to appear.[2]
-
7
Select a save location. Click the «Where» drop-down box, then click the name of the folder in which you want to save your converted PDF.
-
8
Click Save. It’s at the bottom of the window.
-
9
Select your new PDF. Go to the folder in which you saved the PDF version of your JPEG file, then click the PDF to select it.
-
10
Click File, then select Open With. The Open With pop-out menu will open.
-
11
Click Microsoft Word. This should be in the pop-out menu. Doing so will open Microsoft Word.
- If you don’t see Word here, you can still open the PDF by opening Word, clicking File, clicking Open, and selecting the PDF in the Finder window that appears.
-
12
Click OK when prompted. Word will begin attempting to convert the PDF into a Word document.
- This may take a few minutes.
-
13
Review your Word document. The PDF-to-Word conversion process isn’t perfect, so you may need to clean up some of the text or remove images that aren’t properly positioned.[3]
- If your document isn’t entirely editable or a large group of the document’s text is inaccurate, you might want to use Online OCR instead.
Advertisement
Our Most Loved Articles & Quizzes
Ask a Question
200 characters left
Include your email address to get a message when this question is answered.
Submit
Advertisement
-
The higher the quality of the JPEG file, the better results you’ll have when converting it to a Word document.
Thanks for submitting a tip for review!
Advertisement
-
OCR technology isn’t perfect, so you may need to make some adjustments to your Word document before it resembles accurately the JPEG file’s contents.
Advertisement
About This Article
Thanks to all authors for creating a page that has been read 533,605 times.















