Comment OCR marche-t-il?

Soda PDF 14

La reconnaissance optique de caractères, OCR, est une technologie qui reconnaît le texte dans les images. Il permet à Soda PDF de différencier le texte du reste de l’image afin que vous puissiez l’éditer.

Vous pourrez reconnaître une image par la bordure rouge qui l’entoure lorsque vous la sélectionnez en mode Édition.

 

mceclip0.png

 

Lorsque la page entière est une grande image, elle est indicative d’un document composé de pages numérisées. Sans OCR, ils ne peuvent pas être modifiés facilement.

Une fois l’image sélectionnée, vous devez utiliser l’OCR pour rendre le texte modifiable.

 

mceclip8.png


Auto et Manuel

ils ne sont actifs que lorsqu’une image individuelle est sélectionnée. Plutôt que de numériser un document entier, vous pouvez travailler image par image. Ces fonctionnalités ne créent pas de nouveau fichier, mais numérisent l’image dans le fichier PDF existant. Cliquez ici pour en savoir plus.

 

Reconnaître le document

Si vous avez un document composé de plusieurs pages numérisées qui doivent être reconnues et modifiées, vous devez ouvrir le module OCR et choisir l’option Reconnaître le document :

 

mceclip9.png

 

Dans la boîte de dialogue qui s’affiche, vous pouvez spécifier les pages à reconnaître.

 

Screenshot_152.png

 

Une fois le processus de reconnaissance terminé, un nouveau fichier avec le texte reconnu sera créé dans un onglet séparé. Votre fichier d’origine ne changera pas.

 

Image externe

Pour reconnaître le texte d’une image externe au format PDF, cliquez sur Image externe.

 

Screenshot_153.png

 

Une fenêtre Parcourir s’ouvrira où vous devrez sélectionner le fichier. Cliquez sur Ouvrir.

Une fois l’image reconnue, elle s’ouvrira dans un nouveau document portable dans l’application Soda PDF.

 

Soda PDF 11

Dans Soda PDF 11, les options suivantes sont disponibles :

 

mceclip5.png

 

Plage de pages
Cliquez ici pour sélectionner une plage de pages à numériser. Sélectionnez les pages que vous souhaitez et appuyez sur OK. Un nouveau fichier sera créé à partir de la plage sélectionnée :


mceclip0.png


Document entier
Cette option appliquera le moteur OCR à l’ensemble du document à la fois. Vous verrez la barre d’état apparaître vous informant que Soda PDF reconnaît le texte. Vous pouvez cliquer sur Annuler pour l’arrêter. Lorsqu’il est terminé, un nouveau fichier s’ouvre avec toutes vos images numérisées. Votre fichier d’origine ne changera pas.


mceclip1.png


Lot

Avec l’outil Lot, vous pouvez utiliser le moteur OCR sur plusieurs fichiers à la fois. Lorsque vous cliquez sur Ajouter des fichiers... ou Ajouter un dossier... , vous serez invité à parcourir votre ordinateur et à choisir vos fichiers. Vous pouvez utiliser les options de flèche pour modifier l’ordre dans lequel les fichiers seront lotés. Vous pouvez supprimer n’importe quel fichier de la liste avec Supprimer.


mceclip2.png


Cliquez sur Parcourir... pour changer l’endroit où les fichiers seront enregistrés. Lorsque vous cliquez sur Lot, chaque fichier reconnu s’ouvre individuellement dans l’ordre que vous avez sélectionné :

 

mceclip3.png

 

De l’image externe

Cela ouvrira une fenêtre Parcourir. Choisissez votre fichier et il s’ouvrira prêt à être modifié. 

Numériser et reconnaître
Cette fonctionnalité s’interfacera directement avec votre scanner. Lorsque vous créez votre nouveau fichier PDF directement à partir de votre scanner, les documents seront également numérisés avec OCR, ce qui les rendra prêts à être modifiés. Cliquez ici pour en savoir plus sur cette fonctionnalité.  

Créer à partir de Scanner n’est disponible que dans Soda PDF Desktop. Soda PDF Online est une application Web qui n’accède pas au système d’exploitation de votre ordinateur. Nous travaillons à trouver un moyen d’apporter cette fonctionnalité à Soda PDF Online le plus rapidement possible. 

Cet article vous a-t-il été utile ?

Yes No
Utilisateurs qui ont trouvé cela utile : 47 sur 93
Vous avez d’autres questions ? Envoyer une demande

Commentaires

0 commentaire

Cet article n'accepte pas de commentaires.