Project

General

Profile

Actions

User Story #3592

open

Epic #3590: Epic 3: Extraction du texte

US04: Extraction du texte depuis un PDF standard

Added by Khadija Mezghani 7 days ago. Updated 7 days ago.

Status:
New
Priority:
High
Assignee:
-
Target version:
-
Start date:
06/17/2026
Due date:
% Done:

0%

Estimated time:

Description

En tant que système, je veux extraire le texte d’un PDF textuel, afin de préparer son analyse intelligente.

Critères d’acceptation :
-Le système détecte si le PDF contient du texte exploitable.

- Le texte brut est extrait.

- Le texte brut est sauvegardé.

- Le statut passe à text_extracted si l’extraction réussit.

- Une anomalie est créée si aucun texte exploitable n’est trouvé.

Actions

Also available in: Atom PDF