T372 extract ocr cleaning (part 1)
Un début de refactoring de l'OCR cleaning :
- Gestion des erreurs d'OCR quand des espaces sont insérés entre les lettres (e.g. A R R E T E).
- Simplification de quelques regex
- un peu de renommage
Un début de refactoring de l'OCR cleaning :