OCR de PDF para arquivo texto ou ODT.
Usa libreoffice
ocrarquivo.desktop
[Desktop Entry]
Type=Service
ServiceTypes=KonqPopupMenu/Plugin
MimeType=application/pdf;
Actions=Otimizar-pdf
[Desktop Action Otimizar-pdf]
Name=OCR de PDF
Exec=~/.local/share/kservices5/scripts/ocrarquivo.sh %U
Icon=utilities-terminal
ocrarquivo.sh
#!/bin/bash
# Cria uma lista radiolist informados, com valor padrão sha256sum
tipoarquivo=`kdialog --radiolist "Selecione o hash a verificar:" 1 "Tipo texto" off 2 "Tipo odt" on `
# Se clicar em cancelar sai
if [ $? -eq 1 ]; then
exit 0 #
fi
if [ $tipoarquivo == 1 ]; then
for f in "$@"; do pdftotext "$f" > /dev/null 2>&1 & done
elif [ $tipoarquivo == 2 ]; then
for f in "$@"; do
libreoffice --headless --infilter="writer_pdf_import" --convert-to odt "$f" --outdir . > /dev/null 2>&1 &
done
fi
Se quiser adicionar no git, segue mais um