Olá Pessoal, estou tentando remover parte de um texto utilizando python (regex) porém não estou obtendo sucesso.
O texto que estou trabalhando segue este padrão… todo o conteúdo que está dentro das # eu quero remover incluindo as #
Este texto não está em um arquivo
###############################################################################
# !!! ATENCAO !!! ATENCAO !!! ATENCAO !!! ATENCAO !!! ATENCAO !!! ATENCAO !!! #
# #
# ESTE TEXTO EU QUERO REMOVER #
# ESTE TEXTO EU QUERO REMOVER #
# ESTE TEXTO EU QUERO REMOVER #
# ESTE TEXTO EU QUERO REMOVER #
# ESTE TEXTO EU QUERO REMOVER #
# ESTE TEXTO EU QUERO REMOVER #
###############################################################################
Este texto eu quero manter.
Tudo que está aqui eu quero salvar ,.... ate o fim do texto
não importa a forma o desde que seja em Python…
alguém tem alguma ideia?
Opa @swatquest fiz uns testes aqui com suas dicas e deu certo… vlw
Então eu fiz assim… texto_limpo = re.sub("#.*","", texto_completo)
o regex #.* é o suficiente para selecionar a parte que quero remover…
depois então eu uso re.sub
Use re.sub() to search and replace the pattern in a given string. Read here.
First, Write pattern #.* here we are matching string with symbol ‘#’ followed by zero or or any number of letter
Next, use the re.sub(r"#.+", '', text) method to replace regex pattern with empty space.
Next, re.sub() return the replaceed string. use strip() method to remove unnecssary leading and traling spaces from it.
Code:
import re
text = '''###############################################################################
# !!! ATENCAO !!! ATENCAO !!! ATENCAO !!! ATENCAO !!! ATENCAO !!! ATENCAO !!! #
# #
# ESTE TEXTO EU QUERO REMOVER #
# ESTE TEXTO EU QUERO REMOVER #
# ESTE TEXTO EU QUERO REMOVER #
# ESTE TEXTO EU QUERO REMOVER #
# ESTE TEXTO EU QUERO REMOVER #
# ESTE TEXTO EU QUERO REMOVER #
###############################################################################'''
result = re.sub(r"#.+", '', text)
print(result.strip())