Para o meu projeto, preciso de ler ficheiros em Python. A primeira ação que preciso de executar é listar os ficheiros de uma pasta. Para isso vou usar o código seguinte:
import os
os.listdir("path") # devolve uma lista
Para listar os ficheiros com extensão “.csv”, podemos usar o código seguinte:
import os
import re
d = os.listdir(".")
for i in d[:]:
if re.match('.*\.csv$', i):
print i
E agora um programa que lê um ficheiro de texto para uma lista de linhas, retira o \r\n (rstrip) do fim das linhas e o BOM do início. No fim, imprime as linhas limpas.
#!/usr/bin/python
# -*- coding: utf-8 -*-
import re
with open("a.txt") as f:
linhas = f.readlines()
regex = re.compile(r"^\xef\xbb\xbf")
linhas = list(map(lambda x: regex.sub("", x).rstrip(), linhas))
for i in linhas:
print i
