Мені потрібно порахувати кількість файлів у каталозі за допомогою Python.
Я думаю, найпростіший спосіб len(glob.glob('*'))
, але це також зараховує сам каталог як файл.
Чи є спосіб підрахувати лише файли в каталозі?
Мені потрібно порахувати кількість файлів у каталозі за допомогою Python.
Я думаю, найпростіший спосіб len(glob.glob('*'))
, але це також зараховує сам каталог як файл.
Чи є спосіб підрахувати лише файли в каталозі?
Відповіді:
os.listdir()
буде трохи ефективніше, ніж використання glob.glob
. Щоб перевірити, чи є ім'я файлу звичайним файлом (а не каталогом чи іншим об'єктом), використовуйте os.path.isfile()
:
import os, os.path
# simple version for working with CWD
print len([name for name in os.listdir('.') if os.path.isfile(name)])
# path joining version for other paths
DIR = '/tmp'
print len([name for name in os.listdir(DIR) if os.path.isfile(os.path.join(DIR, name))])
folder_path
внутрішню os.path.filename(name)
частину, якщо ви не на cwd. stackoverflow.com/questions/17893542/…
os.path.join(DIR, name)
більш DIR + '/' + name
? Останній коротший і, ІМО, більш чіткий, ніж перший. Можливо, є якась ОС: ес, на якій остання не вийшла?
import os
path, dirs, files = next(os.walk("/usr/lib"))
file_count = len(files)
Для всіх типів файлів включені підкаталоги:
import os
list = os.listdir(dir) # dir is your directory path
number_files = len(list)
print number_files
Тільки файли (уникаючи підкаталогів):
import os
onlyfiles = next(os.walk(dir))[2] #dir is your directory path as string
print len(onlyfiles)
Ось тут дуже зручним є fnmatch:
import fnmatch
print len(fnmatch.filter(os.listdir(dirpath), '*.txt'))
Детальніше: http://docs.python.org/2/library/fnmatch.html
os.path.isfile()
як це прийнято. Також значно швидше, ніж glob.glob()
.
Якщо ви хочете порахувати всі файли в каталозі, включаючи файли в підкаталогах, найбільш пітонічним способом є:
import os
file_count = sum(len(files) for _, _, files in os.walk(r'C:\Dropbox'))
print(file_count)
Ми використовуємо суму, яка швидша, ніж явне додавання підрахунків файлів (очікує терміни)
_
в for
циклі. os.walk
також я знаю. Але не впевнений, що відбувається з підкресленнями всередині sum
функції. Дякую!
import os
print len(os.listdir(os.getcwd()))
Я здивований, що ніхто не згадав os.scandir
:
def count_files(dir):
return len([1 for x in list(os.scandir(dir)) if x.is_file()])
Це використовує os.listdir
та працює для будь-якого каталогу:
import os
directory = 'mydirpath'
number_of_files = len([item for item in os.listdir(directory) if os.path.isfile(os.path.join(directory, item))])
це можна спростити за допомогою генератора та зробити трохи швидше за допомогою:
import os
isfile = os.path.isfile
join = os.path.join
directory = 'mydirpath'
number_of_files = sum(1 for item in os.listdir(directory) if isfile(join(directory, item)))
def count_em(valid_path):
x = 0
for root, dirs, files in os.walk(valid_path):
for f in files:
x = x+1
print "There are", x, "files in this directory."
return x
Взято з цієї посади
files
це перелік. 2. ОП не шукає рекурсивного підрахунку
Ось проста однорядкова команда, яка мені здалася корисною:
print int(os.popen("ls | wc -l").read())
ls
як правило, нахмурився (це часто може спричинити проблеми), хоча це не поганий "швидкий і брудний" метод в оболонці. Ви повинні використовувати ls -1
, хоча це гарантує один рядок на файл.
Хоча я згоден з відповіддю, наданою @DanielStutzbach: os.listdir()
буде дещо ефективнішим, ніж використання glob.glob
.
Однак, ви хочете використовувати додаткову точність, якщо ви хочете порахувати кількість певних файлів у папці len(glob.glob())
. Наприклад, якщо ви мали б порахувати всі pdfs у папці, яку ви хочете використовувати:
pdfCounter = len(glob.glob1(myPath,"*.pdf"))
Це просто:
print(len([iq for iq in os.scandir('PATH')]))
він просто підраховує кількість файлів у каталозі, я використовував техніку розуміння списку, щоб повторити через певний каталог, повертаючи всі файли взамін. "len (повернений список)" повертає кількість файлів.
import os
total_con=os.listdir('<directory path>')
files=[]
for f_n in total_con:
if os.path.isfile(f_n):
files.append(f_n)
print len(files)
Якщо ви будете використовувати стандартну оболонку операційної системи, ви можете отримати результат набагато швидше, ніж використовувати чистий пітонічний спосіб.
Приклад для Windows:
import os
import subprocess
def get_num_files(path):
cmd = 'DIR \"%s\" /A-D /B /S | FIND /C /V ""' % path
return int(subprocess.check_output(cmd, shell=True))
Я використовував glob.iglob
структуру каталогу, схожу на
data
└───train
│ └───subfolder1
│ | │ file111.png
│ | │ file112.png
│ | │ ...
│ |
│ └───subfolder2
│ │ file121.png
│ │ file122.png
│ │ ...
└───test
│ file221.png
│ file222.png
Обидва наведені нижче варіанти повертають 4 (як очікувалося, тобто не враховують самі папки )
len(list(glob.iglob("data/train/*/*.png", recursive=True)))
sum(1 for i in glob.iglob("data/train/*/*.png"))
Я це зробив, і це повернуло кількість файлів у папці (Attack_Data) ... це працює чудово.
import os
def fcount(path):
#Counts the number of files in a directory
count = 0
for f in os.listdir(path):
if os.path.isfile(os.path.join(path, f)):
count += 1
return count
path = r"C:\Users\EE EKORO\Desktop\Attack_Data" #Read files in folder
print (fcount(path))