Список дерев каталогів на Python


Відповіді:


615

Це спосіб перейти до кожного файлу та каталогу в дереві каталогів:

import os

for dirname, dirnames, filenames in os.walk('.'):
    # print path to all subdirectories first.
    for subdirname in dirnames:
        print(os.path.join(dirname, subdirname))

    # print path to all filenames.
    for filename in filenames:
        print(os.path.join(dirname, filename))

    # Advanced usage:
    # editing the 'dirnames' list will stop os.walk() from recursing into there.
    if '.git' in dirnames:
        # don't go into any .git directories.
        dirnames.remove('.git')

19
І якщо ви запустите цей код (як є) із оболонки Python, пам’ятайте, що Ctrl + C зупинить вихід до зазначеної оболонки. ;)
gary

41
Це буде рекурсивно перераховувати файли та каталоги
rds

Ви навіть можете відредагувати список прізвищ, щоб не допустити повторення деяких контурів.
bugloaf

8
@ Clément "Коли вгорі встановлено значення" True ", абонент може змінити на місці місце список прізвищ (можливо, використовуючи призначення del або slice), а walk () буде повторюватися лише в підкаталогах, імена яких залишаються в dirnames; це може бути використане для обрізки шукати, накладати певний порядок відвідування або навіть інформувати walk () про каталоги, які абонент створює або перейменовує, перш ніж знову відновити ходьбу (). " від docs.python.org/2/library/os.html#os.walk
bugloaf

Найпростіший спосіб ігнорувати деякі каталоги - це не додавати їх в першу чергу до for subdirname in dirnames: if subdirname != '.git'
dirname

537

Можна використовувати

os.listdir(path)

Для довідок та інших функцій ОС дивіться тут:


1
ну оригінальне питання просто досить розпливчасте, щоб не знати, чи хотіли вони рекурсивного рішення. "всі файли в каталозі" можна інтерпретувати як рекурсивні.
Томмі

3
@Tommy, "каталог" - це чітко визначена структура даних, і вона стосується "ls", а не "ls -R". Крім того, майже всі інструменти UNIX за замовчуванням не працюють рекурсивно. Я не знаю, що мав на увазі запитуючий, але те, що він написав, було зрозуміло.
Торстен Бронгер

Документи python 3 пропонують використовувати os.scandirзамість цього, оскільки у багатьох випадках це дозволяє запобігти системні виклики, надаючи безкоштовне прискорення (і IPC, і IO повільні).
Джаппі Керк

5
listdir дає вам єдине ім'я файлу в каталозі, чи є метод, щоб отримати повний шлях?
greperror

1
@greperror Ви можете використовувати os.path.abspath для отримання повного шляху. Крім того, щоб перевірити, чи заданий шлях є файлом, використовуйте os.path.isfile або os.path.isdir.
Олександр

111

Ось допоміжна функція, яку я використовую досить часто:

import os

def listdir_fullpath(d):
    return [os.path.join(d, f) for f in os.listdir(d)]

3
Генератор буде краще.
Роберт Сімер

1
@RobertSiemer, що залежить від використання. У багатьох випадках список буде кращим, але я думаю, що генератор є більш універсальним, оскільки його можна перетворити на список. Це залежить від того, чи шукаєте ви, універсальність чи щось трохи більш впорядковане.
James Mchugh

3
Минуло десять років, але я думаю, що я зробив це так, тому що os.listdir () повертає список, і я це наслідував.
giltay

82
import os

for filename in os.listdir("C:\\temp"):
    print  filename

16
r'C:\temp'є більш чітким і кращим для "C:\\temp"Rawstrings є кращим, ніж супутні нахили.
smci

13

Якщо вам потрібні здібності до глобалізації, є і модуль для цього. Наприклад:

import glob
glob.glob('./[0-9].*')

поверне щось на кшталт:

['./1.gif', './2.txt']

Дивіться документацію тут .


10

Спробуйте це:

import os
for top, dirs, files in os.walk('./'):
    for nm in files:       
        print os.path.join(top, nm)

В одному рядку: [top + os.sep + f for top, dirs, файли в os.walk ('./') для f у файлах]
J. Peterson

9

Для файлів у поточному робочому каталозі без вказівки шляху

Python 2.7:

import os
os.listdir(os.getcwd())

Python 3.x:

import os
os.listdir()

Дякуємо Stam Kaly за коментар до python 3.x


5
os.listdir()перераховує елементи в поточному каталозі за замовчуванням! Тож не треба os.getcwd():)
Стам Кали

Як би я це зробив? Коли я використовую >>> os.listdir () без аргументу, я отримую: TypeError: listdir () приймає рівно 1 аргумент (0 задано)
Дейв Інженер

2
Я припускаю, що ти працюєш на 2.7. Додано це 3.x
Stam Kaly


3

Я написав довгу версію з усіма можливостями, які мені можуть знадобитися: http://sam.nipl.net/code/python/find.py

Я думаю, він також підійде тут:

#!/usr/bin/env python

import os
import sys

def ls(dir, hidden=False, relative=True):
    nodes = []
    for nm in os.listdir(dir):
        if not hidden and nm.startswith('.'):
            continue
        if not relative:
            nm = os.path.join(dir, nm)
        nodes.append(nm)
    nodes.sort()
    return nodes

def find(root, files=True, dirs=False, hidden=False, relative=True, topdown=True):
    root = os.path.join(root, '')  # add slash if not there
    for parent, ldirs, lfiles in os.walk(root, topdown=topdown):
        if relative:
            parent = parent[len(root):]
        if dirs and parent:
            yield os.path.join(parent, '')
        if not hidden:
            lfiles   = [nm for nm in lfiles if not nm.startswith('.')]
            ldirs[:] = [nm for nm in ldirs  if not nm.startswith('.')]  # in place
        if files:
            lfiles.sort()
            for nm in lfiles:
                nm = os.path.join(parent, nm)
                yield nm

def test(root):
    print "* directory listing, with hidden files:"
    print ls(root, hidden=True)
    print
    print "* recursive listing, with dirs, but no hidden files:"
    for f in find(root, dirs=True):
        print f
    print

if __name__ == "__main__":
    test(*sys.argv[1:])

3

Ось ще один варіант.

os.scandir(path='.')

Він повертає ітератор об'єктів os.DirEntry, відповідний записам (разом з інформацією про атрибути файлів) у каталозі, заданому шляхом.

Приклад:

with os.scandir(path) as it:
    for entry in it:
        if not entry.name.startswith('.'):
            print(entry.name)

Використання scandir () замість listdir () може значно підвищити продуктивність коду, який також потребує інформації про тип файлу чи атрибути файлів , оскільки об'єкти os.DirEntry розкривають цю інформацію, якщо операційна система надає її під час сканування каталогу. Усі методи os.DirEntry можуть виконувати системний виклик, але is_dir () та is_file () зазвичай вимагають лише системного виклику для символічних посилань; os.DirEntry.stat () завжди вимагає системного виклику в Unix, але вимагає лише одного для символічних посилань у Windows.

Документи Python


3

Хоча os.listdir()це добре для створення списку імен файлів та dir, часто ви хочете робити більше, коли у вас є ці імена - і в Python3, pathlib робить інші завдання справами. Давайте подивимось і подивимось, чи сподобалось тобі так само, як і мені.

Щоб перерахувати вміст dir, побудуйте об'єкт Path та захопіть ітератор:

In [16]: Path('/etc').iterdir()
Out[16]: <generator object Path.iterdir at 0x110853fc0>

Якщо ми хочемо лише перелік назв речей:

In [17]: [x.name for x in Path('/etc').iterdir()]
Out[17]:
['emond.d',
 'ntp-restrict.conf',
 'periodic',

Якщо ви хочете лише пани:

In [18]: [x.name for x in Path('/etc').iterdir() if x.is_dir()]
Out[18]:
['emond.d',
 'periodic',
 'mach_init.d',

Якщо ви хочете, щоб імена всіх файлів конф в цьому дереві:

In [20]: [x.name for x in Path('/etc').glob('**/*.conf')]
Out[20]:
['ntp-restrict.conf',
 'dnsextd.conf',
 'syslog.conf',

Якщо ви хочете, щоб список дерев з конфіденційними файлами> = 1K:

In [23]: [x.name for x in Path('/etc').glob('**/*.conf') if x.stat().st_size > 1024]
Out[23]:
['dnsextd.conf',
 'pf.conf',
 'autofs.conf',

Вирішення відносних шляхів стає простим:

In [32]: Path('../Operational Metrics.md').resolve()
Out[32]: PosixPath('/Users/starver/code/xxxx/Operational Metrics.md')

Навігація із Шляхом досить чітка (хоча і несподівана):

In [10]: p = Path('.')

In [11]: core = p / 'web' / 'core'

In [13]: [x for x in core.iterdir() if x.is_file()]
Out[13]:
[PosixPath('web/core/metrics.py'),
 PosixPath('web/core/services.py'),
 PosixPath('web/core/querysets.py'),

1

Хороший один вкладиш, який реєструє лише файли. Я використовував це в моїй директиві setup.py package_data:

import os

[os.path.join(x[0],y) for x in os.walk('<some_directory>') for y in x[2]]

Я знаю, що це не відповідь на питання, але може стати в нагоді


1

Для Python 2

#!/bin/python2

import os

def scan_dir(path):
    print map(os.path.abspath, os.listdir(pwd))

Для Python 3

Для фільтра та карти потрібно обернути їх списком ()

#!/bin/python3

import os

def scan_dir(path):
    print(list(map(os.path.abspath, os.listdir(pwd))))

Рекомендація полягає в тому, що ви замінюєте використання карти та фільтра на вирази генераторів чи списки розумінь:

#!/bin/python

import os

def scan_dir(path):
    print([os.path.abspath(f) for f in os.listdir(path)])

1

Ось однорядна пітонічна версія:

import os
dir = 'given_directory_name'
filenames = [os.path.join(os.path.dirname(os.path.abspath(__file__)),dir,i) for i in os.listdir(dir)]

Цей код перераховує повний шлях усіх файлів і каталогів у вказаному імені каталогу.


Дякую Сале, але ваш код не працював повністю, і той, що працював, був змінений так: 'dir =' заданий_діректорія_імена 'імена файлів = [os.path.abspath (os.path.join (dir, i)) для i в os.listdir (dir)] '
HassanSh__3571619

1

Я знаю, це старе питання. Це акуратний спосіб, на який я натрапив, якщо ви знаходитесь на машині лінькс.

import subprocess
print(subprocess.check_output(["ls", "/"]).decode("utf8"))

0
#import modules
import os

_CURRENT_DIR = '.'


def rec_tree_traverse(curr_dir, indent):
    "recurcive function to traverse the directory"
    #print "[traverse_tree]"

    try :
        dfList = [os.path.join(curr_dir, f_or_d) for f_or_d in os.listdir(curr_dir)]
    except:
        print "wrong path name/directory name"
        return

    for file_or_dir in dfList:

        if os.path.isdir(file_or_dir):
            #print "dir  : ",
            print indent, file_or_dir,"\\"
            rec_tree_traverse(file_or_dir, indent*2)

        if os.path.isfile(file_or_dir):
            #print "file : ",
            print indent, file_or_dir

    #end if for loop
#end of traverse_tree()

def main():

    base_dir = _CURRENT_DIR

    rec_tree_traverse(base_dir," ")

    raw_input("enter any key to exit....")
#end of main()


if __name__ == '__main__':
    main()

5
На це питання вже є ідеально хороша відповідь, більше відповіді не потрібно
Майк Пеннінгтон

0

FYI Додайте фільтр розширення або імпортування файлу ext os

path = '.'
for dirname, dirnames, filenames in os.walk(path):
    # print path to all filenames with extension py.
    for filename in filenames:
        fname_path = os.path.join(dirname, filename)
        fext = os.path.splitext(fname_path)[1]
        if fext == '.py':
            print fname_path
        else:
            continue

0

Якщо я подумав, я б закинув це. Простий і брудний спосіб зробити підстановку.

import re
import os

[a for a in os.listdir(".") if re.search("^.*\.py$",a)]

0

Нижче наведено список каталогів та файлів у режимі dir

def print_directory_contents(sPath):
        import os                                       
        for sChild in os.listdir(sPath):                
            sChildPath = os.path.join(sPath,sChild)
            if os.path.isdir(sChildPath):
                print_directory_contents(sChildPath)
            else:
                print(sChildPath)

0

Той, хто працював зі мною, - це свого роду модифікована версія з відповіді Салея вище.

Код такий:

"dir = 'date_directory_name' filenames = [os.path.abspath (os.path.join (dir, i)) для i в os.listdir (dir)]"

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.