Як отримати список каталогів, відсортований за датою створення в python?


129

Який найкращий спосіб отримати список усіх файлів у каталозі, відсортований за датою [створено | модифіковано], використовуючи python, на машині Windows?

Відповіді:


79

Оновлення : сортувати dirpathзаписи за датою модифікації в Python 3:

import os
from pathlib import Path

paths = sorted(Path(dirpath).iterdir(), key=os.path.getmtime)

( надішліть відповідь @ Pygirl тут для більшої наочності)

Якщо у вас уже є список імен files, то сортуйте його на місці за часом створення в Windows:

files.sort(key=os.path.getctime)

Список файлів, які ви могли отримати, наприклад, використовуючи, globяк показано у відповіді @ Jay .


стара відповідь Ось більш детальна версія @Greg Hewgillвідповіді . Це найбільш відповідає вимогам запитання. Він робить різницю між датами створення та модифікації (принаймні в Windows).

#!/usr/bin/env python
from stat import S_ISREG, ST_CTIME, ST_MODE
import os, sys, time

# path to the directory (relative or absolute)
dirpath = sys.argv[1] if len(sys.argv) == 2 else r'.'

# get all entries in the directory w/ stats
entries = (os.path.join(dirpath, fn) for fn in os.listdir(dirpath))
entries = ((os.stat(path), path) for path in entries)

# leave only regular files, insert creation date
entries = ((stat[ST_CTIME], path)
           for stat, path in entries if S_ISREG(stat[ST_MODE]))
#NOTE: on Windows `ST_CTIME` is a creation date 
#  but on Unix it could be something else
#NOTE: use `ST_MTIME` to sort by a modification date

for cdate, path in sorted(entries):
    print time.ctime(cdate), os.path.basename(path)

Приклад:

$ python stat_creation_date.py
Thu Feb 11 13:31:07 2009 stat_creation_date.py

1
Це спрацювало чудово. Я намагаюся порівняти два каталоги cdate один з одним. Чи існує спосіб порівняння секунд між двома кодами?
Федерер

@malcmcmul: cdateце число з плаваючою секундою з епохи.
jfs

4
Це працює , але найбільш лаконічне рішення в stackoverflow.com/a/4500607/68534
jmoz

@jmoz: Ви маєте в виду , як це . Пов’язане вами рішення невірне: воно не фільтрує звичайні файли. Примітка: моє рішення дзвонить statодин раз на dir.entry.
jfs

Пробачте, посилання, яке надає Сабастьян, ще більш лаконічне! Дякую.
jmoz

148

Я це робив раніше для сценарію Python для визначення останніх оновлених файлів у каталозі:

import glob
import os

search_dir = "/mydir/"
# remove anything from the list that is not a file (directories, symlinks)
# thanks to J.F. Sebastion for pointing out that the requirement was a list 
# of files (presumably not including directories)  
files = list(filter(os.path.isfile, glob.glob(search_dir + "*")))
files.sort(key=lambda x: os.path.getmtime(x))

Це має робити те, що ви шукаєте, виходячи з файлу mtime.

EDIT : Зауважте, що за бажанням ви також можете використовувати os.listdir () замість glob.glob () - причиною того, що я використовував glob у своєму початковому коді, було те, що я хотів використовувати глобус лише для пошуку файлів із певним набором розширень файлів, до яких glob () краще підходив. Щоб використовувати listdir, ось як це виглядатиме:

import os

search_dir = "/mydir/"
os.chdir(search_dir)
files = filter(os.path.isfile, os.listdir(search_dir))
files = [os.path.join(search_dir, f) for f in files] # add path to each file
files.sort(key=lambda x: os.path.getmtime(x))

glob () приємно, але майте на увазі, що він пропускає файли, починаючи з періоду. * nix системи трактують такі файли як приховані (тим самим їх не вводячи у списки), але в Windows вони є звичайними файлами.
efotinis

Ці рішення не виключають грядок із списку.
Константин

У вашому рішенні os.listdir відсутній os.path.join: files.sort (lambda x, y: cmp (os.path.getmtime (os.path.join (search_dir, x)), os.path.getmtime (os .path.join (search_dir, y))))
Пітер Хофманн

files.sort(key=lambda fn: os.path.getmtime(os.path.join(search_dir, fn)))
jfs

22
Простий files.sort(key=os.path.getmtime)повинен працювати (без lambda).
jfs

31

Існує os.path.getmtimeфункція, яка дає кількість секунд з епохи і повинна бути швидшою, ніж os.stat.

import os 

os.chdir(directory)
sorted(filter(os.path.isfile, os.listdir('.')), key=os.path.getmtime)

23

Ось моя версія:

def getfiles(dirpath):
    a = [s for s in os.listdir(dirpath)
         if os.path.isfile(os.path.join(dirpath, s))]
    a.sort(key=lambda s: os.path.getmtime(os.path.join(dirpath, s)))
    return a

Спочатку ми будуємо список імен файлів. isfile () використовується для пропуску каталогів; його можна опустити, якщо додати каталоги. Потім ми сортуємо список на місці, використовуючи дату зміни як ключ.


Він сортував його за найдавнішим першим до найновішим. Коли я захотів 5 найновіших файлів, я повинен був зробити наступнеa[-5:]
Даніель Батлер

20

Ось один вкладиш:

import os
import time
from pprint import pprint

pprint([(x[0], time.ctime(x[1].st_ctime)) for x in sorted([(fn, os.stat(fn)) for fn in os.listdir(".")], key = lambda x: x[1].st_ctime)])

Це викликає os.listdir () для отримання списку імен файлів, а потім викликає os.stat () для кожного з них, щоб отримати час створення, а потім порівнює за часом створення.

Зауважте, що цей метод викликає os.stat () лише один раз для кожного файлу, що буде більш ефективним, ніж викликати його для кожного порівняння в сортуванні.


це навряд чи пітонічне, хоча це і вирішує завдання (відмова від відповідальності: не перевіряв код).
Адріано Варолі П'яцца

Це рішення не виключає грядок із списку.
Константин

@Constantin: це правда, але швидкий [... якщо stat.S_ISREG (x)] впорається з цим.
Грег Хьюгілл

16

Без зміни каталогу:

import os    

path = '/path/to/files/'
name_list = os.listdir(path)
full_list = [os.path.join(path,i) for i in name_list]
time_sorted_list = sorted(full_list, key=os.path.getmtime)

print time_sorted_list

# if you want just the filenames sorted, simply remove the dir from each
sorted_filename_list = [ os.path.basename(i) for i in time_sorted_list]
print sorted_filename_list

12

У python 3.5+

from pathlib import Path
sorted(Path('.').iterdir(), key=lambda f: f.stat().st_mtime)

3
для дати створення, використовуйте f.stat().st_ctimeзамість цього.
alanjds

11

Ось моя відповідь, використовуючи глобус без фільтра, якщо ви хочете читати файли з певним розширенням у порядку дат (Python 3).

dataset_path='/mydir/'   
files = glob.glob(dataset_path+"/morepath/*.extension")   
files.sort(key=os.path.getmtime)

5
# *** the shortest and best way ***
# getmtime --> sort by modified time
# getctime --> sort by created time

import glob,os

lst_files = glob.glob("*.txt")
lst_files.sort(key=os.path.getmtime)
print("\n".join(lst_files))

вкажіть, будь ласка, контекст
Клер,

"кращий" є суб'єктивним. Ваша відповідь буде краще, якби ви пояснили, чому ви вважаєте, що це найкращий спосіб.
Брайан Оуклі

Якщо ви хочете "найкращого", ви, звичайно, не використовуєте глобус, оскільки це дійсно повільно.
користувач136036

4
sorted(filter(os.path.isfile, os.listdir('.')), 
    key=lambda p: os.stat(p).st_mtime)

Ви можете використовувати os.walk('.').next()[-1]замість фільтрування за допомогою os.path.isfile, але це залишить мертві символьні посилання у списку і os.statне вдасться до них.


4
from pathlib import Path
import os

sorted(Path('./').iterdir(), key=lambda t: t.stat().st_mtime)

або

sorted(Path('./').iterdir(), key=os.path.getmtime)

або

sorted(os.scandir('./'), key=lambda t: t.stat().st_mtime)

де m час - модифікований час.


1

це основний крок для навчання:

import os, stat, sys
import time

dirpath = sys.argv[1] if len(sys.argv) == 2 else r'.'

listdir = os.listdir(dirpath)

for i in listdir:
    os.chdir(dirpath)
    data_001 = os.path.realpath(i)
    listdir_stat1 = os.stat(data_001)
    listdir_stat2 = ((os.stat(data_001), data_001))
    print time.ctime(listdir_stat1.st_ctime), data_001

1

Відповідь Алекса Ковентрі створить виняток, якщо файл є символьним посиланням на неіснуючий файл, наступний код виправляє цю відповідь:

import time
import datetime
sorted(filter(os.path.isfile, os.listdir('.')), 
    key=lambda p: os.path.exists(p) and os.stat(p).st_mtime or time.mktime(datetime.now().timetuple())

Коли файл не існує, використовується тепер (), і посилання перейде в самому кінці списку.


0

Ось проста пара рядків, яка шукає розтягнення, а також пропонує варіант сортування

def get_sorted_files(src_dir, regex_ext='*', sort_reverse=False): 
    files_to_evaluate = [os.path.join(src_dir, f) for f in os.listdir(src_dir) if re.search(r'.*\.({})$'.format(regex_ext), f)]
    files_to_evaluate.sort(key=os.path.getmtime, reverse=sort_reverse)
    return files_to_evaluate

0

Для повноти os.scandir(2 рази швидше pathlib):

import os
sorted(os.scandir('/tmp/test'), key=lambda d: d.stat().st_mtime)

0

Це була моя версія:

import os

folder_path = r'D:\Movies\extra\new\dramas' # your path
os.chdir(folder_path) # make the path active
x = sorted(os.listdir(), key=os.path.getctime)  # sorted using creation time

folder = 0

for folder in range(len(x)):
    print(x[folder]) # print all the foldername inside the folder_path
    folder = +1

У моєму коді файли відсортовані як найдавніші до новіших. Щоб отримати найновіші імена файлів або папок, вам потрібно додати в список файлів reverse = True (у моєму випадку це було x). так, x = відсортовано (os.listdir (), ключ = os.path.getctime, зворотний = True)
haqrafiul

-6

Можливо, вам слід скористатися командами оболонки. У Unix / Linux знайдіть трубопроводи з сортуванням, ймовірно, зможете робити те, що вам потрібно.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.