Виберіть 50 випадків зі списку навмання, щоб записати у файл


129

Поки я зрозумів, як імпортувати файл, створювати нові файли та рандомізувати список.

У мене виникають проблеми з випадковим вибором лише 50 елементів зі списку для запису у файл?

def randomizer(input,output1='random_1.txt',output2='random_2.txt',output3='random_3.txt',output4='random_total.txt'):

#Input file 
    query=open(input,'r').read().split()
    dir,file=os.path.split(input)

    temp1 = os.path.join(dir,output1)
    temp2 = os.path.join(dir,output2)
    temp3 = os.path.join(dir,output3)
    temp4 = os.path.join(dir,output4)


    out_file4=open(temp4,'w')

    random.shuffle(query)

    for item in query:
        out_file4.write(item+'\n')   

Тож якщо файл загальної рандомізації був

example:

random_total = ['9','2','3','1','5','6','8','7','0','4']

Я хотів би 3 файли (out_file1 | 2 | 3) з першим випадковим набором 3, другим випадковим набором 3 і третім випадковим набором 3 (для цього прикладу, але в тому, що я хочу створити, має бути 50)

random_1 = ['9','2','3']
random_2 = ['1','5','6']
random_3 = ['8','7','0']

Тож останній "4" не буде включений, що добре.

Як я можу вибрати 50 зі списку, який я рандомізував?

Ще краще, як я міг обрати навмання 50 із вихідного списку?


Що ви маєте на увазі?
O.rka

Відповіді:


269

Якщо список у випадковому порядку, ви можете просто взяти перші 50.

В іншому випадку використовуйте

import random
random.sample(the_list, 50)

random.sample довідковий текст:

sample(self, population, k) method of random.Random instance
    Chooses k unique random elements from a population sequence.

    Returns a new list containing elements from the population while
    leaving the original population unchanged.  The resulting list is
    in selection order so that all sub-slices will also be valid random
    samples.  This allows raffle winners (the sample) to be partitioned
    into grand prize and second place winners (the subslices).

    Members of the population need not be hashable or unique.  If the
    population contains repeats, then each occurrence is a possible
    selection in the sample.

    To choose a sample in a range of integers, use xrange as an argument.
    This is especially fast and space efficient for sampling from a
    large population:   sample(xrange(10000000), 60)

1
Чи можу я random.sampleповернути також вибрані ним індекси?
zyy

43

Один з простих способів вибору випадкових елементів - переміщення, а потім зріз.

import random
a = [1,2,3,4,5,6,7,8,9]
random.shuffle(a)
print a[:4] # prints 4 random variables

@MonicaHeddneck Чому випадкові перетасування та нарізки будуть краще? Хіба не відбір кількості вибірки шляхом рандомізації відбору має ті ж достоїнства, що і випадкове перемішування, а потім взяття фрагмента перетасованих зразків? Чи можете ви поясніть, будь ласка? Дякую.
сальву

7
Я використовував це, щоб легко створити тестовий / тренувальний набір для проекту машинного навчання. Використання random.choice(mylist,3)не створювало б два непересічні набори, як це робилося.
Моніка Хеднек

29

Я думаю random.choice(), що це кращий варіант.

import numpy as np

mylist = [13,23,14,52,6,23]

np.random.choice(mylist, 3, replace=False)

функція повертає масив із 3 випадково вибраних значень зі списку


7
Я думаю, що вам потрібно скористатися random.choice(mylist, 3, replace=False). Також менш заплутано у використанні import numpy as npіnp.random.choice(mylist, 3, replace=False)
Джон Ла Рой

10
Це має шанси повторити пункт списку
Полло

Ні, це не кращий варіант, це ~ 100 разів повільніше
nitesh kansal

-3

Скажімо, у вашому списку 100 елементів, і ви хочете вибрати 50 з них випадковим чином. Ось такі кроки:

  1. Імпортуйте бібліотеки
  2. Створіть насіння для генератора випадкових чисел, я поставив його на 2
  3. Підготуйте список номерів, з яких потрібно підібрати випадковим чином
  4. Зробіть випадковий вибір зі списку чисел

Код:

from random import seed
from random import choice

seed(2)
numbers = [i for i in range(100)]

print(numbers)

for _ in range(50):
    selection = choice(numbers)
    print(selection)
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.