Як насправді працює фріад?

Question 1

Декларація freadнаступна:

size_t fread(void *ptr, size_t size, size_t nmemb, FILE *stream);

Питання полягає в тому: чи є різниця у продуктивності читання двох таких викликів fread:

char a[1000];

fread(a, 1, 1000, stdin);
fread(a, 1000, 1, stdin);

Чи буде він читати 1000байти відразу щоразу?

Question 2

Різниця в продуктивності може бути, а може і не бути. Існує різниця в семантиці.

fread(a, 1, 1000, stdin);

намагається прочитати 1000 елементів даних, кожен з яких займає 1 байт.

fread(a, 1000, 1, stdin);

намагається прочитати 1 елемент даних довжиною 1000 байт.

Вони різні, оскільки fread()повертає кількість елементів даних, які вона змогла прочитати, а не кількість байтів. Якщо він досягає кінця файлу (або умови помилки) перед зчитуванням повних 1000 байт, перша версія повинна вказати, скільки саме байтів вона прочитала; другий просто не вдається і повертає 0.

На практиці, ймовірно, це просто виклик функції нижчого рівня, яка намагається прочитати 1000 байт і вказує, скільки байт вона насправді прочитала. Для більших читань він може здійснювати кілька дзвінків нижчого рівня. Обчислення значення, яке потрібно повернути, fread()відрізняється, але витрати на обчислення є тривіальними.

Може бути різниця, якщо реалізація зможе сказати перед спробою зчитування даних, що даних недостатньо для зчитування. Наприклад, якщо ви читаєте з 900-байтового файлу, перша версія прочитає всі 900 байт і поверне 900, тоді як друга може не заважати нічого читати. В обох випадках показник положення файлу збільшується на кількість успішно прочитаних символів , тобто 900.

Але загалом, напевно, слід вибрати, як називати це, виходячи з того, яка інформація вам потрібна від нього. Прочитайте один елемент даних, якщо часткове зчитування не краще, ніж взагалі нічого не читати. Читайте меншими шматками, якщо часткові читання корисні.

Question 3

Відповідно до специфікації , ці два варіанти можуть по-різному трактуватися реалізацією.

Якщо у вашому файлі менше 1000 байтів, fread(a, 1, 1000, stdin)(прочитайте 1000 елементів по 1 байту кожен) буде копіювати всі байти до EOF. З іншого боку, результат fread(a, 1000, 1, stdin)(зчитування 1 1000-байтового елемента), що зберігається у, aне визначений, оскільки недостатньо даних для завершення зчитування «першого» (і єдиного) елемента в 1000 байтів.

Звичайно, деякі реалізації все ще можуть копіювати елемент "частково" на стільки байтів, скільки потрібно.

Question 4

Це було б деталлю реалізації. У glibc вони однакові за продуктивністю, оскільки це реалізовано в основному як (Посилання http://sourceware.org/git/?p=glibc.git;a=blob;f=libio/iofread.c ):

size_t fread (void* buf, size_t size, size_t count, FILE* f)
{
    size_t bytes_requested = size * count;
    size_t bytes_read = read(f->fd, buf, bytes_requested);
    return bytes_read / size;
}

Зверніть увагу, що C ~~та POSIX~~standard не гарантує, що повний об'єкт розміру sizeпотрібно читати щоразу. Якщо повний об'єкт неможливо прочитати (наприклад, stdinмає лише 999 байт, але ви просили size == 1000), файл залишатиметься у визначеному стані (C99 §7.19.8.1 / 2).

Редагувати: Дивіться інші відповіді про POSIX.

Question 5

freadдзвінки getcвнутрішньо. за Minixкількістю разів getcвикликається просто size*nmembтак, скільки разів getcбуде викликано, залежить від добутку цих двох. Тож обидва fread(a, 1, 1000, stdin)і fread(a, 1000, 1, stdin)буде запускати getc 1000=(1000*1)Times. Ось проста реалізація freadMinix

size_t fread(void *ptr, size_t size, size_t nmemb, register FILE *stream){
register char *cp = ptr;
register int c;
size_t ndone = 0;
register size_t s;

if (size)
    while ( ndone < nmemb ) {
    s = size;
    do {
        if ((c = getc(stream)) != EOF)
            *cp++ = c;
        else
            return ndone;
    } while (--s);
    ndone++;
}

return ndone;
}

Question 6

Можливо, різниці в продуктивності не буде, але ці дзвінки не однакові.

fread повертає кількість прочитаних елементів, тому ці виклики повернуть різні значення.
Якщо елемент неможливо прочитати повністю, його значення невизначене:

Якщо виникає помилка, результуюче значення показника положення файлу для потоку є невизначеним. Якщо зчитується частковий елемент, його значення невизначене. (ISO / IEC 9899: TC2 7.19.8.1)

Немає великої різниці у реалізації glibc , який просто помножує розмір елемента на кількість елементів, щоб визначити, скільки байтів читати, і ділить кількість прочитаних на розмір елемента в підсумку. Але версія із зазначенням розміру елемента 1 завжди повідомляє вам правильну кількість прочитаних байтів. Однак, якщо ви дбаєте лише про повністю прочитані елементи певного розміру, використання іншої форми позбавляє вас від ділення.

Question 7

Примітно ще одне речення у формі http://pubs.opengroup.org/onlinepubs/000095399/functions/fread.html

Функція fread () зчитує в масив, на який вказує ptr, до елементів нітемів, розмір яких визначається розміром у байтах, з потоку, на який вказує потік. Для кожного об'єкта потрібно зробити виклики розміру до функції fgetc (), а результати, збережені в порядку читання, у масиві беззнакового символу, який точно накладає об'єкт.

До коротких даних в обох випадках буде доступний fgetc () ...!

Question 8

Я хотів уточнити відповіді тут. fread виконує буферизоване введення-виведення. Фактичні розміри блоків зчитування використання fread визначаються використовуваною реалізацією C.

Усі сучасні бібліотеки C матимуть однакову продуктивність із двома викликами:

fread(a, 1, 1000, file);
fread(a, 1000, 1, file);

Навіть щось на зразок:

for (int i=0; i<1000; i++)
  a[i] = fgetc(file)

Це має призвести до тих самих шаблонів доступу до диска, хоча fgetc буде повільнішим через більшу кількість викликів у стандартні бібліотеки c, а в деяких випадках необхідність диску для додаткових пошуків, які в іншому випадку були б оптимізовані.

Повертаючись до різниці між двома формами хліба. Перший повертає фактичну кількість прочитаних байтів. Останній повертає 0, якщо розмір файлу менше 1000, інакше повертає 1. В обох випадках буфер заповнюється однаковими даними, тобто вмістом файлу до 1000 байт.

Загалом, ви, мабуть, хочете зберегти 2-й параметр (розмір) таким, щоб ви отримали кількість прочитаних байтів.