Константи Enum поводяться по-різному в C та C ++

Question 1

Чому це:

#include <stdio.h>
#include <limits.h>
#include <inttypes.h>

int main() {
    enum en_e {
        en_e_foo,
        en_e_bar = UINT64_MAX,
    };
    enum en_e e = en_e_foo;
    printf("%zu\n", sizeof en_e_foo);
    printf("%zu\n", sizeof en_e_bar);
    printf("%zu\n", sizeof e);
}

друк 4 8 8на C та 8 8 8на C ++ (на платформі з 4 байтовими входами)?

У мене було враження, що UINT64_MAXприсвоєння змусить усі константи перерахування принаймні до 64 біт, але en_e_fooзалишається на рівні 32 у звичайному C.

Яке обґрунтування розбіжностей?

Question 2

У C enumконстанта має тип int. У C ++ це перелічений тип.

enum en_e{
    en_e_foo,
    en_e_bar=UINT64_MAX,
};

У C це порушення обмеження , що вимагає діагностики ( якщо UINT64_MAX перевищує INT_MAX, що дуже ймовірно). Компілятор змінного струму може взагалі відхилити програму, або він може надрукувати попередження, а потім створити виконуваний файл, поведінка якого невизначена. (Не на 100% зрозуміло, що програма, яка порушує обмеження, обов'язково має невизначену поведінку, але в цьому випадку стандарт не говорить про те, що таке поведінка, тому це все ще невизначена поведінка.)

gcc 6.2 не попереджає про це. clang робить. Це помилка в gcc; він неправильно блокує деякі діагностичні повідомлення, коли використовуються макроси зі стандартних заголовків. Дякую Гжегожу Шпетковському за пошук звіту про помилку: https://gcc.gnu.org/bugzilla/show_bug.cgi?id=71613

У C ++ кожен тип перелічення має базовий тип , який є деяким цілочисельним типом (не обов'язково int). Цей базовий тип повинен бути здатним представляти всі постійні значення. Отже, у цьому випадку обидва en_e_fooі en_e_barмають тип en_e, який повинен бути щонайменше 64 біта в ширину, навіть якщо intвін вужчий.

Question 3

Цей код просто не дійсний C, насамперед.

У розділі 6.7.2.2 і в C99, і в C11 сказано, що:

Обмеження:

Вираз, що визначає значення константи перерахування, повинен бути цілим виразом константи, значення якого можна представити як int.

Діагностика компілятора є обов’язковою, оскільки це порушення обмеження, див. 5.1.1.3:

Відповідна реалізація повинна видавати принаймні одне діагностичне повідомлення (ідентифіковане визначеним реалізацією), якщо блок переробки або блок перекладу містить порушення будь-якого правила синтаксису або обмеження, навіть якщо поведінка також явно зазначена як невизначена або реалізація визначений.

Question 4

У C , хоча а enumвважається окремим типом, перечислювачі самі завжди мають тип int.

C11 - 6.7.2.2 Специфікатори перерахування

3 Ідентифікатори у списку перелічувача оголошуються як константи типу int ...

Таким чином, поведінка, яку ви бачите, є розширенням компілятора.

Я б сказав, що має сенс розширювати розмір одного з перелічувачів, лише якщо його значення занадто велике.

З іншого боку, в С ++ всі перечислювачі мають тип enumоголошеного.

Через це розмір кожного перелічувача повинен бути однаковим. Отже, розмір цілого enumрозширений, щоб зберігати найбільший перерахувач.

Question 5

Як зазначали інші, код неправильно сформований (на С) через порушення обмежень.

Існує помилка GCC # 71613 (повідомляється в червні 2016 р.), В якій зазначено, що деякі корисні попередження замовчуються за допомогою макросів.

Корисні попередження, здається, замовчуються, коли використовуються макроси із системних заголовків. Наприклад, у наведеному нижче прикладі попередження було б корисним для обох перерахувань, але показано лише одне попередження. Можливо, те саме може статися з іншими попередженнями.

Поточним обхідним шляхом може бути додавання макросу до одинарного +оператора:

enum en_e {
   en_e_foo,
   en_e_bar = +UINT64_MAX,
};

що видає помилку компіляції на моїй машині з GCC 4.9.2:

$ gcc -std=c11 -pedantic-errors -Wall main.c 
main.c: In function ‘main’:
main.c:9:20: error: ISO C restricts enumerator values to range of ‘int’ [-Wpedantic]
         en_e_bar = +UINT64_MAX

Question 6

C11 - 6.7.2.2/2

Вираз, що визначає значення константи перерахування, повинен бути цілим виразом константи, значення якого можна представити як int.

en_e_bar=UINT64_MAXє порушенням обмеження, і це робить наведений код недійсним. Діагностичне повідомлення повинно надходити шляхом підтвердження впровадження, як зазначено в проекті С11:

Відповідна реалізація повинна видавати принаймні одне діагностичне повідомлення (ідентифіковане визначеним реалізацією), якщо модуль переробки або блок перекладу попередньої обробки містить порушення будь-якого правила синтаксису або обмеження, [...]

Здається, у GCC є якась помилка, і вона не змогла надати діагностичне повідомлення. (Bug вказується в відповіді по Гжегож Szpetkowski

Question 7

Я подивився стандарти, і моя програма виявляється порушенням обмежень в C через 6.7.2.2p2 :

Обмеження: Вираз, що визначає значення константи перерахування, повинен бути цілим виразом константи, що має значення, яке можна представити як int.

і визначено в C ++ через 7.2.5:

Якщо базовий тип не є фіксованим, типом кожного перечислювача є тип його ініціалізуючого значення: - Якщо для перечислювача вказано ініціалізатор, значення ініціалізуючого має той самий тип, що і вираз, а вираз константи повинен бути інтегралом постійний вираз (5.19). - Якщо для першого перечислювача не вказано ініціалізатор, значення ініціалізації має невизначений інтегральний тип. - В іншому випадку тип ініціалізуючого значення збігається з типом ініціалізуючого значення попереднього перечислювача, якщо збільшене значення не є репрезентативним у цьому типі, і в цьому випадку тип є невизначеним цілим типом, достатнім для того, щоб містити збільшене значення. Якщо такого типу не існує, програма неправильно сформована.