Це питання про узгодженість даних. Я використовую базу даних AMECO і мене цікавлять дані про зайнятість для Греції.
Моє сучасне розуміння полягає в тому, що серія про зайнятість (NETD) в принципі повинна дорівнювати сумі серії про самозайнятих осіб (NSTD) плюс серії про заробітну плату (NWTD).
Насправді, це те , що інформація про серію зайнятості говорить .
Тепер, якщо можна побудувати серію зайнятості разом із сумою серії заробітної плати та самозайнятих - або перевірити їх взаємозв’язок в іншому випадку - стане очевидним, що очікувана рівність перевіряється лише для частини вибірки (після 90-ті).
У чому причина цієї розбіжності?
оновлення: На наступному сюжеті синя серія зображує належну зайнятість (NETD), тоді як червона серія - це та, яку я створив, додавши NSTD (самозайняті) та NWTD (співробітники). Це пізніший, який не відповідає першому.
Це стає більш очевидним у наступному сюжеті. Він зображує річну процентну різницю між побудованими рядами зайнятості (червона лінія вище) та серією AMECO для зайнятості (синя), яку я розглядаю як базову лінію.
Випадковий огляд ділянок демонструє той факт, що майже в першій половині вибірки побудована серія не відповідає базовій лінії. Простий англійською мовою до 90-х років працевлаштування в Греції не вичерпано сумою самозайнятих та службовців.
Така невідповідність детально не описана в описі даних про зайнятість (див. Посилання у запитанні вище), і вона ставить запитання, яка серія дає правильну відповідь на питання "Який рівень зайнятості в Греції до дев'яностих років, включаючи? ".
Також мотивацією цього питання є не просто рівень зайнятості. Зверніть увагу, що якщо сконструйована серія вимкнена, це означає, що, наприклад, при спробі отримати відрегульовану частку заробітної плати для Греції виходить нижчий показник за період, відповідний спостережуваній невідповідності.