У мене є електронна таблиця, яка містить наступні чотири стовпці, кожен з яких має ~ 18 000 рядків:
- Код субрегіону: географічна змінна, яку використовувало бюро статистики моєї країни для створення державних та федеральних регіонів.
- Регіон №1: стовпець з ~ 90 державних регіонів, які відповідають кожному з вищевказаних кодів субрегіону.
- Регіон №3: стовпець з ~ 60 федеральних регіонів, які відповідають кожному з субрегіонів.
- Населення: Орієнтовна чисельність кожного з підрегіонів.
Я надав спрощену версію цієї електронної таблиці на зображенні нижче:
Що я хотів би зробити, це створити список унікальних змінних регіону №1 в одному стовпчику, а другий сусідній стовпчик із унікальними змінними регіону №2, які перекривають цифри регіону №1 , а в третьому стовпці - загальна кількість населення в межах перекриті області №1 та Регіон №2 .
Тоді я можу вручну обчислити відсоток населення Регіону №1 у кожній області №2 .
Якщо можливо, я хотів би, щоб кінцевий продукт, схожий на (створене вручну) зображення нижче:
Я не впевнений, з чого почати, щоб виконати це завдання, тому дуже вдячний будь-яким порадам щодо того, яка функція найкраща для такої роботи.