У мене є набір даних 100 000 рядків. Він встановлюється таким чином, що стовпець A містить назву групи, а потім повторює назву групи для кількості унікальних членів цієї групи. Я намагаюся підрахувати, скільки разів значення з’являється двічі і лише два рази.
- Значення ніколи не з’явиться лише один раз - завжди буде "ім'я групи", за яким відразу слідує, скільки членів у цій групі, в окремих рядках. Тож для будь-якої окремої сутності завжди є щонайменше 2 ряди.
- Частіше, ніж значення, значення з’явиться 3 і більше разів.
- Якщо значення з’являється 3 або більше разів, я не хочу включати жоден із цих рядків до числа. Я справді шукаю, скільки разів з’являється виразна пара.