У мене є текстовий файл, що містить твіти, і мені потрібно порахувати кількість разів, яке слово згадується в твітті. Наприклад, файл містить:
Apple iPhone X is going to worth a fortune
The iPhone X is Apple's latest flagship iPhone. How will it pit against it's competitors?
Скажімо, я хочу порахувати, скільки разів у файлі згадується слово iPhone. Отже ось що я спробував.
cut -f 1 Tweet_Data | grep -i "iPhone" | wc -l
це, безумовно, працює, але я плутаю команду 'wc' в unix. Яка різниця, якщо я спробую щось на кшталт:
cut -f 1 Tweet_Data | grep -c "iPhone"
де натомість використовується -c? Обидва ці результати дають різні результати у великому файлі, повному твітів, і я розгублений у тому, як це працює. Який метод є правильним способом підрахунку події?
cut -f1
вирізання базується на вкладках, що тут не дуже багато. Ви впевнені, щоwc -l
це справді дає вам правильний підрахунок? Тут було б показано 2, але я рахую 3 екземпляри "iPhone".