Як зазначив Штеффен, прикладна матриця кодує кількість разів, коли слово з'являється в тексті. Положення кодування в матриці задається словом (положення стовпця на матриці) та текстом (положення рядка на матриці).
Тепер, хеш-трюк працює так само, хоча вам не потрібно спочатку визначати словник, що містить позицію стовпця для кожного слова.
Насправді саме хеш-функція надасть вам діапазон можливих положень стовпців (хеш-функція дасть вам мінімальне та максимальне можливе значення) та точне положення слова, яке ви хочете закодувати в матрицю. Так, наприклад, давайте уявимо, що слово "лайки" хеширується нашою функцією хешування на номер 5674, тоді стовпець 5674 буде містити кодування відносно слова "лайки".
Таким чином вам не потрібно буде складати словник перед аналізом тексту. Якщо ви використовуєте розріджену матрицю як свою текстову матрицю, вам навіть не доведеться точно визначати розмір матриці. Лише скануючи текст, на ходу ви перетворите слова в позиції стовпців за допомогою функції хешування, і ваша текстова матриця буде заповнена даними (частотами, тобто) відповідно до того, який документ ви прогресивно аналізуєте (положення рядка).