«различительная» или дискриминантная сила.
Ведь если слово равномерно распределено по тексту
(очень часто или даже редко) , то вряд ли оно может использоваться
для эффективного содержательного поиска.
Данная мысль была «материализована» Солтоном в его знаменитой
векторно-пространственной модели поиска, где именно для учета
дискриминантной силы слов он ввел понятие инверсной частоты
появления слова в отдельных документах массива (IDF).
В работе испанских исследователей [*] для этой же цели была
предложена технология спектограмм слов, которые внешне напоминали
штрих-коды товаров.
Вместе с тем не позволяли рассматривать вхождения слов в разных
масштабах измерений, как это делается например в средствах
вейвлет-анализа .
[*] P. Carpena, P. Bernaola-Galván, M. Hackenberg, A. V. Coronado, J. L. Oliver.
Level statistics of words: Finding keywords in literary texts and symbolic sequences //
PHYSICAL REVIEW E 79, 035102, 2009. –P. 035102-1-035102-4