Закон Мандельброта

Benoit Mandelbrot (Б. Мандельброт) в 1954 г. [1] предложил теоретическое обоснование эмпирически открытого закона Ципфа. Представляя слова в виде последовательности букв, разделенных пустыми промежутками и присваивая знакам определенную "стоимость" (затраты усилий, времени), Мандельброт показывает, что словам можно приписать априорные вероятности, так чтобы их общая "стоимость" в среднем была минимальной и при этом количество информации оставалось инвариантным. На основе этих представлений математическим путем Мандельброт показал, что результирующее соотношение между частотой слова и его рангом соответствует эмпирическому закону Ципфа с небольшой поправкой:

где pri – относительная частота появления слова в тексте; ri – ранг слова; k – эмпирическая постоянная; γ – величина, близкая к единице, но изменяющаяся в зависимости от свойств текста.

Коэффициент γ характеризует определенные свойства языка – степень его формализованности, при этом с уменьшением γ степень формализованное™ языка уменьшается.

Закон Брэдфорда

Закон открыт в 1934 г. [2] английским химиком и библиографом С. Брэдфордом на основе обнаружения общих принципов распределения публикаций по изданиям в разных областях (на примере изданий по геофизике и химии), стал широко известен после публикации в 1948 г. [3] Основной смысл закономерности состоит в следующем: если научные журналы расположить в порядке убывания числа статей по конкретной проблеме, то журналы можно разбить на три зоны таким образом, чтобы количество статей в каждой зоне по заданной теме было одинаковым.

При этом в первую зону, названную Брэдфордом зоной ядра, входят профильные журналы, непосредственно посвященные рассматриваемой тематике. Количество журналов в зоне ядра невелико. Вторую зону образуют журналы, частично посвященные заданной области, причем их число существенно возрастает по сравнению с числом журналов в ядре. Третья зона – самая большая по количеству изданий – объединяет журналы, количество которых весьма далеко от рассматриваемой предметной области.

При равном числе публикаций в каждой зоне число источников (в данном примере – наименований журналов) резко возрастает при переходе от одной зоны к другой. Брэдфорд установил, что число наименований журналов в третьей зоне примерно во столько же раз больше, чем во второй зоне, во сколько раз число наименований журналов во второй зоне больше, чем в ядре:

где Р123 – число наименований журналов в 1-й, 2-й и 3-й зонах соответственно.

Закон Викери

Б. Викери1 уточнил модель С. Брэдфода. Он выяснил, что журналы, проранжированные в порядке уменьшения в них статей по конкретному вопросу, можно разбить не на три зоны, а на любое число зон. Основной смысл закономерности Викери (рис. 4.11): если периодические издания расположить в порядке уменьшения в них количества статей по конкретному запросу, то в полученном списке можно выделить ряд зон, каждая из которых содержит одинаковое количество статей.

При этом число журналов в первой зоне и нарастающее их число в последующих зонах соотносятся следующим образом:

где х – количество статей в каждой зоне; Тх – количество журналов, содержащих x статей; T2x, T3x,T4x, ... – количество журналов, содержащих 2х, 3x, 4х и так далее статей соответственно.

Часто этот закон называют законом Брэдфорда в толковании Викери.

1 Vickery В. С. Bradford's law of scatering //J. Doc. 1948. Vol. 4. P. 198 –

Рис. 4.11. Закон Викери