文献信息源的定量研究始于20世纪初。至20世纪70年代末,已形成了洛特卡定律(Lotka’s Law)、齐普夫定律(Zipf’s Law)、布拉德福定律(Bradford’s Law)、文献指数增长规律、文献老化规律、文献引用规律六大基本规律,并在后来的研究中得到不断完善与发展。
1)洛特卡定律
洛特卡定律,又称为“倒平方定律”,是由美国学者洛特卡(Alfred J. Lotka)于1926年率先提出的描述科学生率频率分布规律的文献计量学的经验定律。其文字表述为:在某一研究领域,撰写n篇论文的作者数量大约是撰写1篇论文作者数量的1/n2,所有撰写1篇论文的作者占作者总数的比例大约为60%。该定律可从多方面予以理解:在文献计量学方面,它是指在某一时期和某一主题领域内,文献作者的分布状况;从人类学的角度来理解,它可以理解为“……在人类发展过程中,具有不同个性的个体之间对人类进步所做出贡献的差异……”。科学社会学鼻祖默顿(R. K. Merton)认为这种差异的机制主要是马太效应。
2)齐普夫定律
齐普夫定律是美国语言学学者齐普夫(George K. Zipf)于20世纪40年代提出的词频分布定律。其主要内容为:有一篇文章包含N个词(N足够大),按这些词在文章**现的频率f以递减顺序排列,并从1到L编上序号r,则有:fr=c(c为常数)。人们称该式为齐普夫定律。目前,齐普夫定律早已走出语言学,进入了信息学、计算机科学、经济学、社会学、生物学、地理学、物理学等众多研究领域,它不仅可以用于处理与语言文字有关的问题,还可以将“最省力法则”的原理应用于图书**事业的管理中。例如,可以帮助人们合理地选择图书馆或**中心的最佳地理位置,使得各地用户都能从“最省力”的途径便捷地到达并利用这些单位的图书**资料,还可以用来设计图书馆、文献中心资料库的排架,以使得图书馆员在取存文献时所走的路径最短等。
3)布拉德福定律
布拉德福定律即文献离散定律,是由英国文献学家布拉德福(S. C. Bradford)于1934年在“Sources of Information on Specific Subjects”(载于1934年1月26日出版的Engineering: An Illustrated Weekly Journal)一文中率先提出的描述文献分散规律的经验定律。其文字表述为:“如果将有关某主题领域内的各种科学期刊按报导论文数量递减的顺序排列起来,则这些期刊可被分为报导该主题论文数量最大的核心区和含量与核心区相等的几个区。这时,核心区与各后继区所含的期刊数为1:n:n2:…的关系。”对于布氏当时统计过的数据来说,n约等于5。
4)文献指数增长规律
随着科学技术的不断发展,科学文献的增长也成为一种客观的社会现象。对于这一现象人们在20世纪初就已注意到,但一直到20世纪40年代后期,由于当时图书馆管理的需要,特别是科学史研究以及科技**工作发展的需要,文献增长规律才被研究者重视,取得了一系列研究成果,其中最具代表性的是美国科学学家、**学家普赖斯(D. J. Price)提出的科学文献的指数增长规律。1950年,普赖斯首次发表有关“指数增长”的研究论文;1961年,在《巴比伦以来的科学》(Science since Babylon)一书中考察统计了科学期刊的增长情况,发现科学期刊的数量大约每50年增长10倍。他以科技文献量为纵轴,以历史年代为横轴,不同年代的科技文献量的变化过程表现为一根光滑的曲线,这条曲线十分近似地表示了科技文献量指数增长的规律。这就是著名的普赖斯曲线,其表达式为:F(t)=aebt,其中F(t)表示时刻t的文献量,a是统计初始时刻(t=0)的起始文献量,e=2.718,b是常数,表示持续增长率(文献增长速度与文献总量的比值,也称为“产率”、普赖斯指数)。从一些实例看,科技文献的指数增长定律作为一个理想模型,在一定程度上反映了文献的实际增长情况,但由于没有考虑许多复杂因素对科技文献增长的限制,该定律在实际应用中还有许多局限性。
5)文献老化规律
科技文献发表之后,随着时间的推移,相对于科学技术的迅速发展,其内容会越来越“落伍”。文献的老化,就在于随其“年龄”增长,会逐渐失去作为科技**源的价值,利用率愈来愈低,甚至失去生命力。1958年美国学者贝尔纳(J. D. Bernal)首先提出用“半衰期”(Half life)来衡量文献老化速度。所谓“半衰期”,是指某学科领域现时尚在利用的全部文献中的一半是在多长一段时间内发表的。文献的“半衰期”因其学科性质、学科稳定性、文献类型不同而有不同的值。文献老化规律还可以用普赖斯指数来衡量。在理论上容易接受的描述文献老化规律的数学方程式为:C(t)=ke–at,C(t)表示发表了t年的文献的被引证次数,k是常数,随学科不同而异,a为老化率。目前,关于文献老化规律的研究仍很活跃。文献老化的应用研究有助于指导文献信息源选择、采集,评价馆藏老化程度,评价文献价值等。
6)文献引用规律
在科学研究的过程中,必然要借鉴前人或他人的相关研究成果。因此,科学文献间也存在一种必然联系。这种相互联系突出地表现为文献间的相互引用。文献引用关系分析是文献引用规律研究的基础,除了文献间的直接引用关系之外,引文分析理论还着重考察文献的其他最具代表性的间接引证关系,包括引文耦合(两篇或多篇文献同时引用一篇或多篇相同文章)、同被引(co-citation,两篇或多篇文献共同被后来的一篇或多篇文献所引用)、自引(著者引用自己以前的著述)等,从而研究科学引文的分布结构和规律性。引文量的分析是文献引用规律研究的主要内容,通过量的指标对引文所共同具有的一些基本要素或特征,如文献类型、学科主题、语种、出版年代、引文来源等进行分析和描述,可以得出引文量按文献类型分布、按语种的分布、按出版时间的分布、按出版学科或主题的分布、按作者的分布、按国别、期刊的分布等。引文分析所使用的最主要的工具是科睿唯安(Clarivate Analytics)的SCI(或SCIE)、SSCI等引文索引。它们的副产品——Journal Citation Reports(期刊引证报告,简称JCR)、Essential Science Indicators(基本科学指标,简称ESI)、InCites已成为期刊评价、分析和科研管理的一种最重要的工具。文献引用规律的研究有着广泛的应用价值,对于文献老化研究、期刊评价、科学评价、科技预测和人才评价等均有十分重要的意义。