全美近代报纸全文数据库及其检索

发布时间:2021-01-29浏览次数:1303


美国国会图书馆和相关机构将全美近代报纸数码化,放在互联网上供公众免费使用。这一庞大数据库的目标是将美国历史上的报纸全部数码化,由于其囊括全美50个州,数千种报纸,不但是研究美国历史,也是全球史研究中极具价值的重要数据库。兹对该库做简单介绍。

数据库主页网址:https://chroniclingamerica.loc.gov/。该数据库现有3,371种报纸,总计17,635,717页,时间范围为1777-1963年。数据库在持续更新中,根据主页信息,光在2020年该库就新增加了100多万页报纸。

在主页,官方就提供了简单检索和高级检索两种方式。同时使用者还可以根据需要按照州名、种族、语言来分类浏。该库基本上收录了全美各种族的报纸,但是稍显遗憾的,没有美国的中文报纸。

尽管如此,该数据库对于研究中美关系仍是至关重要,可以和其他种类的材料进行互证。比如下图中的示例为输入“Canton”(广州),其结果高达925295个,除去广告类的结果,也有海量的史料可供研究者使用。检索结果提供原文扫描,TXT文本,使用者也可以截屏或是下载PDF格式,相当便捷。需要提醒的是使用者在复制TXT文本时,一定要核对原文,特别是日文,德语等非英文语种,非常容易出错。

对于版权规定,使用者请遵照官方网站使用说明。特别是如果要将该数据库的材料公开出版,比如类似《近代美国报纸中的广州》等图书,务必获得版权所有者授权。


来源:微信公众号“民国老报纸”(https://mp.weixin.qq.com/s/sbCEisK_w8LNle_AO_a65A

  • 返回原图
    /