CiteSeerX是一个文献检索引擎,是CiteSeer的换代产品。1997年,CiteSeer引文搜索引擎由美国普林斯顿大学NEC研究院研制开发。CiteSeer引文搜索引擎是利用自动引文标引系统(ACI)建立的第一个学术论文数字图书馆。研发人员不断对CiteSeer运行中暴露的问题和用户的反馈建议进行分析,并由美国国家科学基金会和MicrosoftResearch资助,为该搜索引擎重新设计了系统结构和数据模型(即CiteSeerX),于2007年投入运行。CiteSeerX采用机器自动识别技术搜集网上以Postscrip和PDF文件格式存在的学术论文,然后依照引文索引方法标引和链接每一篇文章。
CiteSeerX的宗旨在于有效地组织网上文献,多角度促进学术文献的传播与反馈。至今,CiteSeerX存储的文献全文达138万多篇,引文2674万多条,内容主要涉及计算机和信息科学领域,主题包括智能代理、人工智能、硬件、软件工程、数据压缩、人机交互、操作系统、数据库、信息检索、网络技术、机器学习等。CiteSeerX也公开在网上提供完全免费的服务,实现全天24h实时更新。CiteSeerX的常用功能包括:检索相关学术文献,浏览并下载PS或PDF格式的论文全文;查看某一具体文献的“引用”与“被引”信息,同时还能获得文献、作者与出版单位新的引用排行;查看某一文献的相关文献,并应用特殊算法计算文献相关度;图表显示某一主题文献,或某一作者、机构所发表文献的时间分布。可依此推测学科热点和发展趋势,避免重复劳动。
CiteSeerX的检索界面简洁清晰,默认为文献检索界面。如果要搜索某一特定作者的学术论文,选择“Authours”标签进入作者检索界面。若选择可选项,则搜索范围不但包括CiteSeerX的学术文献全文数据库,还包括数据库中每篇论文的参考文献。CiteSeerX的检索首页只有一个检索框,默认为对篇名、作者、摘要、文本内容进行检索。CiteSeerX还支持高级检索,点击进入高级检索界面,可以看到CiteSeerX支持以下检索字段的“并”运算:篇名、作者、作者单位、期刊或会议录名称、出版年、文摘、关键词、文本内容以及用户为论文定义的标签。当然也可以在首页的单一检索框自行构造组合检索。CiteSeerX支持邻近词运算匹配,邻近距离默认为一个单词。多个关键词之间有空格的作为词组或邻近词运算匹配。 CiteSeerX不支持词组的精确匹配,这样处理对查出同一作者姓名的不同拼写有利。若输入检索后,CiteSeerX搜索结果为零,无论何种原因,系统会自动给出检索建议和几种新检索式的链接供检索者选择。