|
答《 CNKI 系列数据库产品标准》有关问题
1、什么是全文数据库?原文数据库?它们的区别是什么?
原文数据库是一种全部或主要以保存图像格式原文文献,通过题录或文摘检索提供原文图像的数据库。其原文文献以图像格式编码,在计算机中只能作为图像来处理,不能直接进行文本处理。
全文数据库由全文资源库和全文数据库管理系统组成。其中,全文资源库由按一定结构和规则组织、存储的全文文献数据及其索引数据构成。索引数据包含全文索引、题录与文摘数据索引,支持全文检索等各种检索功能。全文数据库管理系统是对全文资源库进行检索与管理的软件,可对全文中任何词、字、句进行检索,并支持自然语言检索,所提供的检索入口与检索控制手段多于二次文献数据库。
2、什么是检索工具?评价工具?学习工具?
检索工具是对文献资源进行检索的工具。
评价工具一方面的作用是对文献质量、价值、影响力的评价,主要用于指导用户选择文献;另一方面是对文献编辑工作与科研绩效的评价。
学习工具、研究工具,是指在 CNKI 产品功能支持下的数字化学习和研究系统,包括完备的学习和研究资料,数字化的学习和研究的环境与方式等。
3、CNKI 系列数据库产品结构有何特点?什么是知识网络?知网节?为什么说它是资源增值整合出版的核心?
CNKI 系列数据库产品结构具有三大显著特点:
一是动态元数据,充分体现网络出版的用户交互特点以及这种特点对数据库结构、功能等各方面的影响。
二是统一元数据框架,支持系列数据库的统一跨库检索与导航。
三是知识网络, 在 CNKI 产品中特指一种文献资源的组织架构模式,它 在微观内容层次上将文献整合为知识体系。
知识网络根据知识的体系结构和文献的内容关联组织文献,主要表现形式为每一篇文献的“知网节”。所有文献通过“知网节”关联为知识网络。它具有支持知识获取、发现、管理的强大功能。
“ 知网节 ”是提供单篇文献的详细信息和扩展信息的浏览页面。它包含单篇文献的题录摘要,还是该文献各种扩展信息的入口汇集点。这些扩展信息通过概念相关、事实相关等方法揭示知识之间的关联关系,达到知识扩展的目的,有助于新知识的学习和发现,帮助实现知识获取、知识发现。目前支持的扩展信息包括:知识元、参考文献、引证文献、相似文献、读者推荐文献、作者与机构的链接以及分类导航等。
CNKI 产品资源增值整合出版的基本元素之一是文献,即支持以文献为中心的资源增值整合出版。知网节正是以文献为中心,利用各种整合手段,充分了展示各种增值整合功能,构成了资源增值整合出版的核心。
知识组织和知识管理是未来的发展方向。知识组织与信息组织相比,在信息的利用深度上有了很大的进步。 Ontology (本体论)是关于知识组织的新理论,知识地图将是另一种有效的知识管理工具。
4、什么是跨库检索?
跨库检索是指对指定的检索条件,同时对多个库中的文献进行检索。跨库检索需要使用统一的检索项;如果同时检索的数据库的文献收录范围有交叉,则需要提供文献排重功能。
5、CNKI Reader 与 PDF Reader 相比有何特点?
CNKI Reader (原称 CAJViewer ),是 CNKI 系列数据库的专用浏览器,不仅涵盖了 PDFReader 的功能,而且集成了用于个人资料管理的书架、阅读标注、知识元链接、 OCR 识别、在线搜索等众多功能。 CNKI Reader 正在向智能文档浏览器的方向发展,逐渐成为学习和研究的工具和平台。同时, CNKI 产品还支持 PDF 浏览器。
6、数字图书馆如何使用 CNKI 数据库进行二次开发?
CNKI 系列数据库为图书馆开展各种二次开发提供了资源和技术基础。可以通过系统整合功能链接馆藏图书、期刊等资源,激活馆藏资源的使用和流通;可以轻松高效地构建本校专家文献库,展示本校科研成果,也可以构建本科生毕业设计知识库、研究生课题研究知识库等,为学生提供教学参考;能更轻松地开展定题服务、参考咨询等信息服务工作,提高服务质量; CNKI 数字化全文可为图书馆进行深入二次开发建立专业特色数据库提供资源。
CNKI 系列数据库产品的海量数据还为数字图书馆相关技术的研究提供了良好的数据基础,支持人工智能与中文信息处理技术,以及其他相关技术的研究。
7、为什么标准中要有客户技术服务标准?
CNKI 系列数据库产品的连续出版属性及其质量对复杂技术与技术服务的依赖性,决定了产品的服务是产品不可分割的组成部分,而企业标准的合同约定强制执行性决定了产品技术服务与产品的内容属性和功能属性一样,需要规定明确的执行基准。
8、“ CNKI 系列数据库”的文献著作权问题是如何解决的?
1)合法规范解决已出版文献的数字出版著作权使用许可
期 刊、图书文献 :与期刊编辑出版单位签约取得期刊、图书等文献编辑版权的使用权;通过期刊编辑出版单位(或通过法定许可)取得文献作者的著作权使用许可,并按版税制支付稿酬。
报纸文献:由法定许可取得报纸文献的转载出版权,并公开直接向文献作者按版税制支付稿酬。
截至 2005 年底,清华同方支付著作权使用费约 9570 万元。
2) 规范获得自主编辑出版作品中文献的数字出版发行权
由博硕士培养单位、会议主办单位组织或由博硕士学位论文和会议论文作者本人向中国学术期刊(光盘版)电子杂志社投稿,将文献的数字出版与发行权授予电子杂志社,杂志社在接收录用稿件同时以约定稿费标准支付稿酬。
9、“ CNKI 系列数据库”文献资源总量
资源类型 |
资源种数 |
已版文献总量 |
年计划出版量 |
期刊 |
7486 种 |
1870.1 万篇 |
160 万篇 |
博硕士论文 |
388 个专业 |
26.1 万篇 |
8.6 万篇 |
会议论文 |
360 个行业 |
37.2 万篇 |
15 万篇 |
报纸 |
1000 种 |
470.3 万篇 |
100 万篇 |
图书 |
20 万种 |
20 万册 |
6 万篇 |
年鉴 |
1200 种 |
96.5 万册 |
60 万篇 |
知识元 |
126 个专题 |
370 万条 |
80 万条 |
各类数据库 |
1200 种 |
1364 万条 |
/ |
合计 |
文献总量 |
全文文献总量 |
二次文献总量 |
5694.6 万篇 |
1942.3 万篇 |
3752.3 万条 |
|
10、清华同方将如何保障标准的实施?
标准的组成部分之一 --- 《产品质量监督检验程序及方案》是根据国家标准制定的,它明确了用户进行产品质量监督检验的方法和规则。用户可以根据检验方案,对标准中各项质量指标进行检验。公司将专门组织用户进行产品检验并公布检验结果。同时,公司将制定并公布产品和服务质量保证制度和措施,纳入产品购买合同,由用户监督执行。
11、什么叫《中国学术文献网络出版总库》,期刊文献总库何时建成?
《中国学术文献网络出版总库》是国家新闻出版总署立项并组织实施的大规模整合学术文献、以互联网为载体出版的中国学术文献总汇。该库计划全面出版我国建国以来的各类学术文献和近百年来的有战略保存价值的学术文献资源。
经过十年的积累,由清华同方和中国学术期刊(光盘版)电子杂志社建设的《中国学术期刊全文数据库》已经收录我国各类学术期刊 7468 种,占我国学术类、技术类、政策指导类期刊的 99.9% ,且该库中这些期刊 1994 年以来的文献完整率已达到 99.9% ,并将把其中 2400 种重要期刊回朔至创刊。以此为基础,我国学术期刊文献的网络出版总库预计将于 2006 年 6 月全面建成。
12、CNKI 系列数据库与《中国知识资源总库》是什么关系?为什么说《总库》是支持各类出版机构运作网络出版的平台?
《中国知识资源总库》是由 CNKI 系列数据库和其它资源库在“中国知网”的 CNKI 网格资源共享平台管理下构成的资源汇总体系,可在分布异构跨库检索平台下视为一个数据库使用。此外,《总库》的管理系统配备知识网络操作系统,可以在《总库》中建立文献的知识网络结构,并使用与 CNKI 系列数据库功能相同的检索、导航、知网节、浏览器等功能。
“中国知网”的“数据库超市”为 《中国知识资源总库》配备了文献网络出版与发行的采编、制作、出版管理系统与全套电子商务系统,借助〈总库〉的规模市场和传播能力,各传统出版单位和数据库出版单位,均可以很快进入规模化网络出版市场运作。所以,《中国知识资源总库》是支持各出版单位从事网络出版的网络平台。
13、产品的文献资源质量有哪些指标? CNKI 系列全文数据库源数据库文献资源质量指标
中国期刊全文数据库 |
期刊种数完整率 |
不低于 99.9% |
核心期刊完整率 |
总体不低于 99.3% ,每个专辑不低于 99.0% |
文献收录完整率 |
总体不低于 99.5% ,每个专辑不低于 99.0% |
全文信息完整率 |
不低于 99.9% |
中国优秀博硕士学位论文全文数据库 |
学科范围覆盖 |
我国研究生教育所涉及的 90% 以上学科领域 |
文献来源完整率 |
大于 95% ,其中博士学位论文大于 90% |
文献收录完整率 |
博士大于 90% ,硕士大于 95% |
中国重要会议论文全文数据库 |
学科范围覆盖 |
我国二级以上学会、协会、高校的学术会议与在国内召开的国际会议涉及的学科与行业领域,大于 85% |
文献来源完整率 |
二级以上学会、协会、高校和在国内召开的国际会议主办单位大于 80% ,其中一级学会大于 90% |
文献收录完整率 |
大于 98% ,其中一级学会会议论文大于 95% |
中国重要报纸全文数据库 |
学位范围覆盖 |
大于 90% |
文献收录完整率 |
大于 99% |
|
编辑加工质量指标
著录 |
串域、漏标、多标等错误 |
小于 0.5 ‰ |
篇名、作者著录与原文不符 |
小于 0.5 ‰ |
其他著录项与原文不符 |
小于 1 ‰ |
目录链接错误率 |
不高于 0.5 ‰ |
目录文字错误率 |
小于 0.5 ‰ |
标引 |
主题词标引 |
准确度 |
不小于 85% |
一致性 |
不小于 90% |
关键词标引 |
准确度 |
不小于 80% |
一致性 |
不小于 850% |
分类错误率 |
小于 0.3% |
电子版全文版面错误率 |
小于 0.5 ‰ |
印刷版全文 |
文字与灰度图像扫描分辨率 |
不小于 300dpi |
彩色图像扫描分辨率 |
不小于 200dpi |
文字和灰度图像打印 |
支持 300dpi 保真打印 |
彩色图像打印 |
支持 200dpi 保真打印 |
页面错误率 |
小于 0.5 ‰ |
|
14、产品的出版发行周期是怎样规定的?
产品出版发行周期按三种出版方式分别规定为:互联网出版,每工作日出版;网络镜像出版和光盘出版,每月 10 日出版。
互联网出版方式下的文献出版期限为:期刊 平均不迟于纸质期刊出版 2 个月;博硕士学位论文平均不迟于论文答辩日期 4 个月;会议论文平均不迟于会议结束后 2 个月;报纸文献平均 不迟于印刷版报纸出版 5 天。
15、标准支持哪些国际和国内标准?
标准支持 Z39.50 , OAI-PMH , OpenURL , DC , ISO 2709 等国际标准。
同时,标准还广泛参考了国内关于数字图书馆建设方面的标准研究成果,例如 CSDL 的数字图书馆标准与规范、 CALIS 的 中国高等教育数字图书馆技术标准与规范等。
16、什么叫战略保存?它有什么意义?
所谓战略保存,就是要构建一个信息资源的保存体系,确保各种数字信息资源都能得到保存,并且满足现在和未来的资源提取和利用的需要,并且起到传承民族与人类文化的作用。也称为资源长期保存。
目前,文献信息服务正全面进入数字化网络化环境,数字资源大量采购,科研和教育领域用户也日益依赖数字化资源和网络化服务。因此必须充分保障这些数字信息资源能够长期、方便和经济地被广泛利用,保障获取和处理所需的法律授权、技术知识和经济安排,拥有可靠的永久使用权,保障即使在特殊情况下我国科研和教育用户仍然能够方便、可靠、稳定地获得和使用这些战略性信息资源。
17、为什么要广泛征求最终用户的意见?
产品的最终用户对产品的各个方面有着切身的感受。 CNKI 产品标准对产品的各个方面都作了规定,直接关系最终用户对产品的使用。因此必须广泛征求最终用户的意见,以保证根据产品标准制作出的产品能切实反映最终用户的需求。
18、最终用户可以通过什么方式对标准提意见?
最终用户可以从清华同方知网(北京)技术有限公司的中心网站( www.cnki.net )下载 CNKI 标准的全文。中心网站的 BBS 上设有标准讨论版,专用电子信箱 :standard@cnki.net 。
我们热诚欢迎广大用户通过各种渠道提出宝贵意见。
全文摘自《中国新闻出版报》 |