数字图书馆项目报告写作要点

根据阅览过去的项目报告和项目提纲, 觉得有必要解释一下项目报告写作的确基本范式.总接起来,一般写项目报告(project proposal)有这么一些基本内容和逻辑顺序:

 

1.      目标:

一般goal表述本项目的宗旨,用一两句话概括,如我在NSF proposal中关于goal的叙述:

The goal of this proposed project is two-fold and outcome-based: it will create a Scientific Data Literacy (SDL) course for undergraduate students in science and technology to understand the fundamental concepts in scientific data and to use the data for scientific inquiry; as one of the outcomes, the SDL course will prepare students majoring in science and technology for a career in scientific data management.

 

目标之下需要简单解释这个宗旨是什么意思,通过什么手段来实现这些宗旨。例如,在goal之后,我通过列出四个具体的objectives来说明goal的意思:

Specifically, this project will:

  1. assess the needs for scientific data literacy education by surveying and interviewing science and technology faculty members,
  2. create motivating learning strategies, techniques and materials on scientific data and their lifecycle for undergraduate students in science and technology majors based on faculty input and in consultation with the Center for Digital Literacy,
  3. evaluate the effectiveness of learning materials and pedagogy through outcome-based evidence, and
  4. generalize the lessons learned for larger scale implementation of the curriculum/ training in scientific data literacy.”

在项目报告的一开始就阐明目标以及所使用的手段来取得所提出的目标不仅使报告清楚明了,而且可以体现逻辑性。

 

2.      现状:

对现状的综述不仅能够指出为什么该项目重要的依据(通过指出哪些已经有人做过,并且在做过的研究和实践中有哪些不足),而且也是从一个侧面来证明项目承担者的对相关领域的知识面和实施项目的能力。在现状综述的结尾部分应该指出所提出的项目对已经有的研究和实践有哪些独到的贡献以及意义。

 

3.      项目设计:

项目设计是报告的核心部分,必须清楚地交代要做什么和如何做。数字图书馆的项目申请报告一般有这么几个部分:

1)    用户需求:回答为什么要建该数字图书馆的问题,考虑这个项目是否与已有的图书馆资源有重复

2)    资源:类型,范畴, 来源,选取标准,是否需要数字化,等

3)    资源的组织和管理:元数据框架,主题种类,长期保存,版权管理,等

4)    系统设计与实施: 数据输入,软件系统,用户界面,等

 

4.      可行性:

这里可以包括institutional support (资金), 合作者,已有的技术和人员条件,等

 

5.      评估:

项目实施后要检验是否达到设计目标,包括用户评价(征集用户意见)与系统评价

 

6.      影响和意义

最后这项是整个项目报告的highlight point, 可以包括对社会和目标群体的影响和意义。

Posted in 图情教育 | 18 Comments

Social semantics and controlled semantics: an epistemological discussion

今年八月将在加拿大的Montreal召开第十届国际知识组织学会大会ISKO2008(每两年开一次,基本是在欧美轮流转),我的论文有幸选入,就是以本条博文标题为题。 在刚刚结束不久的杭州图林论剑会上,我在网上参加了第一个session, 第二个session 本来也要听的,但是因为技术问题没能听完,很遗憾。在互动室里有人问我什么是Social semantics and controlled semantics,我说了以后有空再解释,这篇小文就是还那位侠客的债(一笑)。
 
Social semantics是我在前两年写一篇元数据研究综述文章时用到的一个词,泛指所有由用户给网络客体(web objects)加的标签的总称,特别是标签的语义内容。当时在阅读资料时,看到一篇论文非常有启发,这篇文章是讨论Agent Communication Language(ACL)的,其中该文作者提到在ACL的环境下,social semantics指的是“social commitments that are the beliefs and intentions during agent communication.” 他还提出social semantics approach in ACL involves a social context “in which the given agents participate and within which they communicate” and “allows metacommitments to capture a variety of social and legal relations” (Singh, 2000, p. 34). 根据他的这个定义,他提出对这个定义的三个限定条件,我认为是对社会语义的特点最好概括:
  1. Agents (individual participants) communicate with their beliefs and intentions Such beliefs and intentions are public, i.e., observable, in terms of social commitments

  2. Each communication implies three aspects of meaning: objective, that the communication is true; subjective, that the communication is sincere; and practical,

  3. that the speaker is justified in making the communication (Singh, 2000).

这三条的精神就是参与者通过标签网络客体(Web objects) 来交流他们对事物的认知,属于经验知识范畴。这样的交流是真实的因而是客观的,同时又是主观的因为交流是诚恳的,而且是实际的。

在选入ISKO2008大会的论文中,我就目前国际图情界对folksonomies, 或者social semantics(社会语义)的讨论作了一个review,同时提出社会语义和受控语义在知识学上的特点,并且二者之间的知识学关系。
 
社会语义的最大特点是大众在描述信息客体内容方面的参与,这在过去是被图书馆员垄断的工作。这样的描述是基于大众自己的经验和对世界的认知,这是一种典型的经验知识。既是经验知识,当然就免不了一些经验知识的缺限,如真实性、系统性、组织性都存在一些问题。但是正如Shirky (2005)所说,社会语义是大众对事物的看法,虽然不一定在普遍意义上是“正确”的,但是是他们自己的真实看法想法,对他们自己的信息查找和利用有效。我们应该允许这样的语义存在,而不应该试图在他们的看法想法上强加我们(图书馆员)认为是正确的有组织的语义(受控语义)。Shirky把受控语义称之为“mind reading." 如果我们要试图去读用户的思想,十有八九会失败。这么说社会语义和受控语义是否就水火不相容了呢?
 
受控语义(controlled semantics) 泛指所有的人工编制的知识组织工具及用这些工具对信息客体人工标引的结果。受控语义代表一种至上而下的方法,这样的方法遵循我们对世界的认知的一些原则和思想。受控语义可以说是一种理性知识,具有正式表述概念及其知识和推纳关系的特点。
 
经验知识与理性知识之间存在着一种互相依赖的关系:经验知识是本能的,演示性的,从经验产生;而理性知识具有经验知识所没有的可靠性和肯定性。正是这种可靠性和肯定性,理性知识可以用来检验经验知识,而经验知识则可以为理性知识提供更新和验证的源泉。从知识学的角度来说,社会语义与受控语义不是水火不相容的关系,而是一种互相利用互相取长补短的关系。
 
在杭州论剑会上听了王军对兜乐系统的描述,是一个对社会语义进行组织管理的尝试,当时有听众在互动室提问说这不是又回到了受控词表的老路了吗,与2.0精神不太符合。因为目前对这个系统我也缺乏了解,不能武断评论,但是这个对社会语义的挖掘研究也对我们提出了一些新的问题,比如如何避免走受控语义的老路,如何利用社会语义的宝库来提高知识组织、信息组织的有效性,友好性,同时能够在scalability上有很强的灵活性。

附ISKO2008论文摘要:

Jian Qin

— Syracuse University

Controlled Semantics vs. Social Semantics

An Epistemological Analysis

Abstract

Social semantics is more than just tags or vocabularies. It involves the users who contribute the tags, the perceptions of the world, and intentions that the tags are created for. Whilst social semantics is a valuable, massive data source for developing new knowledge systems or validating existing ones, there are also pitfalls and uncertainties. The epistemological analysis presented in this paper is an attempt to explain the differences and connections between social and controlled semantics from the perspective of knowledge theory. The epistemological connection between social and controlled semantics is particularly important: empirical knowledge can provide data source for testing the rational knowledge and rational knowledge can provide reliability and predictability. Such connection will have significant implications for future research on social and controlled semantics.

参考文献:

Singh, Munindar P. (2000). A social semantics for Agent Communication Languages. In F. Dignum & M. Greaves (Eds.), Issues in agent communication (

Lecture notes in computer science; vol. 1916) (pp. 31–45). London: Springer.

Shirky, Clay. (2005). Ontology is overrated: Categories, links, and tags. In

Clay Shirky’s writings about the Internet: Economics & culture, media & community. http://www.shirky.com/writings/ontology_overrated.html

Posted in 社会语义 | 8 Comments

在南方的时候

在南方的时候

 

刚到密西西比南部的小城时,第一个感觉是回到了中国。在单位里,学生们和秘书们都恭恭敬敬地称教授们“Dr. 某某”,或对官大一些的就索性称某某院长或校长,没有人嫌称呼太长拗口,只怕对教授们官儿们失了尊敬。第二感觉是大家的生活节奏都有条不紊,平缓祥和,加上软软的南方口音和常年的绿树鲜花,更觉得像是来到了世外桃源。密西西比有很多地方还没有脱贫,rundown的旧房子比在北方看到的稍微多一些。尤其是在比较偏远的乡村,我还惊讶地看到那种铁皮房子。

 

Mississippians are still recovering from the Civil War.” (“密西西比仍然在舔美国南北战争时期的伤痛”注:美国南北战争1861-1865)我的一位从北方来的同事警告我说。我一笑了之,不作回答。心想两百年了,什么样的伤痛还能好不了?!美国历史上的南北战争,南方的邦联(Confederacy)军和北方的联盟(Union)军为了自己的信仰和利益而战,留下了许多惊心动魄的故事,虽然后来南北两方分裂避免了,可是在许多南方人的心中,邦联军的失败是难以忘怀的耻辱。就是在今天,邦联军的旗帜还可以在南方一些本地政府的所在地与联盟的国旗一起高高飘扬。有一年密西西比靠海边的一个城市新盖了一座邦联博物馆兼档案馆,开馆那天,我们学院的院长系主任等都专程前往(开车一小时),事后我听他们议论此事的口气,好像去没去就是一个态度问题和忠不忠的问题。再后来有一次,听到一个学生(中年妇女,在海迪斯堡算“society lady” (即上流社会之女士)之类的人物)谈起纽约的时候,义愤填膺的叫他们为该死的Yankees,而且还轻蔑地说她这一世都不会踏上Yankee的土地。经历了这些小插曲,我方始相信我的同事对密西西比人的观察和评语。我相信这只是极少数极个别的极端分子。不过,我还是慢慢地习惯并喜欢上了南方,不是因为它像中国,也不是因为它的天气像武汉,而是因为南方盛产优秀的作家,因为他们笔下的南方浸透着一种情调,与周围的节奏和文化非常的协调。

 

在洋插队第一部曲的时候,沾了学校东亚图书馆的光,有《当代》《十月》《收获》,常常得以过小说瘾。后来带儿子上公共图书馆,又染上了看英文畅销小说的瘾。到了洋插队第二部曲,此瘾得到了大发展,因为到了南方。一天在报纸上看到一篇书评,介绍一位住在北卡一个农场的有着英语文学博士学位的作家叫Charles Frazier,辛勤笔耕五年,写出一部反映南北战争时期的爱情故事。文中提到他因全力写作,教职也辞了,靠妻子教书挣钱养家糊口;又提到书中的情节是祖辈的真人真事。书的名字就叫“Cold Mountain.”(《冷山》) 美丽的故事和书名使得我急不可待的上当地的公共图书馆去借,可是南方!后来还是自己买了一本聊解君子之瘾。此书的功力果不凡响,细腻,伤而不悲,痛而不惨,一种婉柔坚强的美。Frazier一炮打响,很快登上了纽约时报畅销书排行榜第一名(有趣的是,Yankee 的报纸不管你是南方人还是北方人,只要你有成就,南方人也登上Yankee人的报纸)。现在这个故事已经在英国拍电影,制片人就是曾经把《英国病人》(English Patient)搬上银幕的Anthony Minghella

 

 另一个让我上瘾的作家是John Grisham. 他出生在阿肯色,但在密西西比上的大学和工作,所以也算密西西比人。他从小就梦想当文学作家,但命运却让他先上大学读会计,毕业后又在一家律师事务所工作了十年。可是他一直把写小说当作他的嗜好,在每周60-70个小时工作的时间里,还挤出时间写小说。他的第一部小说“A Time to Kill”曾经多次被出版商拒绝,后来终于被一家小出版社接受。因为他的经历,他专门写法律界的故事,多部小说都被拍成了电影。真正使他成名的小说是“The Firm” Paramount把他这部书的故事买下来拍电影之后,众多的出版商突然认识到了Grisham的价值,从此他成了专业作家,一红不可收拾。“The Pelican Brief“,“The Client”,“The Chamber”,“The Runaway Jury”,“The Rainmaker”,“The Partner”,“The Street Lawyer”,“The Testament”,“The Brethren”,以及今年将要出版的“The Summons”,都是与法律界有关的故事。其中The Rainmaker 的电影还得了奥斯卡奖。往往读他的书,看第一页就会被吸引住。另外两部书“The Painted House”和“Skipping Christmas” 是非法律题材,不如他的法律题材的书引人入胜。但是The Painted House 描写Arkansas棉农佃户的生活,也很细腻,如有耐心细细欣赏,也是一部好小说。我对The Painted House 有偏爱,是因为我在南方的生活经历,读这部小说的时候,总是让我联想起旧社会地主们对贫下中农佃户们的残酷剥削,觉得我的阶级感情又有新的提高。

 

后来因为气候和其他原因,离开了南方,可是那片“水深火热”的土地上产出的故事,给我留下了美好的记忆。

 

写于2003

Posted in 读闲书 | 6 Comments

读闲书:《长恨歌》—王安忆著

刚读完这本小说,昨天又在报子上看到为这部小说编的电视剧和电影正在紧锣密鼓的筹备开机。于是就想在这里说几句。
 
小说描写一个普通的上海女孩王琦瑶的一生。王琦瑶是一个美丽清纯的少女的时候,由于偶然机会参加了上海小姐的选美活动,成为第三上海小姐。之后被一个国军大款收养为“二奶“,住在豪华公寓里。在国军撤离大陆前不久那个大款在一次飞机失事中丧生,王琦瑶的生活也随着新的社会制度到来和一系列的社会变化而变化,但是那次当选上海小姐的辉煌和短暂的豪华生活的经历,始终伴随着她,影响着她。
 
小说最突出的风格是细腻,细到了心里,骨头缝里。作者对每一件事、每一个场景、每一个人的描写,仿佛这些都是有血有肉有灵的,让你感到丝丝的细流一点一点的慢慢渗入你的全身心。如作者描写上海弄堂里的闺阁:
 
“上海弄堂里的闺阁,是八面来风的闺阁,愁也是喧喧嚣嚣的愁。后弄里的雨,写在床上是个水淋淋的“愁”字;后弄里的雾,是个模棱两可的愁,又还都是催促,催什么,也没个所以然。它消耗着做女儿的耐心,也消耗着做人的耐心,也免不了有种箭在弦上,钗在匣中,伺机待发的情势。它真是一日比一日难挨,回头一看去又是日苦短,叫人不知怎么好。闺阁是上海弄堂的天真,一夜之间,从嫩走到熟,却是生生灭灭,永远不息,一代换一代的。闺阁还是上海弄堂的幻觉,云开日出便灰飞烟散,却也是一幕接一幕,永无止息。“
 
王安忆在部小说里展现了她对人物刻画的几近炉火纯青的技巧。王琦瑶不是一个领导潮流的人物,而是平凡的弄堂女孩,有自然的不矫揉造作的美,也没有什么为自己 未来的超前计划,她所寻求的是依靠,这就是为什么当年轻的程先生表露爱意,而她却不辞而别投入国军大款的怀抱。而后来发生的一系列变故,迫使她成为自食其力的人,寻求物质依靠不可求,演变成为寻求精神上的依靠。
 
故事里的另外几个主要人物,程先生,蒋丽莉,等,也都刻画的入骨三分。读完这部小说后,书中的人物和故事在我的心里盘桓了好几天,留下许多回想的余地。
 
唯一感觉不足的是,书的一开头,对上海弄堂有整章的描写,故事中的主要人物在第四章才珊珊来迟,故事的展开则在第五章,这对性急的现代读者来说无疑是一个挑战。我就跳开了前面第二章对上海弄堂流言和第三章对鸽子的描写,径直翻到王琦瑶出现的第四章开始。但是读完整个故事再回过头来读哪些跳过的地方,就能体会到作者的用心了。
 
(写于2006年1月)
 
Posted in 读闲书 | 14 Comments

Web 3.0: 更聪明的网络?

MIT的《Technology Review》是一份不错的网上杂志,最近登了一篇文章叫“A Smarter Web", 分两部分刊登的,地址是http://www.technologyreview.com/Infotech/18395/,作者是John Borland。 他在文章里把Web 2.0 解释为“Web 2.0, characterized by features such as tagging, social networks, and user-­created taxonomies of content called "folksonomies," added a new layer of interactivity, represented by sites such as Flickr, Del.icio.us, and Wikipedia.” 在解释Web 3.0 的时候,Borland在文章里提到了去年11月发表在《纽约时报》上的一篇文章,由John Markoff 写的。 Markoff 把Web 3.0 定义为“a set of technologies that offer efficient new ways to help computers organize and draw conclusions from online data, and that definition has since dominated discussions at conferences, on blogs, and among entrepreneurs.”

Borland的文章详细的叙述了Web标准–XML, RDF, RDF Schema Language–以及知识分类建模(ontologies)在过去十年里发展的过程以及存在的一些问题和不同观点,很值得一读。他提到100年前年轻的图书馆员助理杜威面临的图书馆和我们今天面临的Web一样混乱,杜威为了组织好混乱的藏书发明了杜威十进分类法,但是众多的Web技术还是距离完全驾驭Web差的很远。在谈到语义网技术的开发使用时,Borland认为尽管市面上语义网的技术工具还没有成气候,但是很多公司都已经在内部接受并应用语义网的概念和方法,也有很多公司在致力于开发工具,今年内会有相当一部分语义网的工具出台。

在谈到Web 2.0, 和 Web 3.0的发展趋势时,Borland认为目前因为工具的有限,还不可能达到Web 3.0的境界,但是Web 2.0的技术结合Web 3.0的一部分是可能的,将来的Web发展将是一个混和型的(hybrid),主要原因之一是Web的发展不是只依赖于XML和RDF这样Web technologies, 与此同时,其它常用技术也在不断的发展。

Posted in 信息技术 | 16 Comments

信息技术:术语翻译

近年来随着信息与网络的发展,一些英语新名词的出现给汉语翻译带来了一些困难。下面是一些例子:
 
Ontology: 原本是哲学名词,许多计算机与图情研究文献里译为“本体论”、“本体”。这个词在信息技术里的新应用实际上是表示一个模型结构的词,这个模型结构一般是表述某一个知识领域里的概念的及概念之间相关关系,而且有语义(semantics)和结构表述编码语言两方面的内容,已经大大超出原本哲学上的意义。因此沿用哲学上的译法一是不能确切表达ontology在信息技术上的新含义,二是容易引起读者的误解。实际含义是“知识模型结构”或“实用分类系统”。
 
Cyberinfrastructure: 这个字是从cybernetics 与 infrastructure 合成的。Cybernetics, 据WordNet解释, 是关于交流和控制的过程的科学领域,主要是生物学方面的, 尤指生物和人工系统中这些过程的比较。Infrastructure, 是指系统或组织的基本结构和特点,也指一个国家或领域里实现各种功能的基本设施和资金设备。由此看来,意译Cyberinfrastructure不妨译为“交控基本结构”或“交控基本设施”。另外也有用音译意译兼用的,如刘炜根据其音译为“赛百结构”。
Posted in 图情术语 | 34 Comments

一个小小的调研:图情教育与职业(写于2002年)

亲身经历了两种图专教育,有许多感慨。在同学中作了一个小小的问卷调查,包括三个问题:1)你毕业后改行了吗?如果改了,毕业后第几年改的? 2)如果你改了行,你的本科所学有帮助吗? 3)如果给你再一次机会重新选择专业,还会选图专/情专吗?
 
调查结果总结:
  1. 改行:基本上所有的人都改了行,有的人’觉悟’的早一些,有的人’觉悟’的晚一些。改行的原因不外乎这几种:1)丧失兴趣 2)迫于环境(单位及社会的偏见)3)迫于生计(长期低收入,并受市场经济的冲击,国家投入减少等)
  2. 所学的用处:值得安慰的是大学四年的学习还是有一些用处,总体知识水平和文化修养(注:当年我们抗着椅子去广埠屯看《流浪者之歌〉可以为证)的收益还是不可低估的。但对未改行前的工作及改行后的工作,则用处甚微。
  3. 是否会再选择图/情专:令人悲哀的是无人会选择图/情专(有一人说会选,但是从不同的角度,而不是出于对图/情专的热爱。
  4. 结语:基于图/情专老前辈们纷纷反叛,说明好几个问题:
    • 图情的社会地位:在信息和知识时代,图情的地位依然与二十年前相差无几。
    • 图情的教育:培养人才的思维上与西方的差异在于实用,包括学制,课程,教学,等方面。
    • 本科生到底适不适合有图情学位? 硕士学位是不是可以多元化?课程设置与教学方法应该如何改善来适应社会和个人发展的需要?这些都是有待于讨论的问题。

这个调研的结果可以说是对有心办学的人是一个参考。就我自己而言,我曾经无数次希望过我学的是生物或别的什么学科,因为常常觉得自己是一个没有’专业特长’的人。

(这条博克在对原稿作了简单修改)

Posted in 图情教育 | 6 Comments