RM新时代APP官网

舊版網(wǎng)站入口

站內(nèi)搜索

“漢語(yǔ)史語(yǔ)料庫(kù)建設(shè)研究”中期檢查報(bào)告

2014年02月26日19:09來(lái)源:全國(guó)哲學(xué)社會(huì)科學(xué)工作辦公室

一、 研究計(jì)劃總體執(zhí)行情況及各子課題進(jìn)展情況

本項(xiàng)目于2010年12月27日獲國(guó)家社科基金辦批準(zhǔn)立項(xiàng),立項(xiàng)后召集課題組全體人員根據(jù)國(guó)家社科基金辦反饋的“第17組綜合評(píng)價(jià)意見(jiàn)”(即對(duì)本項(xiàng)目的專家意見(jiàn)),就專家組提出的“縮小課題范圍,只做中古漢語(yǔ)語(yǔ)料庫(kù),集中力量將中古漢語(yǔ)語(yǔ)料庫(kù)做精做好。加強(qiáng)語(yǔ)料庫(kù)建設(shè)相關(guān)理論研究”等意見(jiàn)重新填寫(xiě)了項(xiàng)目的目標(biāo)任務(wù)書(shū)并得到國(guó)家社科基金辦的批準(zhǔn)。

項(xiàng)目的最終目標(biāo)是:在五年建設(shè)期間,1.建成國(guó)內(nèi)首個(gè)可用于漢語(yǔ)史研究的由多個(gè)子庫(kù)組成的收錄原始語(yǔ)料1000萬(wàn)字,庫(kù)容1600萬(wàn)字的具有多集合特點(diǎn)的深加工中古漢語(yǔ)語(yǔ)料庫(kù)(內(nèi)容上是中古漢語(yǔ)代表性語(yǔ)料的集合,結(jié)構(gòu)上是校勘庫(kù)、義項(xiàng)庫(kù)、語(yǔ)法庫(kù)等多庫(kù)的集合,功能上是自動(dòng)分詞軟件、自動(dòng)標(biāo)注軟件、檢索系統(tǒng)軟件等多種功能軟件的集合。為漢語(yǔ)史語(yǔ)料庫(kù)的建設(shè)作一些理論上的探討及實(shí)踐上的嘗試,為漢語(yǔ)史研究(特別是中古漢語(yǔ)史的研究),提供一個(gè)比較實(shí)用的操作平臺(tái)。2.在中古漢語(yǔ)語(yǔ)法體系、中古漢語(yǔ)詞匯系統(tǒng)、中古漢語(yǔ)語(yǔ)料庫(kù)建設(shè)理論研究方面有所突破,產(chǎn)生相關(guān)的指導(dǎo)性理論論著。3.研制出“中古漢語(yǔ)語(yǔ)料庫(kù)檢索系統(tǒng)”、 “中古漢語(yǔ)自動(dòng)分詞系統(tǒng)”、“中古漢語(yǔ)詞義自動(dòng)標(biāo)注系統(tǒng)”“ 、“中古漢語(yǔ)異文發(fā)現(xiàn)軟件”等一系列相關(guān)軟件。

自項(xiàng)目開(kāi)題至今(2011.4—2013.7),已經(jīng)經(jīng)過(guò)了兩年半時(shí)間,項(xiàng)目研究時(shí)間

(2010.12—2015.12)過(guò)半,我們嚴(yán)格按照原訂計(jì)劃,總體進(jìn)展順利,目前已經(jīng)完成全部任務(wù)的三分之二(某些方面在原計(jì)劃的基礎(chǔ)上作了較大規(guī)模拓展)。具體表現(xiàn)在: 入庫(kù)語(yǔ)料至2013年9月8月底全部完成?保òǔ跣、終校),字?jǐn)?shù)超過(guò)原來(lái)規(guī)劃的1000萬(wàn)字(除原計(jì)劃1000萬(wàn)字傳世文獻(xiàn)語(yǔ)料校勘入庫(kù)外,根據(jù)專家建議,新增加了近100萬(wàn)字出土文獻(xiàn)語(yǔ)料,同時(shí),增加了繁體電子版佛經(jīng)語(yǔ)料7億多字,大大超過(guò)原庫(kù)量)。語(yǔ)料的人工深加工(分詞、語(yǔ)義、語(yǔ)法、文字標(biāo)注)已經(jīng)完成145萬(wàn)字(并經(jīng)三次復(fù)核),為自動(dòng)分詞、標(biāo)注軟件提供了可靠記憶樣本,目前已進(jìn)入機(jī)器自動(dòng)分詞、標(biāo)注(再人工核對(duì))階段,工作進(jìn)度已大大加快!罢Z(yǔ)義庫(kù)”、“語(yǔ)法庫(kù)”、“異文庫(kù)”均已建成。?原來(lái)確定的兩個(gè)理論研究課題“中古漢語(yǔ)構(gòu)詞法與造詞法研究”、 “中古漢語(yǔ)語(yǔ)法體系研究”亦按計(jì)劃進(jìn)行,目前已接近完成。同時(shí),新增了“長(zhǎng)沙走馬樓三國(guó)吳簡(jiǎn)詞匯計(jì)量研究”、“漢魏石刻資料詞匯計(jì)量研究”兩個(gè)出土文獻(xiàn)詞匯研究的理論課題,目前順利進(jìn)行。?語(yǔ)料庫(kù)的各種相關(guān)軟件(“中古漢語(yǔ)語(yǔ)料庫(kù)語(yǔ)料檢索系統(tǒng)”、“中古漢語(yǔ)自動(dòng)分詞軟件”、“漢語(yǔ)自動(dòng)語(yǔ)義標(biāo)注軟件”、“ 版本異文自動(dòng)發(fā)現(xiàn)軟件”)已經(jīng)自主研制開(kāi)發(fā)成功,經(jīng)過(guò)反復(fù)運(yùn)用調(diào)試,都已進(jìn)入第三版,目前正實(shí)際運(yùn)用中進(jìn)一步完善提高。

四個(gè)子項(xiàng)目的具體進(jìn)展情況如下:

(一)“深加工中古漢語(yǔ)語(yǔ)料庫(kù)語(yǔ)料鑒別與整理研究”子項(xiàng)目(負(fù)責(zé)人:方向東教授)

按照計(jì)劃書(shū)研究?jī)?nèi)容和研究方法進(jìn)行,將須入庫(kù)的中古語(yǔ)料先進(jìn)行版本的確定和?,已完成《殷蕓小說(shuō)》、《論衡》、《南齊書(shū)》、《宋書(shū)》、《梁書(shū)》、《抱樸子》、《三國(guó)志》、《世說(shuō)新語(yǔ)》、《后漢書(shū)》、《齊民要術(shù)》、《水經(jīng)注》、《顏氏家訓(xùn)》、《北齊書(shū)》、《搜神記》、《列子》、《先秦漢魏晉南北朝詩(shī)》的版本調(diào)查工作,并撰寫(xiě)了調(diào)查報(bào)告;采取課題組參與者分頭分工把關(guān)的原則,將確定的中古文獻(xiàn)語(yǔ)料分課題組成員校勘。目前完成進(jìn)度如下:《后漢書(shū)》(179.4萬(wàn))《洛陽(yáng)伽藍(lán)記》(5.7萬(wàn))《水經(jīng)注》(40萬(wàn))《神仙傳》(3.8萬(wàn))《魏書(shū)》(140萬(wàn))《幽明錄》《冥祥記》(合計(jì)8萬(wàn))《陳書(shū)》《周書(shū)》(合計(jì)51萬(wàn))《論衡校釋》(90萬(wàn))《三國(guó)志》(85萬(wàn))《北史》(44萬(wàn))《北齊書(shū)》(28萬(wàn))《南齊書(shū)》(35萬(wàn))《梁書(shū)》(35萬(wàn))《南史》(80萬(wàn))17部文獻(xiàn)語(yǔ)料共計(jì)914.9萬(wàn)字,初校工作已于2012年8月份全部完成。

至2013年7月底,已完成終校的文獻(xiàn)是:《后漢書(shū)》(周燕飛初校,曹紅軍、謝秉洪教授負(fù)責(zé)終校),《洛陽(yáng)伽藍(lán)記》《神仙傳》(李玉嬌、李慧娟初校,王鍔教授負(fù)責(zé)終校),《魏書(shū)》(魏慶彬初校,王鍔教授負(fù)責(zé)終校),《梁書(shū)》(景紅緯初校,王鍔教授負(fù)責(zé)終校),《南齊書(shū)》(顧言初校,方向東教授負(fù)責(zé)終校)《陳書(shū)》(李衛(wèi)衛(wèi)初校,方向東教授負(fù)責(zé)終校)《南史》(朱娜娜初校,方向東教授負(fù)責(zé)終校)《幽明錄》《冥祥記》(葉國(guó)盛初校,方向東教授負(fù)責(zé)終校),合計(jì)542.9萬(wàn)字的終校工作完成。

即將完成的有:《三國(guó)志》(朱珠初校,謝秉洪教授負(fù)責(zé)終校),《論衡校釋》(蔡玉英初校,曹紅軍教授負(fù)責(zé)終校),《水經(jīng)注》(王勇初校,吳新江教授負(fù)責(zé)終校),《北齊書(shū)》(易雪丹初校,吳新江教授負(fù)責(zé)終校),《北史》(吳婷、申阜鑫、郭林初校,吳新江教授負(fù)責(zé)終校),《周書(shū)》(李衛(wèi)衛(wèi)初校,吳新江教授負(fù)責(zé)終校),合計(jì)323萬(wàn)字。此項(xiàng)工作目前正利用暑假時(shí)間作最后沖刺,全部終校工作將在2013年8月底完成。

另外又增加100萬(wàn)字的出土文獻(xiàn)語(yǔ)料(吐魯番文獻(xiàn)、長(zhǎng)沙走馬樓三國(guó)吳簡(jiǎn)、漢魏南北朝石刻資料),該項(xiàng)語(yǔ)料由“深加工中古漢語(yǔ)語(yǔ)料庫(kù)理論研究”子項(xiàng)目組成員負(fù)責(zé)錄入?保壳耙惨淹瓿。

也即是說(shuō),至2013年8月底,該子項(xiàng)目的預(yù)定任務(wù)已經(jīng)圓滿完成,今后的工作是對(duì)將來(lái)臨時(shí)增加的語(yǔ)料進(jìn)行?。

(二)“深加工中古漢語(yǔ)語(yǔ)料庫(kù)建設(shè)研究”子項(xiàng)目(負(fù)責(zé)人:化振紅教授)

該子項(xiàng)目組自2012年年終檢查至今主要完成以下工作:

修訂義項(xiàng)庫(kù)(化振紅教授、汪祎博士):針對(duì)原有的中古詞語(yǔ)義項(xiàng)數(shù)據(jù)庫(kù)中收詞數(shù)量不足、義項(xiàng)不全、詞條和義項(xiàng)交叉、多義詞處理不當(dāng)?shù)热毕,重新進(jìn)行了校對(duì)、整理,截至目前,新修訂的義項(xiàng)庫(kù)詞條總數(shù)共483,432條,全部完成了人工校對(duì)工作并投入使用。(并結(jié)合“義項(xiàng)庫(kù)”的建設(shè),建立了《漢語(yǔ)大詞典》數(shù)據(jù)庫(kù))

建立異體字、疑難字庫(kù)(趙家棟副教授):針對(duì)中古語(yǔ)料中極為普遍的特殊用字現(xiàn)象,建立了專門(mén)的中古漢語(yǔ)語(yǔ)料庫(kù)異體字?jǐn)?shù)據(jù)庫(kù),收入各體漢字3700個(gè)左右,基本解決了現(xiàn)階段語(yǔ)料切分、標(biāo)注以及未來(lái)的詞語(yǔ)檢索過(guò)程中的字體轉(zhuǎn)換問(wèn)題,部分解決了數(shù)據(jù)庫(kù)中疑難字的顯示問(wèn)題。下一階段,將大量收入中古漢語(yǔ)疑難字,建立與系統(tǒng)檢索軟件完全匹配的中古漢語(yǔ)語(yǔ)料庫(kù)疑難字庫(kù)。兩個(gè)字庫(kù)繼續(xù)升級(jí)、最終合并之后,可望完全解決整個(gè)數(shù)據(jù)庫(kù)的檢索、顯示等問(wèn)題。

語(yǔ)料標(biāo)注(化振紅教授負(fù)責(zé)組織全體教師、博士):繼續(xù)進(jìn)行了語(yǔ)料的人工切分、標(biāo)注工作,提供了更多的人工切分、標(biāo)注樣本。從2012年12月年檢截止目前,新增人工切分、標(biāo)注樣本約59萬(wàn)字,累計(jì)完成人工標(biāo)注樣本145萬(wàn)字左右。初步實(shí)現(xiàn)了改進(jìn)后的義項(xiàng)庫(kù)、人工標(biāo)注樣本與電腦切詞及標(biāo)注軟件的對(duì)接,對(duì)程序軟件標(biāo)注的語(yǔ)料樣本正在進(jìn)行評(píng)估、調(diào)研,提高程序軟件切詞、標(biāo)注的正確率,目前的切詞、標(biāo)注的一次正確率達(dá)到75%左右,新一輪的調(diào)試正利用暑假緊張進(jìn)行,9月初正式進(jìn)入程序軟件操作為主、人工校對(duì)為輔的切詞、標(biāo)注階段。屆時(shí),語(yǔ)料切詞、標(biāo)注進(jìn)度將大大加快。

(三)“深加工中古漢語(yǔ)語(yǔ)料庫(kù)理論研究”子項(xiàng)目(負(fù)責(zé)人:黃 征教授)

該子項(xiàng)目包括四個(gè)理論研究課題及一個(gè)吐魯番出土文獻(xiàn)整理課題:

中古漢語(yǔ)構(gòu)詞法與造詞法研究(劉杰博士):該項(xiàng)研究的主要內(nèi)容包括適應(yīng)中文信息處理的中古漢語(yǔ)復(fù)音詞的鑒別與界定、構(gòu)成特點(diǎn)與生成特點(diǎn)、發(fā)展趨勢(shì)及計(jì)量研究等內(nèi)容。作為詞匯理論研究,與中古漢語(yǔ)語(yǔ)法體系的研究、語(yǔ)料的鑒別與整理、漢語(yǔ)史數(shù)據(jù)庫(kù)平臺(tái)建設(shè)等其它項(xiàng)目的研究是互補(bǔ)關(guān)系,幾個(gè)部分相互依托,共同推進(jìn)。目前通過(guò)整理國(guó)內(nèi)近二十年來(lái)中古漢語(yǔ)復(fù)音詞研究的成果,對(duì)大量專書(shū)、專類詞匯研究著述中的復(fù)音詞的研究成果進(jìn)行全面梳理和整理,對(duì)中古漢語(yǔ)復(fù)音詞進(jìn)行了計(jì)量研究,已完成“中古漢語(yǔ)核心復(fù)音詞表”的整理編纂(近10000詞條)。服務(wù)于后續(xù)研究的需要。在收集整理中古復(fù)音詞的同時(shí),對(duì)各家各類研究成果進(jìn)行梳理,尤其是中古漢語(yǔ)復(fù)音詞的界定標(biāo)準(zhǔn)進(jìn)行歸納分析,建立了一套能服務(wù)于語(yǔ)料庫(kù)建設(shè)需要的中古漢語(yǔ)復(fù)音詞的界定標(biāo)準(zhǔn)和“分詞”依據(jù)。“中古漢語(yǔ)的構(gòu)詞法”、“中古漢語(yǔ)的造詞法及新詞生成機(jī)制”這兩個(gè)問(wèn)題正在研究。

中古漢語(yǔ)語(yǔ)法體系研究(胡靜書(shū)博士):通過(guò)對(duì)中古漢語(yǔ)的虛詞的收集整理,統(tǒng)計(jì)分析,目前已完成中古漢語(yǔ)語(yǔ)法體系——詞法體系的研究,句法體系研究正在進(jìn)行。

長(zhǎng)沙走馬樓三國(guó)吳簡(jiǎn)詞匯計(jì)量研究(張學(xué)城副教授)該課題將走馬樓三國(guó)吳簡(jiǎn)的全部釋文制作數(shù)據(jù)庫(kù),利用數(shù)據(jù)庫(kù)生成引得,為詞匯計(jì)量研究提供條件。

文物出版社的釋文凝聚了很多學(xué)者的心血,具有很高的學(xué)術(shù)價(jià)值。但是由于簡(jiǎn)文量大,人手有限,時(shí)間緊迫,錯(cuò)誤在所難免。課題承擔(dān)者在原有釋文基礎(chǔ)上,核對(duì)已公布的相關(guān)竹簡(jiǎn)照片,訂正了前人釋文中的一些錯(cuò)誤,完成全部?变浫牍ぷ。并已完成吳簡(jiǎn)(一)(二)冊(cè)的切詞、標(biāo)注及數(shù)據(jù)庫(kù)的制作,其余(三)(四)冊(cè)的切詞、標(biāo)注正在進(jìn)行。

漢魏石刻資料詞匯計(jì)量研究(羅小如博士)該課題以毛遠(yuǎn)明《漢魏六朝碑刻校注》(約69萬(wàn)字)為基礎(chǔ),進(jìn)一步搜集補(bǔ)充漢魏石刻資料,參照漢魏石刻拓片做好現(xiàn)有石刻釋文的校對(duì)整理,分別輸入電腦,這一階段的工作已經(jīng)完成。隨后分詞、標(biāo)注,做成數(shù)據(jù)庫(kù)。然后利用數(shù)據(jù)庫(kù)進(jìn)行專項(xiàng)詞匯計(jì)量研究。目前已完成10萬(wàn)字左右的切詞、標(biāo)注,并進(jìn)入數(shù)據(jù)庫(kù)。其余部分將在2014年8月前完成。

“吐魯番出土文獻(xiàn)”數(shù)據(jù)庫(kù)(趙紅副教授)唐長(zhǎng)孺主編的《吐魯番出土文書(shū)》第一冊(cè)集中公布了中古時(shí)期吐魯番出土文獻(xiàn)的圖版,本階段的主要工作集中在第一冊(cè)的資料精加工以及電子化處理方面。首先將前期工作中完成的錄文與出土文書(shū)圖版進(jìn)行一一對(duì)照?,彌補(bǔ)和糾正了錄文中的缺失,提交語(yǔ)料庫(kù)入庫(kù)使用的錄文資料盡最大可能準(zhǔn)確無(wú)誤。第二,將出版物的圖版用掃描、拍照等方法電子化處理,使異體字切分成為可能。第三,將已經(jīng)輯錄的異體字逐一用制圖軟件切分,制成各自獨(dú)立的字形圖片,同時(shí)錄入其所在文句,使字形與文句一一對(duì)照,避免了孤立字形缺乏例證的弊端,同時(shí)也為語(yǔ)料庫(kù)入庫(kù)分詞提供了完整的資料。目前,經(jīng)過(guò)精加工的錄文資料已經(jīng)提交入庫(kù),進(jìn)行分詞、標(biāo)注等相關(guān)工作。電子化處理的字形圖片工作也已基本完成,《吐魯番文獻(xiàn)俗字典》亦已編纂完成,將遞交“異文庫(kù)”、“疑難字庫(kù)”。

(四)“深加工中古漢語(yǔ)語(yǔ)料庫(kù)系統(tǒng)平臺(tái)建設(shè)與研究”子項(xiàng)目(負(fù)責(zé)人:陳小荷教授)

2012年12月年檢至今,該子項(xiàng)目組主要工作如下:

“中古漢語(yǔ)語(yǔ)料庫(kù)語(yǔ)料檢索系統(tǒng)”軟件的改進(jìn)升級(jí)(曲維光教授、付佳)。2012年上半年軟件第一版研制以后,進(jìn)行了試運(yùn)行,在試運(yùn)行過(guò)程中,根據(jù)“語(yǔ)料庫(kù)建設(shè)”子項(xiàng)目組的意見(jiàn)建議,又進(jìn)行了兩次改版升級(jí),一方面進(jìn)一步提升了軟件的運(yùn)行速度,同時(shí),又拓展了軟件的檢索功能(如:語(yǔ)料的時(shí)代分層、地域區(qū)分功能;相類語(yǔ)料的同頁(yè)面比對(duì)功能、網(wǎng)上互動(dòng)功能等)目前“中古漢語(yǔ)語(yǔ)料庫(kù)檢索系統(tǒng)”已經(jīng)推出第三版,功能和性能已基本達(dá)到要求。

版本異文自動(dòng)發(fā)現(xiàn)的研究(陳小荷教授),針對(duì)中古漢語(yǔ)語(yǔ)料改進(jìn)了算法,速度更快、異文定位更加準(zhǔn)確。

相關(guān)軟件的對(duì)接(李斌博士)。在項(xiàng)目建設(shè)實(shí)踐中,總結(jié)經(jīng)驗(yàn)教訓(xùn),將“中古漢語(yǔ)自動(dòng)語(yǔ)義標(biāo)注軟件”與“中古漢語(yǔ)自動(dòng)分詞軟件”有機(jī)結(jié)合,不僅通過(guò)形式區(qū)分進(jìn)行自動(dòng)分詞,而且通過(guò)語(yǔ)義鑒別進(jìn)行自動(dòng)分詞,有效提高了切詞的準(zhǔn)確性(李斌博士)。

二、調(diào)查研究及學(xué)術(shù)交流情況

兩年半以來(lái),本項(xiàng)目組圍繞項(xiàng)目的進(jìn)展開(kāi)展了一系列學(xué)術(shù)調(diào)研、文獻(xiàn)收集以

及學(xué)術(shù)交流活動(dòng)。共邀請(qǐng)國(guó)內(nèi)專家前來(lái)進(jìn)行學(xué)術(shù)講座場(chǎng),本項(xiàng)目組成員應(yīng)邀外出進(jìn)行學(xué)術(shù)講座4場(chǎng),出席國(guó)際、國(guó)內(nèi)重要學(xué)術(shù)會(huì)議13人次。

(一)調(diào)研數(shù)據(jù)整理運(yùn)用:

掃描版文獻(xiàn)檢索問(wèn)題的調(diào)查研究(陳小荷教授)。對(duì)語(yǔ)料庫(kù)中的掃描版文獻(xiàn)直接進(jìn)行檢索,目前美國(guó)已經(jīng)開(kāi)始較多運(yùn)用這一技術(shù)。在我們的語(yǔ)料庫(kù)中能否采用這一技術(shù),這關(guān)系到語(yǔ)料庫(kù)的質(zhì)量。子課題組負(fù)責(zé)人陳小荷教授對(duì)此進(jìn)行了細(xì)致的調(diào)查了解,通過(guò)國(guó)內(nèi)外相關(guān)資料的研究,陳教授認(rèn)為:從原理上說(shuō),掃描版文獻(xiàn)是無(wú)法直接檢索的,必須經(jīng)過(guò)字符識(shí)別和人工校對(duì)之后才能檢索。但是,檢索結(jié)果的呈現(xiàn)形式可以是掃描圖像。其中的奧秘就是將文本的段落、句子、詞或字符與它在掃描圖像中的位置聯(lián)系起來(lái),檢索仍然在文本中進(jìn)行(這一過(guò)程不讓用戶看見(jiàn)),但可通過(guò)位置映射將相應(yīng)的圖像呈現(xiàn)給用戶。例如,利用工具軟件DjvuToy,可以制作djvu電子書(shū),進(jìn)行字符識(shí)別、生成可檢索的隱藏文本。這一技術(shù)在語(yǔ)料檢索中很有價(jià)值。如果檢索結(jié)果以文本形式呈現(xiàn),用戶對(duì)其準(zhǔn)確性和真實(shí)性是持謹(jǐn)慎態(tài)度的,往往還要去查閱掃描文獻(xiàn)或紙版本。檢索結(jié)果以圖像形式呈現(xiàn),用戶可以放心使用。即使字符識(shí)別可能有誤,也能夠直觀地在掃描圖像上反映出來(lái)。基于這樣的認(rèn)識(shí),我們目前正在在檢索系統(tǒng)上做這方面的實(shí)驗(yàn)嘗試。

中古漢語(yǔ)語(yǔ)料自動(dòng)切詞軟件準(zhǔn)確率問(wèn)題的調(diào)查研究(董志翹、化振紅教授)

目前古代漢語(yǔ)語(yǔ)料的自動(dòng)切詞軟件研究的瓶頸是切詞準(zhǔn)確率的問(wèn)題,現(xiàn)代漢語(yǔ)語(yǔ)

料自動(dòng)切詞軟件的準(zhǔn)確率已經(jīng)可以達(dá)到95%以上,但古代漢語(yǔ)語(yǔ)料由于詞與非詞界限的模糊,自動(dòng)切詞軟件的準(zhǔn)確率一直不高(基本上在70%—80%間徘徊)。利用在韓國(guó)參加學(xué)術(shù)會(huì)議的機(jī)會(huì),董志翹、化振紅教授與臺(tái)灣大學(xué)工程科學(xué)及海洋工程研究所杜正民、唐國(guó)銘教授、法鼓佛教學(xué)院洪正洲助理教授進(jìn)行了會(huì)間個(gè)別交流,他們目前正參與法鼓佛教學(xué)院“中華電子佛典數(shù)據(jù)庫(kù)”的建設(shè),唐國(guó)銘教授的報(bào)告“運(yùn)用佛經(jīng)音義語(yǔ)料建構(gòu)‘語(yǔ)意詞網(wǎng)’之研究——以《瑜伽師地論》為例”洪正洲助理教授的報(bào)告“以統(tǒng)計(jì)量化分析方式進(jìn)行早期漢譯佛典之翻譯年代判斷與翻譯特征萃取”,對(duì)于我們漢語(yǔ)史語(yǔ)料庫(kù)的建設(shè)均有啟發(fā)。通過(guò)調(diào)查,他們研制的檢索系統(tǒng)的某些功能和自動(dòng)分詞軟件研制方法(按文體分別制作自動(dòng)切詞軟件提高分詞精確度的方法),很值得我們借鑒,為此互相建立了進(jìn)一步交流協(xié)作的意向。目前我們已經(jīng)在進(jìn)行按文體制作自動(dòng)切詞軟件的嘗試。

(二)國(guó)內(nèi)外文獻(xiàn)資料的收集整理:

國(guó)外《經(jīng)律異相》資料的收集整理(董志翹教授)。語(yǔ)料庫(kù)中所收《經(jīng)律異相》是梁代寶唱所編的我國(guó)第一部佛教類書(shū),資料價(jià)值非常高,但該書(shū)一直未有人整理。我們首次用國(guó)內(nèi)所能見(jiàn)到的八種重要藏經(jīng)本進(jìn)行?闭,加上斷句、標(biāo)點(diǎn)(94萬(wàn)字,巴蜀書(shū)社2011年8月出版)。后經(jīng)董志翹教授與日本國(guó)際佛教大學(xué)院大學(xué)“日本古寫(xiě)經(jīng)研究所”所長(zhǎng)落合俊典教授聯(lián)系,在他的大力支持下,又查找到日本金剛寺、七寺、興圣寺三個(gè)寺院所藏《經(jīng)律異相》的三種古寫(xiě)本,并全部復(fù)印寄贈(zèng)。目前,我們正利用這些寶貴的材料對(duì)《經(jīng)律異相》作進(jìn)一步校勘整理。

國(guó)內(nèi)漢魏六朝石刻資料的收集整理(董志翹教授、羅小如博士)語(yǔ)料庫(kù)中的中古出土石刻文獻(xiàn),以前均散見(jiàn)各處,沒(méi)有一個(gè)比較完備的文本。我們了解到西南大學(xué)古籍所毛遠(yuǎn)明教授新近剛出版《漢魏六朝碑刻校注》(全10冊(cè),2008年線裝書(shū)局出版),這是迄今漢魏六朝碑刻資料收集最全面、整理最精審的著作。立即前往重慶與他當(dāng)面協(xié)商,最后同意將該書(shū)收入語(yǔ)料庫(kù)。我們目前在該書(shū)的基礎(chǔ)上,又進(jìn)一步搜集補(bǔ)充了一些漢魏石刻資料,并進(jìn)行切詞、標(biāo)注的深加工處理。

電子佛經(jīng)資料的收集整理(陳小荷教授)搜集了繁體電子版佛經(jīng)語(yǔ)料7億多字,并且對(duì)佛經(jīng)語(yǔ)料自動(dòng)分詞方法進(jìn)行了初步探索。語(yǔ)料包括大正藏、卐續(xù)藏、嘉興藏、趙城金藏、中華藏、房山石經(jīng)、高麗藏、乾隆藏、卍正藏、永樂(lè)北藏、洪武南藏等等(均已排除重復(fù)部分)。一種佛經(jīng)往往有多種譯本,例如《金剛經(jīng)》主要有姚秦時(shí)代的鳩摩羅什譯本、唐代玄奘譯本。有的甚至有梵漢對(duì)照,其中梵文詞語(yǔ)用漢字音譯,如《唐梵翻對(duì)字音般若波羅蜜多心經(jīng)》。這些語(yǔ)料對(duì)于研究佛經(jīng)詞匯發(fā)現(xiàn)和自動(dòng)分詞以及中古音韻都是非常寶貴的資料。也大大充實(shí)了我們的語(yǔ)料庫(kù)。

(三)學(xué)術(shù)會(huì)議:

召開(kāi)了重大招標(biāo)項(xiàng)目開(kāi)題論證會(huì)

2011年4月3日上午9時(shí),在南京師范大學(xué)貴賓室召開(kāi)了本項(xiàng)目的開(kāi)題論證會(huì)。出席本次開(kāi)題會(huì)的有國(guó)家級(jí)“有突出貢獻(xiàn)專家”、北京大學(xué)中文系博士生導(dǎo)師蔣紹愚教授,北京語(yǔ)言大學(xué)信息科學(xué)學(xué)院博士生導(dǎo)師宋柔教授,江蘇省哲學(xué)社會(huì)科學(xué)基金辦公室主任徐之順。南京師范大學(xué)副校長(zhǎng)吳康寧教授,文學(xué)院院長(zhǎng)朱曉進(jìn)教授,社會(huì)科學(xué)處副處長(zhǎng)秦國(guó)榮教授及課題組全體成員。項(xiàng)目首席專家董志翹教授全面系統(tǒng)地匯報(bào)了調(diào)整后課題的思路、研究路徑、研究項(xiàng)目的重難點(diǎn)等。蔣紹愚教授就課題的語(yǔ)料庫(kù)范圍、功能、來(lái)源文本選擇、語(yǔ)料分期、文本標(biāo)注內(nèi)容等具體問(wèn)題,和語(yǔ)料庫(kù)檢索平臺(tái)、平行知識(shí)庫(kù)、前期人工標(biāo)注、后期計(jì)算機(jī)的學(xué)習(xí)等技術(shù)路線,提出自己的意見(jiàn)。宋柔教授結(jié)合自己多年從事現(xiàn)代漢語(yǔ)語(yǔ)料庫(kù)建構(gòu)與研究工作,也對(duì)語(yǔ)料庫(kù)標(biāo)注的開(kāi)放性、模糊性,尤其是文字形體難題等提出了建設(shè)性建議。課題組成員與相關(guān)專家學(xué)者進(jìn)行了熱烈的溝通與交流,在現(xiàn)場(chǎng)提出了一些新的的設(shè)想

召開(kāi)了重大招標(biāo)項(xiàng)目專家咨詢會(huì)

2011年11月26日,在南京師范大學(xué)南山專家樓二樓第二會(huì)議室舉行本項(xiàng)目專家咨詢會(huì)。受邀的咨詢專家有湖南師范大學(xué)蔣冀騁教授、北京大學(xué)孫玉文教授、浙江大學(xué)張涌泉、汪維輝教授、復(fù)旦大學(xué)汪少華教授、廈門(mén)大學(xué)曾良教授、上海師范大學(xué)徐時(shí)儀教授7人(7位專家涵蓋中古漢語(yǔ)史研究中的文字、音韻、詞匯、語(yǔ)法等各個(gè)領(lǐng)域),與全體項(xiàng)目組成員對(duì)課題進(jìn)展以及相關(guān)問(wèn)題展開(kāi)了熱烈討論,同時(shí)紛紛為項(xiàng)目出謀劃策,提出了不少寶貴的意見(jiàn)、建議。

召開(kāi)了“深加工中古漢語(yǔ)語(yǔ)料庫(kù)”前期成果專家評(píng)估會(huì)

結(jié)合211學(xué)科建設(shè)評(píng)估,深加工中古漢語(yǔ)語(yǔ)料庫(kù)前期試運(yùn)行部分(已有部分中古文獻(xiàn)經(jīng)加工后入庫(kù)試運(yùn)行),2012年2月19日接受了由南京師范大學(xué)組織的專家組的評(píng)估,專家組由安徽大學(xué)古文字專家黃德寬教授、中國(guó)社會(huì)科學(xué)院計(jì)算語(yǔ)言學(xué)專家馮志偉研究員、廈門(mén)大學(xué)敦煌學(xué)專家曾良教授組成,專家組通過(guò)聽(tīng)取項(xiàng)目組匯報(bào)、參觀語(yǔ)料庫(kù)演示,最終評(píng)語(yǔ)是:“課題組在語(yǔ)料庫(kù)加工應(yīng)用和軟硬件平臺(tái)建設(shè)方面,在中古漢語(yǔ)研究領(lǐng)域處于國(guó)內(nèi)領(lǐng)先。圍繞語(yǔ)料庫(kù)開(kāi)展的相關(guān)理論研究成果,對(duì)中古漢語(yǔ)研究方面產(chǎn)生了積極影響。研究整理的中古漢語(yǔ)語(yǔ)料文本,得到學(xué)術(shù)界的高度評(píng)價(jià)。該課題成果具有較為廣泛的推廣價(jià)值,中古漢語(yǔ)典型語(yǔ)料庫(kù)和便捷的檢索方式,為漢語(yǔ)史及中古漢語(yǔ)提供了先進(jìn)的研究與交流平臺(tái)!辫b定等第為“優(yōu)秀”。

(四)學(xué)術(shù)交流:

邀請(qǐng)外單位專家前來(lái)進(jìn)行學(xué)術(shù)講座(9場(chǎng))

2011年4月2日,項(xiàng)目組邀請(qǐng)北京語(yǔ)言大學(xué)博士生導(dǎo)師,計(jì)算語(yǔ)言學(xué)專家宋柔教授在南京師范大學(xué)國(guó)際教育學(xué)院報(bào)告廳作學(xué)術(shù)報(bào)告,報(bào)告的題目是“基于廣義話題的漢語(yǔ)文本結(jié)構(gòu)”

2011年4月2日,項(xiàng)目組邀請(qǐng)北京大學(xué)博士生導(dǎo)師、漢語(yǔ)史專家蔣紹愚教授作學(xué)術(shù)報(bào)告,報(bào)告的題目是“漢語(yǔ)史的學(xué)習(xí)和研究”

2011年11月15日,項(xiàng)目組邀請(qǐng)東北師范大學(xué)博士生導(dǎo)師,古文獻(xiàn)專家曹書(shū)杰教授作學(xué)術(shù)講座,講座題目:“考據(jù)學(xué)與漢語(yǔ)言文字研究”。

2011年11月26日,項(xiàng)目組邀請(qǐng)北京大學(xué)博士生導(dǎo)師孫玉文教授作學(xué)術(shù)講座,講座題目是:“揚(yáng)雄《方言》折射出的秦漢方音”。

2011年11月26日,項(xiàng)目組邀請(qǐng)復(fù)旦大學(xué)出土文獻(xiàn)與古文字研究中心博士生導(dǎo)師,訓(xùn)詁學(xué)專家汪少華教授作學(xué)術(shù)講座,講座題目是:“訓(xùn)詁與考古研究成果利用”。

2011年11月27日,項(xiàng)目組邀請(qǐng)廈門(mén)大學(xué)博士生導(dǎo)師,敦煌學(xué)專家曾 良教授作學(xué)術(shù)講座,講座題目是:“”。

2011年11月27日,項(xiàng)目組邀請(qǐng)湖南師范大學(xué)博士生導(dǎo)師,漢語(yǔ)史專家蔣冀騁教授作學(xué)術(shù)講座,講座題目是:“語(yǔ)感與訓(xùn)詁”。

2012年2月17日,項(xiàng)目組邀請(qǐng)安徽大學(xué)博士生導(dǎo)師,古文字學(xué)專家黃德寬教授作學(xué)術(shù)講座,講座題目是:“關(guān)于清華簡(jiǎn)《尹至》《尹誥》形成年代與性質(zhì)問(wèn)題”。

2013年1月13日,項(xiàng)目組邀請(qǐng)上海師范大學(xué)博士生導(dǎo)師,音韻學(xué)專家潘悟云教授作學(xué)術(shù)講座,講座題目是“漢語(yǔ)語(yǔ)料庫(kù)檢索系統(tǒng)設(shè)計(jì)”。

本項(xiàng)目組成員應(yīng)邀外出進(jìn)行學(xué)術(shù)講座(12場(chǎng))

2011年10月14日,本項(xiàng)目首席專家董志翹教授應(yīng)邀在北京大學(xué)中文系作了“關(guān)于‘名量式’復(fù)合詞的幾個(gè)問(wèn)題”的學(xué)術(shù)講座。

2011年9月15日,本項(xiàng)目子課題負(fù)責(zé)人黃征應(yīng)邀在西南大學(xué)漢語(yǔ)言文獻(xiàn)研究所,作了題為《敦煌語(yǔ)言文字學(xué)研究——敦煌俗語(yǔ)言學(xué)論綱》的學(xué)術(shù)講座。

2011年12月16日至18日,本項(xiàng)目首席專家董志翹教授應(yīng)邀在山東師范大學(xué)文學(xué)院、淮北師范大學(xué)文學(xué)院做了題為“回望與前瞻——新時(shí)期的漢語(yǔ)學(xué)習(xí)與應(yīng)用”的學(xué)術(shù)講座。

2012年9月17日,董志翹教授應(yīng)邀為南京信息工程大學(xué)作題為“知今必鑒古,無(wú)古不成今——從古代文獻(xiàn)中汲取科技創(chuàng)新的營(yíng)養(yǎng)”講座。

2012年10月9日,董志翹教授應(yīng)邀為浙江外國(guó)語(yǔ)學(xué)院人文學(xué)院作題為“表示過(guò)程、持續(xù)狀態(tài)的‘中’及其來(lái)源”的學(xué)術(shù)講座。

2012年11月27日,董志翹教授應(yīng)邀為西南大學(xué)文學(xué)院作題為“關(guān)于漢語(yǔ)‘名量式’復(fù)合詞的幾個(gè)問(wèn)題”的學(xué)術(shù)講座。

2012年11月28日,董志翹教授應(yīng)邀為重慶師范大學(xué)作題為“努力拓展學(xué)生視野,全面掌握古代漢語(yǔ)知識(shí)”的學(xué)術(shù)講座。

2012年11月29日,董志翹教授應(yīng)邀為四川外國(guó)語(yǔ)大學(xué)中文系作題為“略論漢語(yǔ)中的‘離合詞’”的學(xué)術(shù)講座。

2012年11月29日,董志翹教授應(yīng)邀為重慶師范大學(xué)文學(xué)院為研究生作“拓寬學(xué)術(shù)視野,全面掌握古代漢語(yǔ)知識(shí)”的報(bào)告。

2012年12月1日,董志翹教授應(yīng)邀為四川大學(xué)文學(xué)與新聞學(xué)院為研究生作“關(guān)于漢語(yǔ)名量式復(fù)合詞的幾個(gè)問(wèn)題”的報(bào)告。

2013年3月24日,董志翹教授應(yīng)邀為陜西師范大學(xué)文學(xué)院為研究生作“佛教對(duì)中土取名命字的影響”的學(xué)術(shù)報(bào)告。

2013年4月15日,董志翹教授應(yīng)邀為武漢大學(xué)文學(xué)院為教師、研究生作“佛教對(duì)中土取名命字的影響”的學(xué)術(shù)報(bào)告。

本項(xiàng)目組成員出席國(guó)際、全國(guó)重要學(xué)術(shù)會(huì)議(30人次)

2011年5月6—9日,本項(xiàng)目首席專家董志翹教授出席清華大學(xué)百年校慶西

南瀕危文字文獻(xiàn)研討會(huì),并主持會(huì)議發(fā)言。.

2011年8月12日,本項(xiàng)目組成員趙紅副教授出席由中國(guó)敦煌吐魯番學(xué)會(huì)等

單位主辦的“中國(guó)敦煌吐魯番學(xué)會(huì)理事會(huì)暨學(xué)術(shù)討論會(huì)”,并宣讀了論文“ 吐魯番出土文獻(xiàn)字詞零考”。

2011年8月20日—22日,本項(xiàng)目子課題負(fù)責(zé)人陳小荷教授及成員馮敏萱、

李斌、徐潤(rùn)華博士出席在河南洛陽(yáng)召開(kāi)的全國(guó)第十一屆計(jì)算語(yǔ)言學(xué)學(xué)術(shù)會(huì)議(CNCCL-2011)并在會(huì)議上報(bào)告論文4篇。

2011年8月23—28日,本項(xiàng)目首席專家、中國(guó)訓(xùn)詁學(xué)研究會(huì)副會(huì)長(zhǎng)董志翹

教授、本項(xiàng)目子課題負(fù)責(zé)人、中國(guó)訓(xùn)詁學(xué)研究會(huì)副秘書(shū)長(zhǎng)方向東教授出席在成都召開(kāi)的中國(guó)訓(xùn)詁學(xué)研究會(huì)及西南交通大學(xué)主辦的“2011年海峽兩岸文獻(xiàn)與方言研究學(xué)術(shù)研討會(huì)”報(bào)告了論文,董志翹教授作大會(huì)學(xué)術(shù)總結(jié)。

2011年12月4日至5日,本項(xiàng)目子課題負(fù)責(zé)人陳小荷教授及課題組成員曲

維光教授出席了在北京召開(kāi)的中國(guó)中文信息學(xué)會(huì)第七屆全國(guó)代表大會(huì)暨學(xué)會(huì)成立三十周年學(xué)術(shù)會(huì)議,陳小荷繼續(xù)當(dāng)選為理事。

2012年4月20日—24日,本項(xiàng)目首席專家董志翹教授出席由中國(guó)社會(huì)科學(xué)

院語(yǔ)言研究所、湖南師范大學(xué)文學(xué)院主辦的“第八屆中古漢語(yǔ)國(guó)際學(xué)術(shù)研討會(huì)”,并作大會(huì)主題報(bào)告“關(guān)于“見(jiàn)2V”句中“見(jiàn)”的詞性及功能”。本項(xiàng)目成員趙家棟副教授出席會(huì)議,并宣讀論文“《經(jīng)律異相》校讀札記”。

2012年4月27日—28日,本項(xiàng)目子課題負(fù)責(zé)人陳小荷教授作為教育部語(yǔ)信

司推薦的專家出席在廣西南寧召開(kāi)的聯(lián)合國(guó)教科文組織第十三屆國(guó)際母語(yǔ)日研討會(huì),在研討會(huì)上作了“關(guān)于漢語(yǔ)方言信息處理”的報(bào)告。

2012年5月25日,本項(xiàng)目子課題負(fù)責(zé)人黃征教授出席在日本東京召開(kāi)的“第

57回東方學(xué)會(huì)的國(guó)際研討會(huì)”,并作了題為“中國(guó)愿文與日本愿文比較研究”的大會(huì)報(bào)告。

2012年8月15日,項(xiàng)目組成員胡靜書(shū)講師出席了由中國(guó)社會(huì)科學(xué)院語(yǔ)言研

究所主辦的中國(guó)語(yǔ)言學(xué)會(huì)第十六屆學(xué)術(shù)年會(huì),提交和宣讀論文“害怕義到情態(tài)義:一個(gè)反復(fù)出現(xiàn)的詞義演變現(xiàn)象”。與會(huì)期間,調(diào)查了與中古漢語(yǔ)語(yǔ)法體系有關(guān)的研究動(dòng)態(tài)和成果,也咨詢了相關(guān)專家學(xué)者,本課題研究的價(jià)值和重要性得到同行專家的肯定,同時(shí)也獲得了對(duì)語(yǔ)法體系研究有益的意見(jiàn)和建議。

2012年9月10日,子項(xiàng)目負(fù)責(zé)人方向東教授出席在河南師范大學(xué)召開(kāi)的“中

國(guó)歷史文獻(xiàn)研究會(huì)第33屆年會(huì)”,同時(shí)了解文獻(xiàn)古籍?dāng)?shù)字化的相關(guān)信息和建設(shè)情況。

2012年10月8日—10日,本項(xiàng)目首席專家董志翹教授出席中國(guó)訓(xùn)詁學(xué)研究

會(huì)在浙江大學(xué)召開(kāi)的學(xué)術(shù)年會(huì),在會(huì)上作“日本的中古漢語(yǔ)詞匯研究”的主題報(bào)告。并再次當(dāng)選中國(guó)訓(xùn)詁學(xué)研究會(huì)副會(huì)長(zhǎng)。子項(xiàng)目負(fù)責(zé)人方向東教授亦出席會(huì)議,當(dāng)選為中國(guó)訓(xùn)詁學(xué)會(huì)常務(wù)理事。項(xiàng)目組成員趙家棟副教授同時(shí)出席會(huì)議,宣讀論文“敦煌寫(xiě)卷丑婦賦字詞校讀札記”。

2012年10月12日—16日,董志翹教授出席韓國(guó)交通大學(xué)(忠州)主辦的

“佛教文獻(xiàn)研究暨第六屆佛經(jīng)語(yǔ)言學(xué)國(guó)際學(xué)術(shù)研討會(huì)”,在會(huì)上作“佛教類書(shū)《經(jīng)律異相》的語(yǔ)料價(jià)值”的主題報(bào)告,并主持分組學(xué)術(shù)會(huì)議。子項(xiàng)目負(fù)責(zé)人化振紅教授同時(shí)出席會(huì)議。

2012年10月19日—21日,董志翹教授出席在揚(yáng)州大學(xué)召開(kāi)的國(guó)際漢語(yǔ)史研究會(huì)暨第十一屆全國(guó)古代漢語(yǔ)學(xué)術(shù)研討會(huì),在會(huì)上作 “努力拓展學(xué)生視野,全面掌握古代漢語(yǔ)知識(shí)”的主題報(bào)告。

2012年10月25日—28日,董志翹教授出席在江蘇師范大學(xué)召開(kāi)的“當(dāng)代語(yǔ)言科學(xué)創(chuàng)新與發(fā)展國(guó)際學(xué)術(shù)研討會(huì)暨《語(yǔ)言科學(xué)》創(chuàng)刊十周年慶典”,在會(huì)上作“加強(qiáng)漢語(yǔ)史語(yǔ)料庫(kù)建設(shè),促進(jìn)漢語(yǔ)史研究的現(xiàn)代化”學(xué)術(shù)報(bào)告,具體介紹了本項(xiàng)目建設(shè)目標(biāo)、具體功能以及目前進(jìn)展情況,引起與會(huì)者的關(guān)注并給予高度評(píng)價(jià)。

2012年10月30日—11月4日,項(xiàng)目組成員趙家棟副教授、胡靜書(shū)講師出席在安徽師范大學(xué)召開(kāi)的“近代漢語(yǔ)學(xué)術(shù)研討會(huì)”,趙家棟在會(huì)上宣讀論文“敦煌文獻(xiàn)疑難字詞考辨五則”,胡靜書(shū)在會(huì)上宣讀了論文“論‘勿’的沒(méi)有義用法”。并在會(huì)上介紹了本項(xiàng)目的進(jìn)展情況,與相關(guān)與會(huì)者交流了經(jīng)驗(yàn)。

2012年11月5日,項(xiàng)目組成員趙紅副教授出席了在徐州召開(kāi)的“江蘇省語(yǔ)言學(xué)學(xué)術(shù)年會(huì)”,在會(huì)上宣讀了論文“基于中古漢語(yǔ)語(yǔ)料庫(kù)建設(shè)的若干思考”,論文提出,中古漢語(yǔ)熟語(yǔ)料庫(kù)建設(shè)不能僅僅滿足于古文獻(xiàn)的收錄,還應(yīng)該保留普遍存在于傳世文獻(xiàn)和出土文獻(xiàn)當(dāng)中的諸多異文,實(shí)現(xiàn)異文自動(dòng)檢索、自動(dòng)發(fā)現(xiàn)。針對(duì)吐魯番出土文獻(xiàn)眾多的異體字,還應(yīng)通過(guò)鏈接等技術(shù)手段保留原字形,進(jìn)行考釋意見(jiàn)的標(biāo)注關(guān)聯(lián)及文字屬性的標(biāo)注。通過(guò)采用通用置標(biāo)語(yǔ)言,實(shí)現(xiàn)語(yǔ)料共享,避免重復(fù)建設(shè)而產(chǎn)生的資源浪費(fèi)。該論文引起了與會(huì)學(xué)者的較大興趣。學(xué)者們紛紛肯定了語(yǔ)料庫(kù)建設(shè)的重要價(jià)值,同時(shí)也對(duì)感興趣的問(wèn)題進(jìn)行了咨詢,并提出了建議;一些目前正在進(jìn)行相關(guān)研究以及準(zhǔn)備進(jìn)行相關(guān)研究的學(xué)者們還與論文作者在會(huì)下進(jìn)行了熱烈的討論。

2012年12月6日——12日,董志翹教授出席“古代東亞諸國(guó)變格漢文研究”國(guó)際學(xué)術(shù)研討會(huì)(日本東京駒澤大學(xué)),在會(huì)上作“唐宋時(shí)期來(lái)華日本僧人著述中的變格漢文”的主題報(bào)告。

2013年3月22日—3月25日,董志翹教授出席“命名學(xué)首屆國(guó)際學(xué)術(shù)會(huì)”

(陜西省國(guó)際文化經(jīng)濟(jì)交流中心、西安武警工程學(xué)院主辦),任華東組組長(zhǎng),作“佛教對(duì)中土取名命字的影響”的學(xué)術(shù)報(bào)告。

2013年4月12日—4月15日,出席“《漢語(yǔ)大詞典》第二版修訂會(huì)議”(上

海漢語(yǔ)大詞典編纂處、辭書(shū)出版社主辦,武漢大學(xué)文學(xué)院承辦),在會(huì)上作“《漢語(yǔ)大詞典》(第二版)修訂方案讀后”的報(bào)告,

2013年 7 月 10-14 日,在山東煙臺(tái)出席“《漢語(yǔ)大詞典》第二版修訂工作

會(huì)議”(《漢語(yǔ)大詞典編纂處、上海辭書(shū)出版社主辦,魯東大學(xué)承辦),在會(huì)上作“中中古漢語(yǔ)研究語(yǔ)料庫(kù)與《漢語(yǔ)大詞典》(第二版)修訂”的報(bào)告。

(五)國(guó)際交流:

2012年1月始,項(xiàng)目首席專家董志翹教授應(yīng)邀參加日本東京駒澤大學(xué)佛教研究所主持的國(guó)際合作項(xiàng)目“東亞諸國(guó)漢語(yǔ)變格研究”的研究工作,該項(xiàng)目由日本國(guó)文部省立項(xiàng),2012年——2015年,項(xiàng)目組由5名日本學(xué)者、1名中國(guó)學(xué)者、2名韓國(guó)學(xué)者組成。中、日、韓三國(guó)語(yǔ)言接觸的研究對(duì)于漢語(yǔ)史研究將是一個(gè)很大的促進(jìn)。項(xiàng)目研究期間,每年赴日本1-2次進(jìn)行共同研究。

三、成果宣傳推介情況

(一)尚未舉行專門(mén)的成果發(fā)布會(huì)。但多次在國(guó)際、全國(guó)學(xué)術(shù)會(huì)議上介紹推薦過(guò)本項(xiàng)目成果(見(jiàn)前參加學(xué)術(shù)會(huì)議部分)在南京師范大學(xué)召開(kāi)的“深加工中古漢語(yǔ)語(yǔ)料庫(kù)”前期成果專家評(píng)估會(huì)上,本項(xiàng)目前期成果也作了宣傳介紹、演示。

(二)2011年上半年、下半年分別向國(guó)家社科基金辦、省社科基金辦報(bào)送了《工作簡(jiǎn)報(bào)》(一)(二)兩期,2012年(三)(四)兩期《工作》簡(jiǎn)報(bào)材料都已準(zhǔn)備好,但6月份適遇年中檢查,項(xiàng)目研究進(jìn)展情況均通過(guò)填表形式報(bào)送;12月份又遇年終檢查,項(xiàng)目研究進(jìn)展情況又通過(guò)填表形式報(bào)送。2013年上半年的《工作簡(jiǎn)報(bào)》正準(zhǔn)備編集,又要進(jìn)行項(xiàng)目中期評(píng)估,項(xiàng)目研究進(jìn)展情況又只能通過(guò)填表報(bào)送。(因?yàn)椤豆ぷ骱?jiǎn)報(bào)》內(nèi)容基本與檢查、評(píng)估表相同,如果另外再印一份《簡(jiǎn)報(bào)》,不僅浪費(fèi),也給相關(guān)部門(mén)增加負(fù)擔(dān)。我們是這樣理解的。)

(三)2012年9月,本項(xiàng)目首席專家董志翹教授接受了《中國(guó)社會(huì)科學(xué)報(bào)》

記者聞錚的書(shū)面采訪,對(duì)于漢語(yǔ)語(yǔ)料庫(kù)建設(shè)的意義以及高校將重大研究項(xiàng)目的進(jìn)行與人才培養(yǎng)緊密結(jié)合的做法作了闡述(分六個(gè)方面形成5000多字的文章交稿),相關(guān)內(nèi)容見(jiàn)《中國(guó)社會(huì)科學(xué)報(bào)》2012年9月20日“社科基金?蔽恼隆按蛟煨畔r(shí)代的學(xué)術(shù)利器——近年來(lái)國(guó)家社科基金資助數(shù)據(jù)庫(kù)建設(shè)與研究進(jìn)展”: “引領(lǐng)人文社科新發(fā)展: 數(shù)據(jù)庫(kù)技術(shù)的誕生和發(fā)展不僅帶來(lái)了計(jì)算機(jī)信息管理的巨大革命,而且給人文社會(huì)科學(xué)發(fā)展注入了新的活力,有力促進(jìn)了現(xiàn)代學(xué)術(shù)體系和研究范式的建立。在社會(huì)科學(xué)領(lǐng)域,數(shù)據(jù)庫(kù)在經(jīng)濟(jì)學(xué)、人口學(xué)、社會(huì)學(xué)等學(xué)科領(lǐng)域的重要作用已是顯見(jiàn)的事實(shí);在文史哲等人文科學(xué)領(lǐng)域,加快文獻(xiàn)數(shù)字化、推動(dòng)研究型資料庫(kù)建設(shè)的重要性、緊迫性也已成為學(xué)界共識(shí)。基于這一背景,加大資料庫(kù)建設(shè)支持力度、推進(jìn)學(xué)科信息化基礎(chǔ)建設(shè)就成為國(guó)家社科基金立項(xiàng)資助的重要考量。

以語(yǔ)言學(xué)為例,僅2010—2011年就有4個(gè)重大項(xiàng)目涉及資料庫(kù)建設(shè)與研究,涵蓋從漢語(yǔ)史語(yǔ)料庫(kù)到民族語(yǔ)言語(yǔ)法標(biāo)注文本,從出土古文獻(xiàn)語(yǔ)料庫(kù)到英漢平行語(yǔ)料庫(kù)等不同研究領(lǐng)域,體現(xiàn)了語(yǔ)言學(xué)研究的最新進(jìn)展和前沿趨勢(shì)。正如“漢語(yǔ)史語(yǔ)料庫(kù)建設(shè)研究”項(xiàng)目首席專家、南京師范大學(xué)教授董志翹所言,語(yǔ)料庫(kù)建設(shè)是為語(yǔ)言學(xué)、文獻(xiàn)學(xué)、辭書(shū)編纂學(xué)的深入系統(tǒng)研究服務(wù)的一項(xiàng)基礎(chǔ)建設(shè),而語(yǔ)料庫(kù)語(yǔ)言學(xué)則是當(dāng)前語(yǔ)言研究的主流。據(jù)他介紹,目前國(guó)內(nèi)已建成的語(yǔ)料庫(kù)中,現(xiàn)代漢語(yǔ)語(yǔ)料庫(kù)占80%以上,且多為生語(yǔ)料庫(kù)。因此,國(guó)家社科基金項(xiàng)目對(duì)中古漢語(yǔ)、出土古文獻(xiàn)的語(yǔ)料庫(kù)建設(shè)在很大程度上具有填補(bǔ)空白的意義。”

因?yàn)椤吨袊?guó)社會(huì)科學(xué)報(bào)》是采取綜合報(bào)道形式,所以,董志翹教授所撰“加強(qiáng)漢語(yǔ)史語(yǔ)料庫(kù)建設(shè),促進(jìn)漢語(yǔ)史研究手段的現(xiàn)代化”一文由《西南大學(xué)學(xué)報(bào)》全文發(fā)表。 

代表性成果:

1. 自主開(kāi)發(fā)研制成功“中古漢語(yǔ)語(yǔ)料庫(kù)綜合檢索系統(tǒng)(第三版)”(曲維光教授、付佳博士):該系統(tǒng)在VS2010平臺(tái)上開(kāi)發(fā),編程語(yǔ)言C#,數(shù)據(jù)庫(kù)是Sql Server 2008.系統(tǒng)主要包括以下幾個(gè)功能模塊:

不帶義項(xiàng)的查詢,根據(jù)書(shū)名、詞、詞類、語(yǔ)法功能等條件進(jìn)行查詢。

帶義項(xiàng)的查詢, 根據(jù)書(shū)名、詞、義項(xiàng)、詞類、語(yǔ)法功能等條件進(jìn)行查詢。

書(shū)籍對(duì)比查詢,先選定兩本要比較的書(shū)籍,然后根據(jù)詞、詞類、語(yǔ)法功能等條件進(jìn)行查詢,查詢結(jié)果以對(duì)比形式呈現(xiàn)。

字詞組合查詢,允許查詢條件中出現(xiàn)若干個(gè)字詞的邏輯組合(與、或、非)。

疑難字查詢,輸入疑難字編號(hào),輸出對(duì)應(yīng)的疑難字圖片。

語(yǔ)料庫(kù)建設(shè)者與語(yǔ)料庫(kù)使用者互動(dòng)平臺(tái)。

2.版本異文自動(dòng)發(fā)現(xiàn)的研究(陳小荷教授),針對(duì)中古漢語(yǔ)語(yǔ)料改進(jìn)了算法,速度更快、異文定位更加準(zhǔn)確。這種新穎的版本異文發(fā)現(xiàn)算法的基本思想是通過(guò)“同文”搜索為異文發(fā)現(xiàn)提供可靠的錨點(diǎn)序列,然后在在兩錨點(diǎn)之間的未匹配文本中查找異文。新算法的特點(diǎn)是:用PAT數(shù)組作為索引結(jié)構(gòu)以加快同文搜索的速度;用全局雙序列比對(duì)算法準(zhǔn)確定位異文。我們用這個(gè)算法處理《論衡》的兩個(gè)電子版本各20萬(wàn)字,在普通臺(tái)式機(jī)上僅用546毫秒即處理完畢,發(fā)現(xiàn)異文1929種、7390次,無(wú)一遺漏。論文《同文搜索與序列比對(duì)相結(jié)合的版本異文發(fā)現(xiàn)算法》已投稿。

3.中古漢語(yǔ)語(yǔ)料庫(kù)為《漢語(yǔ)大詞典》(第二版)修訂作出貢獻(xiàn)。2012年12月10日,國(guó)家重大文化工程《漢語(yǔ)大詞典》(第二版)編輯出版啟動(dòng)大會(huì)在北京人民大會(huì)堂召開(kāi)。全國(guó)人大副委員長(zhǎng)、《漢語(yǔ)大詞典》(第二版)主編華建敏,新聞出版總署署長(zhǎng)、《漢語(yǔ)大詞典》(第二版)工委會(huì)主任柳斌杰,教育部副部長(zhǎng)、國(guó)家語(yǔ)委主任、《漢語(yǔ)大詞典》(第二版)工委會(huì)副主任李衛(wèi)紅,中共上海市委常委、宣傳部長(zhǎng)、《漢語(yǔ)大詞典》(第二版)工委會(huì)副主任楊震武出席會(huì)議并講話,《漢語(yǔ)大詞典》(第二版)學(xué)術(shù)顧問(wèn)委員會(huì)、編纂委員會(huì)的專家學(xué)者出席會(huì)議。

本項(xiàng)目首席專家董志翹應(yīng)邀擔(dān)任編纂委員及分冊(cè)主編。在2013年4月12日武漢召開(kāi)的“《漢語(yǔ)大詞典》(第二版)編纂出版學(xué)術(shù)研討會(huì)”上,董志翹作了長(zhǎng)篇發(fā)言,指出:“《漢語(yǔ)大詞典》(第一版)在收詞、分項(xiàng)、釋義、引證方面存在的最大問(wèn)題是較少利用中古漢語(yǔ)、近代漢語(yǔ)及出土文獻(xiàn)材料。而近30年來(lái),中古、近代漢語(yǔ)及出土文獻(xiàn)語(yǔ)言研究成果大量涌現(xiàn),必須廣泛收集,合理利用。同時(shí),要與時(shí)俱進(jìn),在編纂方法手段上要有突破,要充分運(yùn)用現(xiàn)代計(jì)算機(jī)、互聯(lián)網(wǎng)和語(yǔ)料庫(kù)技術(shù),特別是要充分調(diào)查和利用《漢語(yǔ)大詞典》(第一版)有關(guān)數(shù)據(jù)庫(kù),來(lái)提高第二版編纂工作的質(zhì)量和進(jìn)度。而我們目前承擔(dān)的國(guó)家社科重大招標(biāo)項(xiàng)目“漢語(yǔ)史語(yǔ)料庫(kù)建設(shè)研究”,已經(jīng)研制了《漢語(yǔ)大詞典》(第一版)全文數(shù)據(jù)庫(kù),同時(shí)目前在建的中古漢語(yǔ)語(yǔ)料庫(kù)正可以為《漢語(yǔ)大詞典》(第二版)的編纂提供有力支撐!边@一意見(jiàn)得到了與會(huì)領(lǐng)導(dǎo)與主編人員的高度重視。

2013年7月10日,董志翹教授作為主編特別提名的中古漢語(yǔ)專家應(yīng)邀出席在山東煙臺(tái)召開(kāi)的“《漢語(yǔ)大詞典》(第二版)編纂出版工作會(huì)議”,具體討論了利用我們重大招標(biāo)項(xiàng)目階段成果為《漢語(yǔ)大詞典》(第二版)編纂工作服務(wù)的相關(guān)問(wèn)題。目前,我們已經(jīng)為《漢語(yǔ)大詞典》(第二版)提供了中古漢語(yǔ)核心復(fù)音詞詞表(10000詞條),并通過(guò)通過(guò)正在建設(shè)的漢語(yǔ)史語(yǔ)料庫(kù)的調(diào)查分析,提出建議增收中古漢語(yǔ)新詞條5040條,提供相關(guān)釋義、書(shū)證材料110萬(wàn)字。我們研制的《漢語(yǔ)大詞典》(第一版)全文數(shù)據(jù)庫(kù),也將為第一版的相關(guān)問(wèn)題的核查、研究提供快捷準(zhǔn)確的手段。同時(shí),在具體修訂編寫(xiě)過(guò)程中,我們的漢語(yǔ)史語(yǔ)料庫(kù)還將發(fā)揮更大的作用。

4.董志翹教授結(jié)合本項(xiàng)目研究所指導(dǎo)的兩篇博士論文(2012屆周超《(劉)宋詩(shī)詞匯研究》、2013屆張俊之《二王雜帖詞匯研究》)通過(guò)制作《(劉)宋詩(shī)》、《二王雜帖》數(shù)據(jù)庫(kù),采用計(jì)量詞匯研究的方法進(jìn)行,因材料扎實(shí),方法得當(dāng),頗多創(chuàng)新,均順利通過(guò)答辯,獲得“優(yōu)秀”等級(jí)。

階段性成果清單:

序號(hào)

成果名稱

作者

成果

形式

刊物、出版社名稱及刊發(fā)、出版時(shí)間

字?jǐn)?shù)

轉(zhuǎn)載、引用、獲獎(jiǎng)等情況

1

同源詞研究與漢語(yǔ)辭書(shū)編纂

董志翹

論文

《語(yǔ)言研究》2010年1期

1.2萬(wàn)

2012年10月獲江蘇省社科優(yōu)秀成果二等獎(jiǎng)

2

敦煌寫(xiě)本《啟顏錄》箋注

董志翹

論文

《西南民族大學(xué)學(xué)報(bào)》2012年3期

1萬(wàn)

CSSCI收錄,下載頻次61

3

逯欽立《先秦漢魏晉南北朝詩(shī)》校釋舉誤

周  超

論文

《圖書(shū)館理論與實(shí)踐》2012年4期

0.6萬(wàn)

CSSCI收錄,載頻次30

4

敦煌詩(shī)歌語(yǔ)詞釋證

趙家棟

董志翹

論文

《貴州師范大學(xué)學(xué)報(bào)》2012年1期

0.6萬(wàn)

CSSCI收錄,下載頻次69

5

敦煌文獻(xiàn)中并不存在量詞“笙”

趙家棟

董志翹

論文

《語(yǔ)言科學(xué)》

2012年第4期

0.5萬(wàn)

CSSCI收錄,下載頻次22

6

《經(jīng)律異相》(5-11卷)校讀札記

趙家棟

董志翹

論文

《南京師范大學(xué)文學(xué)院學(xué)報(bào)》

2012年第3期

0.4萬(wàn)

CSSCI收錄,下載頻次4

7

敦煌碑銘贊語(yǔ)詞釋證

趙家棟

論文

《敦煌研究》

2012年第4期

0.6萬(wàn)

 

8

唐代佛寺所在考異二則

趙家棟

付義琴

論文

《湖南科技大學(xué)學(xué)報(bào)》2012年1期

0.4萬(wàn)

下載頻次32

9

從語(yǔ)法史角度看“一元?jiǎng)釉~帶賓句”現(xiàn)象

付義琴

論文

《外語(yǔ)學(xué)刊》2012年2期

0.45萬(wàn)

CSSCI收錄,下載頻次32

10

賓語(yǔ)前數(shù)量詞隱現(xiàn)的篇章分析

付義琴

趙家棟

論文

《華文教學(xué)與研究》2012年第3期

0.6萬(wàn)

CSSCI收錄

11

二王雜帖釋文訂正四例

張俊之

論文

《東岳論叢》

2012年4期

0.4萬(wàn)

CSSCI收錄,下載頻次22

12

“憂”是傷心事嗎

張俊之

論文

《語(yǔ)文建設(shè)》

2012年6期

0.4萬(wàn)

CSSCI收錄,下載頻次32

13

南北朝時(shí)期漢語(yǔ)詞匯的南北差異研究

李  麗

論文

《西南交通大學(xué)學(xué)報(bào)》

2012年4期

0.6萬(wàn)

CSSCI收錄,下載頻次12

14

《〈大字典〉疑難字考辨六則》

趙家棟

論文

《漢字文化》

2012年2期

0.15萬(wàn)

CSSCI收錄

下載頻次9

15

Analysis of the Diffusion Process of Buddhist Vocabulary from Memoirs of Eminent Monks

化振紅

論文

Cross-Cultural Communication

Vol.8,No.5,2012

0.8萬(wàn)

 

16

經(jīng)典古籍注疏文獻(xiàn)的知識(shí)網(wǎng)絡(luò)研究與設(shè)計(jì)

馬創(chuàng)新

陳小荷

曲維光

論文

圖書(shū)情報(bào)工作

第57卷第9期

2013年5月《

0.9萬(wàn)

 

17

基于學(xué)科本體的訓(xùn)詁學(xué)知識(shí)組織體系初步構(gòu)建

馬創(chuàng)新

陳小荷

論文

圖書(shū)情報(bào)工作》

第57卷第12期

2013年6月

0.9萬(wàn)

 

16

加強(qiáng)漢語(yǔ)史語(yǔ)料庫(kù)建設(shè),促進(jìn)漢語(yǔ)史研究手段的現(xiàn)代化

董志翹

論文

《西南大學(xué)學(xué)報(bào)》2013年待發(fā)

1萬(wàn)

CSSCI收錄

17

深加工中古漢語(yǔ)語(yǔ)料庫(kù)建設(shè)若干問(wèn)題的思考

化振紅

汪  祎

論文

《西南大學(xué)學(xué)報(bào)》2013年待發(fā)

0.8萬(wàn)

CSSCI收錄

18

同文搜索與序列比對(duì)相結(jié)合的異文發(fā)現(xiàn)算法

陳小荷

論文

《西南大學(xué)學(xué)報(bào)》2013年待發(fā)

0.7萬(wàn)

CSSCI收錄

19

從信息處理角度考察察各類中古漢語(yǔ)語(yǔ)料的特點(diǎn)

陳小荷

研究報(bào)告

 

0.24萬(wàn)

 

20

中古漢語(yǔ)語(yǔ)料檢索系統(tǒng)(第二版)

曲維光

付  佳

研究報(bào)告

軟件

 

0.4萬(wàn)

 

21

詞性標(biāo)注研究

馮敏萱

徐潤(rùn)華

研究報(bào)告

 

0.48萬(wàn)

 

22

中古漢語(yǔ)自動(dòng)分詞訓(xùn)練庫(kù)簡(jiǎn)要說(shuō)明

梁社會(huì)

研究報(bào)告

 

0.11萬(wàn)

 

23

中古漢語(yǔ)自動(dòng)分詞軟件(升級(jí)版)

李  斌

軟件

 

 

 

(課題組供稿)
(責(zé)編:趙晶)
RM新时代APP官网