一、 研究計(jì)劃總體執(zhí)行情況及各子課題進(jìn)展情況
本項(xiàng)目于2010年12月27日獲國(guó)家社科基金辦批準(zhǔn)立項(xiàng),立項(xiàng)后召集課題組全體人員根據(jù)國(guó)家社科基金辦反饋的“第17組綜合評(píng)價(jià)意見(jiàn)”(即對(duì)本項(xiàng)目的專家意見(jiàn)),就專家組提出的“縮小課題范圍,只做中古漢語(yǔ)語(yǔ)料庫(kù),集中力量將中古漢語(yǔ)語(yǔ)料庫(kù)做精做好。加強(qiáng)語(yǔ)料庫(kù)建設(shè)相關(guān)理論研究”等意見(jiàn)重新填寫(xiě)了項(xiàng)目的目標(biāo)任務(wù)書(shū)并得到國(guó)家社科基金辦的批準(zhǔn)。
項(xiàng)目的最終目標(biāo)是:在五年建設(shè)期間,1.建成國(guó)內(nèi)首個(gè)可用于漢語(yǔ)史研究的由多個(gè)子庫(kù)組成的收錄原始語(yǔ)料1000萬(wàn)字,庫(kù)容1600萬(wàn)字的具有多集合特點(diǎn)的深加工中古漢語(yǔ)語(yǔ)料庫(kù)(內(nèi)容上是中古漢語(yǔ)代表性語(yǔ)料的集合,結(jié)構(gòu)上是校勘庫(kù)、義項(xiàng)庫(kù)、語(yǔ)法庫(kù)等多庫(kù)的集合,功能上是自動(dòng)分詞軟件、自動(dòng)標(biāo)注軟件、檢索系統(tǒng)軟件等多種功能軟件的集合。為漢語(yǔ)史語(yǔ)料庫(kù)的建設(shè)作一些理論上的探討及實(shí)踐上的嘗試,為漢語(yǔ)史研究(特別是中古漢語(yǔ)史的研究),提供一個(gè)比較實(shí)用的操作平臺(tái)。2.在中古漢語(yǔ)語(yǔ)法體系、中古漢語(yǔ)詞匯系統(tǒng)、中古漢語(yǔ)語(yǔ)料庫(kù)建設(shè)理論研究方面有所突破,產(chǎn)生相關(guān)的指導(dǎo)性理論論著。3.研制出“中古漢語(yǔ)語(yǔ)料庫(kù)檢索系統(tǒng)”、 “中古漢語(yǔ)自動(dòng)分詞系統(tǒng)”、“中古漢語(yǔ)詞義自動(dòng)標(biāo)注系統(tǒng)”“ 、“中古漢語(yǔ)異文發(fā)現(xiàn)軟件”等一系列相關(guān)軟件。
自項(xiàng)目開(kāi)題至今(2011.4—2013.7),已經(jīng)經(jīng)過(guò)了兩年半時(shí)間,項(xiàng)目研究時(shí)間
(2010.12—2015.12)過(guò)半,我們嚴(yán)格按照原訂計(jì)劃,總體進(jìn)展順利,目前已經(jīng)完成全部任務(wù)的三分之二(某些方面在原計(jì)劃的基礎(chǔ)上作了較大規(guī)模拓展)。具體表現(xiàn)在: 入庫(kù)語(yǔ)料至2013年9月8月底全部完成?保òǔ跣、終校),字?jǐn)?shù)超過(guò)原來(lái)規(guī)劃的1000萬(wàn)字(除原計(jì)劃1000萬(wàn)字傳世文獻(xiàn)語(yǔ)料校勘入庫(kù)外,根據(jù)專家建議,新增加了近100萬(wàn)字出土文獻(xiàn)語(yǔ)料,同時(shí),增加了繁體電子版佛經(jīng)語(yǔ)料7億多字,大大超過(guò)原庫(kù)量)。語(yǔ)料的人工深加工(分詞、語(yǔ)義、語(yǔ)法、文字標(biāo)注)已經(jīng)完成145萬(wàn)字(并經(jīng)三次復(fù)核),為自動(dòng)分詞、標(biāo)注軟件提供了可靠記憶樣本,目前已進(jìn)入機(jī)器自動(dòng)分詞、標(biāo)注(再人工核對(duì))階段,工作進(jìn)度已大大加快!罢Z(yǔ)義庫(kù)”、“語(yǔ)法庫(kù)”、“異文庫(kù)”均已建成。?原來(lái)確定的兩個(gè)理論研究課題“中古漢語(yǔ)構(gòu)詞法與造詞法研究”、 “中古漢語(yǔ)語(yǔ)法體系研究”亦按計(jì)劃進(jìn)行,目前已接近完成。同時(shí),新增了“長(zhǎng)沙走馬樓三國(guó)吳簡(jiǎn)詞匯計(jì)量研究”、“漢魏石刻資料詞匯計(jì)量研究”兩個(gè)出土文獻(xiàn)詞匯研究的理論課題,目前順利進(jìn)行。?語(yǔ)料庫(kù)的各種相關(guān)軟件(“中古漢語(yǔ)語(yǔ)料庫(kù)語(yǔ)料檢索系統(tǒng)”、“中古漢語(yǔ)自動(dòng)分詞軟件”、“漢語(yǔ)自動(dòng)語(yǔ)義標(biāo)注軟件”、“ 版本異文自動(dòng)發(fā)現(xiàn)軟件”)已經(jīng)自主研制開(kāi)發(fā)成功,經(jīng)過(guò)反復(fù)運(yùn)用調(diào)試,都已進(jìn)入第三版,目前正實(shí)際運(yùn)用中進(jìn)一步完善提高。
四個(gè)子項(xiàng)目的具體進(jìn)展情況如下:
(一)“深加工中古漢語(yǔ)語(yǔ)料庫(kù)語(yǔ)料鑒別與整理研究”子項(xiàng)目(負(fù)責(zé)人:方向東教授)
按照計(jì)劃書(shū)研究?jī)?nèi)容和研究方法進(jìn)行,將須入庫(kù)的中古語(yǔ)料先進(jìn)行版本的確定和?,已完成《殷蕓小說(shuō)》、《論衡》、《南齊書(shū)》、《宋書(shū)》、《梁書(shū)》、《抱樸子》、《三國(guó)志》、《世說(shuō)新語(yǔ)》、《后漢書(shū)》、《齊民要術(shù)》、《水經(jīng)注》、《顏氏家訓(xùn)》、《北齊書(shū)》、《搜神記》、《列子》、《先秦漢魏晉南北朝詩(shī)》的版本調(diào)查工作,并撰寫(xiě)了調(diào)查報(bào)告;采取課題組參與者分頭分工把關(guān)的原則,將確定的中古文獻(xiàn)語(yǔ)料分課題組成員校勘。目前完成進(jìn)度如下:《后漢書(shū)》(179.4萬(wàn))《洛陽(yáng)伽藍(lán)記》(5.7萬(wàn))《水經(jīng)注》(40萬(wàn))《神仙傳》(3.8萬(wàn))《魏書(shū)》(140萬(wàn))《幽明錄》《冥祥記》(合計(jì)8萬(wàn))《陳書(shū)》《周書(shū)》(合計(jì)51萬(wàn))《論衡校釋》(90萬(wàn))《三國(guó)志》(85萬(wàn))《北史》(44萬(wàn))《北齊書(shū)》(28萬(wàn))《南齊書(shū)》(35萬(wàn))《梁書(shū)》(35萬(wàn))《南史》(80萬(wàn))17部文獻(xiàn)語(yǔ)料共計(jì)914.9萬(wàn)字,初校工作已于2012年8月份全部完成。
至2013年7月底,已完成終校的文獻(xiàn)是:《后漢書(shū)》(周燕飛初校,曹紅軍、謝秉洪教授負(fù)責(zé)終校),《洛陽(yáng)伽藍(lán)記》《神仙傳》(李玉嬌、李慧娟初校,王鍔教授負(fù)責(zé)終校),《魏書(shū)》(魏慶彬初校,王鍔教授負(fù)責(zé)終校),《梁書(shū)》(景紅緯初校,王鍔教授負(fù)責(zé)終校),《南齊書(shū)》(顧言初校,方向東教授負(fù)責(zé)終校)《陳書(shū)》(李衛(wèi)衛(wèi)初校,方向東教授負(fù)責(zé)終校)《南史》(朱娜娜初校,方向東教授負(fù)責(zé)終校)《幽明錄》《冥祥記》(葉國(guó)盛初校,方向東教授負(fù)責(zé)終校),合計(jì)542.9萬(wàn)字的終校工作完成。
即將完成的有:《三國(guó)志》(朱珠初校,謝秉洪教授負(fù)責(zé)終校),《論衡校釋》(蔡玉英初校,曹紅軍教授負(fù)責(zé)終校),《水經(jīng)注》(王勇初校,吳新江教授負(fù)責(zé)終校),《北齊書(shū)》(易雪丹初校,吳新江教授負(fù)責(zé)終校),《北史》(吳婷、申阜鑫、郭林初校,吳新江教授負(fù)責(zé)終校),《周書(shū)》(李衛(wèi)衛(wèi)初校,吳新江教授負(fù)責(zé)終校),合計(jì)323萬(wàn)字。此項(xiàng)工作目前正利用暑假時(shí)間作最后沖刺,全部終校工作將在2013年8月底完成。
另外又增加100萬(wàn)字的出土文獻(xiàn)語(yǔ)料(吐魯番文獻(xiàn)、長(zhǎng)沙走馬樓三國(guó)吳簡(jiǎn)、漢魏南北朝石刻資料),該項(xiàng)語(yǔ)料由“深加工中古漢語(yǔ)語(yǔ)料庫(kù)理論研究”子項(xiàng)目組成員負(fù)責(zé)錄入?保壳耙惨淹瓿。
也即是說(shuō),至2013年8月底,該子項(xiàng)目的預(yù)定任務(wù)已經(jīng)圓滿完成,今后的工作是對(duì)將來(lái)臨時(shí)增加的語(yǔ)料進(jìn)行?。
(二)“深加工中古漢語(yǔ)語(yǔ)料庫(kù)建設(shè)研究”子項(xiàng)目(負(fù)責(zé)人:化振紅教授)
該子項(xiàng)目組自2012年年終檢查至今主要完成以下工作:
修訂義項(xiàng)庫(kù)(化振紅教授、汪祎博士):針對(duì)原有的中古詞語(yǔ)義項(xiàng)數(shù)據(jù)庫(kù)中收詞數(shù)量不足、義項(xiàng)不全、詞條和義項(xiàng)交叉、多義詞處理不當(dāng)?shù)热毕,重新進(jìn)行了校對(duì)、整理,截至目前,新修訂的義項(xiàng)庫(kù)詞條總數(shù)共483,432條,全部完成了人工校對(duì)工作并投入使用。(并結(jié)合“義項(xiàng)庫(kù)”的建設(shè),建立了《漢語(yǔ)大詞典》數(shù)據(jù)庫(kù))
建立異體字、疑難字庫(kù)(趙家棟副教授):針對(duì)中古語(yǔ)料中極為普遍的特殊用字現(xiàn)象,建立了專門(mén)的中古漢語(yǔ)語(yǔ)料庫(kù)異體字?jǐn)?shù)據(jù)庫(kù),收入各體漢字3700個(gè)左右,基本解決了現(xiàn)階段語(yǔ)料切分、標(biāo)注以及未來(lái)的詞語(yǔ)檢索過(guò)程中的字體轉(zhuǎn)換問(wèn)題,部分解決了數(shù)據(jù)庫(kù)中疑難字的顯示問(wèn)題。下一階段,將大量收入中古漢語(yǔ)疑難字,建立與系統(tǒng)檢索軟件完全匹配的中古漢語(yǔ)語(yǔ)料庫(kù)疑難字庫(kù)。兩個(gè)字庫(kù)繼續(xù)升級(jí)、最終合并之后,可望完全解決整個(gè)數(shù)據(jù)庫(kù)的檢索、顯示等問(wèn)題。
語(yǔ)料標(biāo)注(化振紅教授負(fù)責(zé)組織全體教師、博士):繼續(xù)進(jìn)行了語(yǔ)料的人工切分、標(biāo)注工作,提供了更多的人工切分、標(biāo)注樣本。從2012年12月年檢截止目前,新增人工切分、標(biāo)注樣本約59萬(wàn)字,累計(jì)完成人工標(biāo)注樣本145萬(wàn)字左右。初步實(shí)現(xiàn)了改進(jìn)后的義項(xiàng)庫(kù)、人工標(biāo)注樣本與電腦切詞及標(biāo)注軟件的對(duì)接,對(duì)程序軟件標(biāo)注的語(yǔ)料樣本正在進(jìn)行評(píng)估、調(diào)研,提高程序軟件切詞、標(biāo)注的正確率,目前的切詞、標(biāo)注的一次正確率達(dá)到75%左右,新一輪的調(diào)試正利用暑假緊張進(jìn)行,9月初正式進(jìn)入程序軟件操作為主、人工校對(duì)為輔的切詞、標(biāo)注階段。屆時(shí),語(yǔ)料切詞、標(biāo)注進(jìn)度將大大加快。
(三)“深加工中古漢語(yǔ)語(yǔ)料庫(kù)理論研究”子項(xiàng)目(負(fù)責(zé)人:黃 征教授)
該子項(xiàng)目包括四個(gè)理論研究課題及一個(gè)吐魯番出土文獻(xiàn)整理課題:
中古漢語(yǔ)構(gòu)詞法與造詞法研究(劉杰博士):該項(xiàng)研究的主要內(nèi)容包括適應(yīng)中文信息處理的中古漢語(yǔ)復(fù)音詞的鑒別與界定、構(gòu)成特點(diǎn)與生成特點(diǎn)、發(fā)展趨勢(shì)及計(jì)量研究等內(nèi)容。作為詞匯理論研究,與中古漢語(yǔ)語(yǔ)法體系的研究、語(yǔ)料的鑒別與整理、漢語(yǔ)史數(shù)據(jù)庫(kù)平臺(tái)建設(shè)等其它項(xiàng)目的研究是互補(bǔ)關(guān)系,幾個(gè)部分相互依托,共同推進(jìn)。目前通過(guò)整理國(guó)內(nèi)近二十年來(lái)中古漢語(yǔ)復(fù)音詞研究的成果,對(duì)大量專書(shū)、專類詞匯研究著述中的復(fù)音詞的研究成果進(jìn)行全面梳理和整理,對(duì)中古漢語(yǔ)復(fù)音詞進(jìn)行了計(jì)量研究,已完成“中古漢語(yǔ)核心復(fù)音詞表”的整理編纂(近10000詞條)。服務(wù)于后續(xù)研究的需要。在收集整理中古復(fù)音詞的同時(shí),對(duì)各家各類研究成果進(jìn)行梳理,尤其是中古漢語(yǔ)復(fù)音詞的界定標(biāo)準(zhǔn)進(jìn)行歸納分析,建立了一套能服務(wù)于語(yǔ)料庫(kù)建設(shè)需要的中古漢語(yǔ)復(fù)音詞的界定標(biāo)準(zhǔn)和“分詞”依據(jù)。“中古漢語(yǔ)的構(gòu)詞法”、“中古漢語(yǔ)的造詞法及新詞生成機(jī)制”這兩個(gè)問(wèn)題正在研究。
中古漢語(yǔ)語(yǔ)法體系研究(胡靜書(shū)博士):通過(guò)對(duì)中古漢語(yǔ)的虛詞的收集整理,統(tǒng)計(jì)分析,目前已完成中古漢語(yǔ)語(yǔ)法體系——詞法體系的研究,句法體系研究正在進(jìn)行。
長(zhǎng)沙走馬樓三國(guó)吳簡(jiǎn)詞匯計(jì)量研究(張學(xué)城副教授)該課題將走馬樓三國(guó)吳簡(jiǎn)的全部釋文制作數(shù)據(jù)庫(kù),利用數(shù)據(jù)庫(kù)生成引得,為詞匯計(jì)量研究提供條件。
文物出版社的釋文凝聚了很多學(xué)者的心血,具有很高的學(xué)術(shù)價(jià)值。但是由于簡(jiǎn)文量大,人手有限,時(shí)間緊迫,錯(cuò)誤在所難免。課題承擔(dān)者在原有釋文基礎(chǔ)上,核對(duì)已公布的相關(guān)竹簡(jiǎn)照片,訂正了前人釋文中的一些錯(cuò)誤,完成全部?变浫牍ぷ。并已完成吳簡(jiǎn)(一)(二)冊(cè)的切詞、標(biāo)注及數(shù)據(jù)庫(kù)的制作,其余(三)(四)冊(cè)的切詞、標(biāo)注正在進(jìn)行。
漢魏石刻資料詞匯計(jì)量研究(羅小如博士)該課題以毛遠(yuǎn)明《漢魏六朝碑刻校注》(約69萬(wàn)字)為基礎(chǔ),進(jìn)一步搜集補(bǔ)充漢魏石刻資料,參照漢魏石刻拓片做好現(xiàn)有石刻釋文的校對(duì)整理,分別輸入電腦,這一階段的工作已經(jīng)完成。隨后分詞、標(biāo)注,做成數(shù)據(jù)庫(kù)。然后利用數(shù)據(jù)庫(kù)進(jìn)行專項(xiàng)詞匯計(jì)量研究。目前已完成10萬(wàn)字左右的切詞、標(biāo)注,并進(jìn)入數(shù)據(jù)庫(kù)。其余部分將在2014年8月前完成。
“吐魯番出土文獻(xiàn)”數(shù)據(jù)庫(kù)(趙紅副教授)唐長(zhǎng)孺主編的《吐魯番出土文書(shū)》第一冊(cè)集中公布了中古時(shí)期吐魯番出土文獻(xiàn)的圖版,本階段的主要工作集中在第一冊(cè)的資料精加工以及電子化處理方面。首先將前期工作中完成的錄文與出土文書(shū)圖版進(jìn)行一一對(duì)照?,彌補(bǔ)和糾正了錄文中的缺失,提交語(yǔ)料庫(kù)入庫(kù)使用的錄文資料盡最大可能準(zhǔn)確無(wú)誤。第二,將出版物的圖版用掃描、拍照等方法電子化處理,使異體字切分成為可能。第三,將已經(jīng)輯錄的異體字逐一用制圖軟件切分,制成各自獨(dú)立的字形圖片,同時(shí)錄入其所在文句,使字形與文句一一對(duì)照,避免了孤立字形缺乏例證的弊端,同時(shí)也為語(yǔ)料庫(kù)入庫(kù)分詞提供了完整的資料。目前,經(jīng)過(guò)精加工的錄文資料已經(jīng)提交入庫(kù),進(jìn)行分詞、標(biāo)注等相關(guān)工作。電子化處理的字形圖片工作也已基本完成,《吐魯番文獻(xiàn)俗字典》亦已編纂完成,將遞交“異文庫(kù)”、“疑難字庫(kù)”。
(四)“深加工中古漢語(yǔ)語(yǔ)料庫(kù)系統(tǒng)平臺(tái)建設(shè)與研究”子項(xiàng)目(負(fù)責(zé)人:陳小荷教授)
2012年12月年檢至今,該子項(xiàng)目組主要工作如下:
“中古漢語(yǔ)語(yǔ)料庫(kù)語(yǔ)料檢索系統(tǒng)”軟件的改進(jìn)升級(jí)(曲維光教授、付佳)。2012年上半年軟件第一版研制以后,進(jìn)行了試運(yùn)行,在試運(yùn)行過(guò)程中,根據(jù)“語(yǔ)料庫(kù)建設(shè)”子項(xiàng)目組的意見(jiàn)建議,又進(jìn)行了兩次改版升級(jí),一方面進(jìn)一步提升了軟件的運(yùn)行速度,同時(shí),又拓展了軟件的檢索功能(如:語(yǔ)料的時(shí)代分層、地域區(qū)分功能;相類語(yǔ)料的同頁(yè)面比對(duì)功能、網(wǎng)上互動(dòng)功能等)目前“中古漢語(yǔ)語(yǔ)料庫(kù)檢索系統(tǒng)”已經(jīng)推出第三版,功能和性能已基本達(dá)到要求。
版本異文自動(dòng)發(fā)現(xiàn)的研究(陳小荷教授),針對(duì)中古漢語(yǔ)語(yǔ)料改進(jìn)了算法,速度更快、異文定位更加準(zhǔn)確。
相關(guān)軟件的對(duì)接(李斌博士)。在項(xiàng)目建設(shè)實(shí)踐中,總結(jié)經(jīng)驗(yàn)教訓(xùn),將“中古漢語(yǔ)自動(dòng)語(yǔ)義標(biāo)注軟件”與“中古漢語(yǔ)自動(dòng)分詞軟件”有機(jī)結(jié)合,不僅通過(guò)形式區(qū)分進(jìn)行自動(dòng)分詞,而且通過(guò)語(yǔ)義鑒別進(jìn)行自動(dòng)分詞,有效提高了切詞的準(zhǔn)確性(李斌博士)。
二、調(diào)查研究及學(xué)術(shù)交流情況
兩年半以來(lái),本項(xiàng)目組圍繞項(xiàng)目的進(jìn)展開(kāi)展了一系列學(xué)術(shù)調(diào)研、文獻(xiàn)收集以
及學(xué)術(shù)交流活動(dòng)。共邀請(qǐng)國(guó)內(nèi)專家前來(lái)進(jìn)行學(xué)術(shù)講座場(chǎng),本項(xiàng)目組成員應(yīng)邀外出進(jìn)行學(xué)術(shù)講座4場(chǎng),出席國(guó)際、國(guó)內(nèi)重要學(xué)術(shù)會(huì)議13人次。
(一)調(diào)研數(shù)據(jù)整理運(yùn)用:
掃描版文獻(xiàn)檢索問(wèn)題的調(diào)查研究(陳小荷教授)。對(duì)語(yǔ)料庫(kù)中的掃描版文獻(xiàn)直接進(jìn)行檢索,目前美國(guó)已經(jīng)開(kāi)始較多運(yùn)用這一技術(shù)。在我們的語(yǔ)料庫(kù)中能否采用這一技術(shù),這關(guān)系到語(yǔ)料庫(kù)的質(zhì)量。子課題組負(fù)責(zé)人陳小荷教授對(duì)此進(jìn)行了細(xì)致的調(diào)查了解,通過(guò)國(guó)內(nèi)外相關(guān)資料的研究,陳教授認(rèn)為:從原理上說(shuō),掃描版文獻(xiàn)是無(wú)法直接檢索的,必須經(jīng)過(guò)字符識(shí)別和人工校對(duì)之后才能檢索。但是,檢索結(jié)果的呈現(xiàn)形式可以是掃描圖像。其中的奧秘就是將文本的段落、句子、詞或字符與它在掃描圖像中的位置聯(lián)系起來(lái),檢索仍然在文本中進(jìn)行(這一過(guò)程不讓用戶看見(jiàn)),但可通過(guò)位置映射將相應(yīng)的圖像呈現(xiàn)給用戶。例如,利用工具軟件DjvuToy,可以制作djvu電子書(shū),進(jìn)行字符識(shí)別、生成可檢索的隱藏文本。這一技術(shù)在語(yǔ)料檢索中很有價(jià)值。如果檢索結(jié)果以文本形式呈現(xiàn),用戶對(duì)其準(zhǔn)確性和真實(shí)性是持謹(jǐn)慎態(tài)度的,往往還要去查閱掃描文獻(xiàn)或紙版本。檢索結(jié)果以圖像形式呈現(xiàn),用戶可以放心使用。即使字符識(shí)別可能有誤,也能夠直觀地在掃描圖像上反映出來(lái)。基于這樣的認(rèn)識(shí),我們目前正在在檢索系統(tǒng)上做這方面的實(shí)驗(yàn)嘗試。
中古漢語(yǔ)語(yǔ)料自動(dòng)切詞軟件準(zhǔn)確率問(wèn)題的調(diào)查研究(董志翹、化振紅教授)
目前古代漢語(yǔ)語(yǔ)料的自動(dòng)切詞軟件研究的瓶頸是切詞準(zhǔn)確率的問(wèn)題,現(xiàn)代漢語(yǔ)語(yǔ)
料自動(dòng)切詞軟件的準(zhǔn)確率已經(jīng)可以達(dá)到95%以上,但古代漢語(yǔ)語(yǔ)料由于詞與非詞界限的模糊,自動(dòng)切詞軟件的準(zhǔn)確率一直不高(基本上在70%—80%間徘徊)。利用在韓國(guó)參加學(xué)術(shù)會(huì)議的機(jī)會(huì),董志翹、化振紅教授與臺(tái)灣大學(xué)工程科學(xué)及海洋工程研究所杜正民、唐國(guó)銘教授、法鼓佛教學(xué)院洪正洲助理教授進(jìn)行了會(huì)間個(gè)別交流,他們目前正參與法鼓佛教學(xué)院“中華電子佛典數(shù)據(jù)庫(kù)”的建設(shè),唐國(guó)銘教授的報(bào)告“運(yùn)用佛經(jīng)音義語(yǔ)料建構(gòu)‘語(yǔ)意詞網(wǎng)’之研究——以《瑜伽師地論》為例”洪正洲助理教授的報(bào)告“以統(tǒng)計(jì)量化分析方式進(jìn)行早期漢譯佛典之翻譯年代判斷與翻譯特征萃取”,對(duì)于我們漢語(yǔ)史語(yǔ)料庫(kù)的建設(shè)均有啟發(fā)。通過(guò)調(diào)查,他們研制的檢索系統(tǒng)的某些功能和自動(dòng)分詞軟件研制方法(按文體分別制作自動(dòng)切詞軟件提高分詞精確度的方法),很值得我們借鑒,為此互相建立了進(jìn)一步交流協(xié)作的意向。目前我們已經(jīng)在進(jìn)行按文體制作自動(dòng)切詞軟件的嘗試。
(二)國(guó)內(nèi)外文獻(xiàn)資料的收集整理:
國(guó)外《經(jīng)律異相》資料的收集整理(董志翹教授)。語(yǔ)料庫(kù)中所收《經(jīng)律異相》是梁代寶唱所編的我國(guó)第一部佛教類書(shū),資料價(jià)值非常高,但該書(shū)一直未有人整理。我們首次用國(guó)內(nèi)所能見(jiàn)到的八種重要藏經(jīng)本進(jìn)行?闭,加上斷句、標(biāo)點(diǎn)(94萬(wàn)字,巴蜀書(shū)社2011年8月出版)。后經(jīng)董志翹教授與日本國(guó)際佛教大學(xué)院大學(xué)“日本古寫(xiě)經(jīng)研究所”所長(zhǎng)落合俊典教授聯(lián)系,在他的大力支持下,又查找到日本金剛寺、七寺、興圣寺三個(gè)寺院所藏《經(jīng)律異相》的三種古寫(xiě)本,并全部復(fù)印寄贈(zèng)。目前,我們正利用這些寶貴的材料對(duì)《經(jīng)律異相》作進(jìn)一步校勘整理。
國(guó)內(nèi)漢魏六朝石刻資料的收集整理(董志翹教授、羅小如博士)語(yǔ)料庫(kù)中的中古出土石刻文獻(xiàn),以前均散見(jiàn)各處,沒(méi)有一個(gè)比較完備的文本。我們了解到西南大學(xué)古籍所毛遠(yuǎn)明教授新近剛出版《漢魏六朝碑刻校注》(全10冊(cè),2008年線裝書(shū)局出版),這是迄今漢魏六朝碑刻資料收集最全面、整理最精審的著作。立即前往重慶與他當(dāng)面協(xié)商,最后同意將該書(shū)收入語(yǔ)料庫(kù)。我們目前在該書(shū)的基礎(chǔ)上,又進(jìn)一步搜集補(bǔ)充了一些漢魏石刻資料,并進(jìn)行切詞、標(biāo)注的深加工處理。
電子佛經(jīng)資料的收集整理(陳小荷教授)搜集了繁體電子版佛經(jīng)語(yǔ)料7億多字,并且對(duì)佛經(jīng)語(yǔ)料自動(dòng)分詞方法進(jìn)行了初步探索。語(yǔ)料包括大正藏、卐續(xù)藏、嘉興藏、趙城金藏、中華藏、房山石經(jīng)、高麗藏、乾隆藏、卍正藏、永樂(lè)北藏、洪武南藏等等(均已排除重復(fù)部分)。一種佛經(jīng)往往有多種譯本,例如《金剛經(jīng)》主要有姚秦時(shí)代的鳩摩羅什譯本、唐代玄奘譯本。有的甚至有梵漢對(duì)照,其中梵文詞語(yǔ)用漢字音譯,如《唐梵翻對(duì)字音般若波羅蜜多心經(jīng)》。這些語(yǔ)料對(duì)于研究佛經(jīng)詞匯發(fā)現(xiàn)和自動(dòng)分詞以及中古音韻都是非常寶貴的資料。也大大充實(shí)了我們的語(yǔ)料庫(kù)。
(三)學(xué)術(shù)會(huì)議:
召開(kāi)了重大招標(biāo)項(xiàng)目開(kāi)題論證會(huì)
2011年4月3日上午9時(shí),在南京師范大學(xué)貴賓室召開(kāi)了本項(xiàng)目的開(kāi)題論證會(huì)。出席本次開(kāi)題會(huì)的有國(guó)家級(jí)“有突出貢獻(xiàn)專家”、北京大學(xué)中文系博士生導(dǎo)師蔣紹愚教授,北京語(yǔ)言大學(xué)信息科學(xué)學(xué)院博士生導(dǎo)師宋柔教授,江蘇省哲學(xué)社會(huì)科學(xué)基金辦公室主任徐之順。南京師范大學(xué)副校長(zhǎng)吳康寧教授,文學(xué)院院長(zhǎng)朱曉進(jìn)教授,社會(huì)科學(xué)處副處長(zhǎng)秦國(guó)榮教授及課題組全體成員。項(xiàng)目首席專家董志翹教授全面系統(tǒng)地匯報(bào)了調(diào)整后課題的思路、研究路徑、研究項(xiàng)目的重難點(diǎn)等。蔣紹愚教授就課題的語(yǔ)料庫(kù)范圍、功能、來(lái)源文本選擇、語(yǔ)料分期、文本標(biāo)注內(nèi)容等具體問(wèn)題,和語(yǔ)料庫(kù)檢索平臺(tái)、平行知識(shí)庫(kù)、前期人工標(biāo)注、后期計(jì)算機(jī)的學(xué)習(xí)等技術(shù)路線,提出自己的意見(jiàn)。宋柔教授結(jié)合自己多年從事現(xiàn)代漢語(yǔ)語(yǔ)料庫(kù)建構(gòu)與研究工作,也對(duì)語(yǔ)料庫(kù)標(biāo)注的開(kāi)放性、模糊性,尤其是文字形體難題等提出了建設(shè)性建議。課題組成員與相關(guān)專家學(xué)者進(jìn)行了熱烈的溝通與交流,在現(xiàn)場(chǎng)提出了一些新的的設(shè)想
召開(kāi)了重大招標(biāo)項(xiàng)目專家咨詢會(huì)
2011年11月26日,在南京師范大學(xué)南山專家樓二樓第二會(huì)議室舉行本項(xiàng)目專家咨詢會(huì)。受邀的咨詢專家有湖南師范大學(xué)蔣冀騁教授、北京大學(xué)孫玉文教授、浙江大學(xué)張涌泉、汪維輝教授、復(fù)旦大學(xué)汪少華教授、廈門(mén)大學(xué)曾良教授、上海師范大學(xué)徐時(shí)儀教授7人(7位專家涵蓋中古漢語(yǔ)史研究中的文字、音韻、詞匯、語(yǔ)法等各個(gè)領(lǐng)域),與全體項(xiàng)目組成員對(duì)課題進(jìn)展以及相關(guān)問(wèn)題展開(kāi)了熱烈討論,同時(shí)紛紛為項(xiàng)目出謀劃策,提出了不少寶貴的意見(jiàn)、建議。
召開(kāi)了“深加工中古漢語(yǔ)語(yǔ)料庫(kù)”前期成果專家評(píng)估會(huì)
結(jié)合211學(xué)科建設(shè)評(píng)估,深加工中古漢語(yǔ)語(yǔ)料庫(kù)前期試運(yùn)行部分(已有部分中古文獻(xiàn)經(jīng)加工后入庫(kù)試運(yùn)行),2012年2月19日接受了由南京師范大學(xué)組織的專家組的評(píng)估,專家組由安徽大學(xué)古文字專家黃德寬教授、中國(guó)社會(huì)科學(xué)院計(jì)算語(yǔ)言學(xué)專家馮志偉研究員、廈門(mén)大學(xué)敦煌學(xué)專家曾良教授組成,專家組通過(guò)聽(tīng)取項(xiàng)目組匯報(bào)、參觀語(yǔ)料庫(kù)演示,最終評(píng)語(yǔ)是:“課題組在語(yǔ)料庫(kù)加工應(yīng)用和軟硬件平臺(tái)建設(shè)方面,在中古漢語(yǔ)研究領(lǐng)域處于國(guó)內(nèi)領(lǐng)先。圍繞語(yǔ)料庫(kù)開(kāi)展的相關(guān)理論研究成果,對(duì)中古漢語(yǔ)研究方面產(chǎn)生了積極影響。研究整理的中古漢語(yǔ)語(yǔ)料文本,得到學(xué)術(shù)界的高度評(píng)價(jià)。該課題成果具有較為廣泛的推廣價(jià)值,中古漢語(yǔ)典型語(yǔ)料庫(kù)和便捷的檢索方式,為漢語(yǔ)史及中古漢語(yǔ)提供了先進(jìn)的研究與交流平臺(tái)!辫b定等第為“優(yōu)秀”。
(四)學(xué)術(shù)交流:
邀請(qǐng)外單位專家前來(lái)進(jìn)行學(xué)術(shù)講座(9場(chǎng))
2011年4月2日,項(xiàng)目組邀請(qǐng)北京語(yǔ)言大學(xué)博士生導(dǎo)師,計(jì)算語(yǔ)言學(xué)專家宋柔教授在南京師范大學(xué)國(guó)際教育學(xué)院報(bào)告廳作學(xué)術(shù)報(bào)告,報(bào)告的題目是“基于廣義話題的漢語(yǔ)文本結(jié)構(gòu)”
2011年4月2日,項(xiàng)目組邀請(qǐng)北京大學(xué)博士生導(dǎo)師、漢語(yǔ)史專家蔣紹愚教授作學(xué)術(shù)報(bào)告,報(bào)告的題目是“漢語(yǔ)史的學(xué)習(xí)和研究”
2011年11月15日,項(xiàng)目組邀請(qǐng)東北師范大學(xué)博士生導(dǎo)師,古文獻(xiàn)專家曹書(shū)杰教授作學(xué)術(shù)講座,講座題目:“考據(jù)學(xué)與漢語(yǔ)言文字研究”。
2011年11月26日,項(xiàng)目組邀請(qǐng)北京大學(xué)博士生導(dǎo)師孫玉文教授作學(xué)術(shù)講座,講座題目是:“揚(yáng)雄《方言》折射出的秦漢方音”。
2011年11月26日,項(xiàng)目組邀請(qǐng)復(fù)旦大學(xué)出土文獻(xiàn)與古文字研究中心博士生導(dǎo)師,訓(xùn)詁學(xué)專家汪少華教授作學(xué)術(shù)講座,講座題目是:“訓(xùn)詁與考古研究成果利用”。
2011年11月27日,項(xiàng)目組邀請(qǐng)廈門(mén)大學(xué)博士生導(dǎo)師,敦煌學(xué)專家曾 良教授作學(xué)術(shù)講座,講座題目是:“”。
2011年11月27日,項(xiàng)目組邀請(qǐng)湖南師范大學(xué)博士生導(dǎo)師,漢語(yǔ)史專家蔣冀騁教授作學(xué)術(shù)講座,講座題目是:“語(yǔ)感與訓(xùn)詁”。
2012年2月17日,項(xiàng)目組邀請(qǐng)安徽大學(xué)博士生導(dǎo)師,古文字學(xué)專家黃德寬教授作學(xué)術(shù)講座,講座題目是:“關(guān)于清華簡(jiǎn)《尹至》《尹誥》形成年代與性質(zhì)問(wèn)題”。
2013年1月13日,項(xiàng)目組邀請(qǐng)上海師范大學(xué)博士生導(dǎo)師,音韻學(xué)專家潘悟云教授作學(xué)術(shù)講座,講座題目是“漢語(yǔ)語(yǔ)料庫(kù)檢索系統(tǒng)設(shè)計(jì)”。
本項(xiàng)目組成員應(yīng)邀外出進(jìn)行學(xué)術(shù)講座(12場(chǎng))
2011年10月14日,本項(xiàng)目首席專家董志翹教授應(yīng)邀在北京大學(xué)中文系作了“關(guān)于‘名量式’復(fù)合詞的幾個(gè)問(wèn)題”的學(xué)術(shù)講座。
2011年9月15日,本項(xiàng)目子課題負(fù)責(zé)人黃征應(yīng)邀在西南大學(xué)漢語(yǔ)言文獻(xiàn)研究所,作了題為《敦煌語(yǔ)言文字學(xué)研究——敦煌俗語(yǔ)言學(xué)論綱》的學(xué)術(shù)講座。
2011年12月16日至18日,本項(xiàng)目首席專家董志翹教授應(yīng)邀在山東師范大學(xué)文學(xué)院、淮北師范大學(xué)文學(xué)院做了題為“回望與前瞻——新時(shí)期的漢語(yǔ)學(xué)習(xí)與應(yīng)用”的學(xué)術(shù)講座。
2012年9月17日,董志翹教授應(yīng)邀為南京信息工程大學(xué)作題為“知今必鑒古,無(wú)古不成今——從古代文獻(xiàn)中汲取科技創(chuàng)新的營(yíng)養(yǎng)”講座。
2012年10月9日,董志翹教授應(yīng)邀為浙江外國(guó)語(yǔ)學(xué)院人文學(xué)院作題為“表示過(guò)程、持續(xù)狀態(tài)的‘中’及其來(lái)源”的學(xué)術(shù)講座。
2012年11月27日,董志翹教授應(yīng)邀為西南大學(xué)文學(xué)院作題為“關(guān)于漢語(yǔ)‘名量式’復(fù)合詞的幾個(gè)問(wèn)題”的學(xué)術(shù)講座。
2012年11月28日,董志翹教授應(yīng)邀為重慶師范大學(xué)作題為“努力拓展學(xué)生視野,全面掌握古代漢語(yǔ)知識(shí)”的學(xué)術(shù)講座。
2012年11月29日,董志翹教授應(yīng)邀為四川外國(guó)語(yǔ)大學(xué)中文系作題為“略論漢語(yǔ)中的‘離合詞’”的學(xué)術(shù)講座。
2012年11月29日,董志翹教授應(yīng)邀為重慶師范大學(xué)文學(xué)院為研究生作“拓寬學(xué)術(shù)視野,全面掌握古代漢語(yǔ)知識(shí)”的報(bào)告。
2012年12月1日,董志翹教授應(yīng)邀為四川大學(xué)文學(xué)與新聞學(xué)院為研究生作“關(guān)于漢語(yǔ)名量式復(fù)合詞的幾個(gè)問(wèn)題”的報(bào)告。
2013年3月24日,董志翹教授應(yīng)邀為陜西師范大學(xué)文學(xué)院為研究生作“佛教對(duì)中土取名命字的影響”的學(xué)術(shù)報(bào)告。
2013年4月15日,董志翹教授應(yīng)邀為武漢大學(xué)文學(xué)院為教師、研究生作“佛教對(duì)中土取名命字的影響”的學(xué)術(shù)報(bào)告。
本項(xiàng)目組成員出席國(guó)際、全國(guó)重要學(xué)術(shù)會(huì)議(30人次)
2011年5月6—9日,本項(xiàng)目首席專家董志翹教授出席清華大學(xué)百年校慶西
南瀕危文字文獻(xiàn)研討會(huì),并主持會(huì)議發(fā)言。.
2011年8月12日,本項(xiàng)目組成員趙紅副教授出席由中國(guó)敦煌吐魯番學(xué)會(huì)等
單位主辦的“中國(guó)敦煌吐魯番學(xué)會(huì)理事會(huì)暨學(xué)術(shù)討論會(huì)”,并宣讀了論文“ 吐魯番出土文獻(xiàn)字詞零考”。
2011年8月20日—22日,本項(xiàng)目子課題負(fù)責(zé)人陳小荷教授及成員馮敏萱、
李斌、徐潤(rùn)華博士出席在河南洛陽(yáng)召開(kāi)的全國(guó)第十一屆計(jì)算語(yǔ)言學(xué)學(xué)術(shù)會(huì)議(CNCCL-2011)并在會(huì)議上報(bào)告論文4篇。
2011年8月23—28日,本項(xiàng)目首席專家、中國(guó)訓(xùn)詁學(xué)研究會(huì)副會(huì)長(zhǎng)董志翹
教授、本項(xiàng)目子課題負(fù)責(zé)人、中國(guó)訓(xùn)詁學(xué)研究會(huì)副秘書(shū)長(zhǎng)方向東教授出席在成都召開(kāi)的中國(guó)訓(xùn)詁學(xué)研究會(huì)及西南交通大學(xué)主辦的“2011年海峽兩岸文獻(xiàn)與方言研究學(xué)術(shù)研討會(huì)”報(bào)告了論文,董志翹教授作大會(huì)學(xué)術(shù)總結(jié)。
2011年12月4日至5日,本項(xiàng)目子課題負(fù)責(zé)人陳小荷教授及課題組成員曲
維光教授出席了在北京召開(kāi)的中國(guó)中文信息學(xué)會(huì)第七屆全國(guó)代表大會(huì)暨學(xué)會(huì)成立三十周年學(xué)術(shù)會(huì)議,陳小荷繼續(xù)當(dāng)選為理事。
2012年4月20日—24日,本項(xiàng)目首席專家董志翹教授出席由中國(guó)社會(huì)科學(xué)
院語(yǔ)言研究所、湖南師范大學(xué)文學(xué)院主辦的“第八屆中古漢語(yǔ)國(guó)際學(xué)術(shù)研討會(huì)”,并作大會(huì)主題報(bào)告“關(guān)于“見(jiàn)2V”句中“見(jiàn)”的詞性及功能”。本項(xiàng)目成員趙家棟副教授出席會(huì)議,并宣讀論文“《經(jīng)律異相》校讀札記”。
2012年4月27日—28日,本項(xiàng)目子課題負(fù)責(zé)人陳小荷教授作為教育部語(yǔ)信
司推薦的專家出席在廣西南寧召開(kāi)的聯(lián)合國(guó)教科文組織第十三屆國(guó)際母語(yǔ)日研討會(huì),在研討會(huì)上作了“關(guān)于漢語(yǔ)方言信息處理”的報(bào)告。
2012年5月25日,本項(xiàng)目子課題負(fù)責(zé)人黃征教授出席在日本東京召開(kāi)的“第
57回東方學(xué)會(huì)的國(guó)際研討會(huì)”,并作了題為“中國(guó)愿文與日本愿文比較研究”的大會(huì)報(bào)告。
2012年8月15日,項(xiàng)目組成員胡靜書(shū)講師出席了由中國(guó)社會(huì)科學(xué)院語(yǔ)言研
究所主辦的中國(guó)語(yǔ)言學(xué)會(huì)第十六屆學(xué)術(shù)年會(huì),提交和宣讀論文“害怕義到情態(tài)義:一個(gè)反復(fù)出現(xiàn)的詞義演變現(xiàn)象”。與會(huì)期間,調(diào)查了與中古漢語(yǔ)語(yǔ)法體系有關(guān)的研究動(dòng)態(tài)和成果,也咨詢了相關(guān)專家學(xué)者,本課題研究的價(jià)值和重要性得到同行專家的肯定,同時(shí)也獲得了對(duì)語(yǔ)法體系研究有益的意見(jiàn)和建議。
2012年9月10日,子項(xiàng)目負(fù)責(zé)人方向東教授出席在河南師范大學(xué)召開(kāi)的“中
國(guó)歷史文獻(xiàn)研究會(huì)第33屆年會(huì)”,同時(shí)了解文獻(xiàn)古籍?dāng)?shù)字化的相關(guān)信息和建設(shè)情況。
2012年10月8日—10日,本項(xiàng)目首席專家董志翹教授出席中國(guó)訓(xùn)詁學(xué)研究
會(huì)在浙江大學(xué)召開(kāi)的學(xué)術(shù)年會(huì),在會(huì)上作“日本的中古漢語(yǔ)詞匯研究”的主題報(bào)告。并再次當(dāng)選中國(guó)訓(xùn)詁學(xué)研究會(huì)副會(huì)長(zhǎng)。子項(xiàng)目負(fù)責(zé)人方向東教授亦出席會(huì)議,當(dāng)選為中國(guó)訓(xùn)詁學(xué)會(huì)常務(wù)理事。項(xiàng)目組成員趙家棟副教授同時(shí)出席會(huì)議,宣讀論文“敦煌寫(xiě)卷丑婦賦字詞校讀札記”。
2012年10月12日—16日,董志翹教授出席韓國(guó)交通大學(xué)(忠州)主辦的
“佛教文獻(xiàn)研究暨第六屆佛經(jīng)語(yǔ)言學(xué)國(guó)際學(xué)術(shù)研討會(huì)”,在會(huì)上作“佛教類書(shū)《經(jīng)律異相》的語(yǔ)料價(jià)值”的主題報(bào)告,并主持分組學(xué)術(shù)會(huì)議。子項(xiàng)目負(fù)責(zé)人化振紅教授同時(shí)出席會(huì)議。
2012年10月19日—21日,董志翹教授出席在揚(yáng)州大學(xué)召開(kāi)的國(guó)際漢語(yǔ)史研究會(huì)暨第十一屆全國(guó)古代漢語(yǔ)學(xué)術(shù)研討會(huì),在會(huì)上作 “努力拓展學(xué)生視野,全面掌握古代漢語(yǔ)知識(shí)”的主題報(bào)告。
2012年10月25日—28日,董志翹教授出席在江蘇師范大學(xué)召開(kāi)的“當(dāng)代語(yǔ)言科學(xué)創(chuàng)新與發(fā)展國(guó)際學(xué)術(shù)研討會(huì)暨《語(yǔ)言科學(xué)》創(chuàng)刊十周年慶典”,在會(huì)上作“加強(qiáng)漢語(yǔ)史語(yǔ)料庫(kù)建設(shè),促進(jìn)漢語(yǔ)史研究的現(xiàn)代化”學(xué)術(shù)報(bào)告,具體介紹了本項(xiàng)目建設(shè)目標(biāo)、具體功能以及目前進(jìn)展情況,引起與會(huì)者的關(guān)注并給予高度評(píng)價(jià)。
2012年10月30日—11月4日,項(xiàng)目組成員趙家棟副教授、胡靜書(shū)講師出席在安徽師范大學(xué)召開(kāi)的“近代漢語(yǔ)學(xué)術(shù)研討會(huì)”,趙家棟在會(huì)上宣讀論文“敦煌文獻(xiàn)疑難字詞考辨五則”,胡靜書(shū)在會(huì)上宣讀了論文“論‘勿’的沒(méi)有義用法”。并在會(huì)上介紹了本項(xiàng)目的進(jìn)展情況,與相關(guān)與會(huì)者交流了經(jīng)驗(yàn)。
2012年11月5日,項(xiàng)目組成員趙紅副教授出席了在徐州召開(kāi)的“江蘇省語(yǔ)言學(xué)學(xué)術(shù)年會(huì)”,在會(huì)上宣讀了論文“基于中古漢語(yǔ)語(yǔ)料庫(kù)建設(shè)的若干思考”,論文提出,中古漢語(yǔ)熟語(yǔ)料庫(kù)建設(shè)不能僅僅滿足于古文獻(xiàn)的收錄,還應(yīng)該保留普遍存在于傳世文獻(xiàn)和出土文獻(xiàn)當(dāng)中的諸多異文,實(shí)現(xiàn)異文自動(dòng)檢索、自動(dòng)發(fā)現(xiàn)。針對(duì)吐魯番出土文獻(xiàn)眾多的異體字,還應(yīng)通過(guò)鏈接等技術(shù)手段保留原字形,進(jìn)行考釋意見(jiàn)的標(biāo)注關(guān)聯(lián)及文字屬性的標(biāo)注。通過(guò)采用通用置標(biāo)語(yǔ)言,實(shí)現(xiàn)語(yǔ)料共享,避免重復(fù)建設(shè)而產(chǎn)生的資源浪費(fèi)。該論文引起了與會(huì)學(xué)者的較大興趣。學(xué)者們紛紛肯定了語(yǔ)料庫(kù)建設(shè)的重要價(jià)值,同時(shí)也對(duì)感興趣的問(wèn)題進(jìn)行了咨詢,并提出了建議;一些目前正在進(jìn)行相關(guān)研究以及準(zhǔn)備進(jìn)行相關(guān)研究的學(xué)者們還與論文作者在會(huì)下進(jìn)行了熱烈的討論。
2012年12月6日——12日,董志翹教授出席“古代東亞諸國(guó)變格漢文研究”國(guó)際學(xué)術(shù)研討會(huì)(日本東京駒澤大學(xué)),在會(huì)上作“唐宋時(shí)期來(lái)華日本僧人著述中的變格漢文”的主題報(bào)告。
2013年3月22日—3月25日,董志翹教授出席“命名學(xué)首屆國(guó)際學(xué)術(shù)會(huì)”
(陜西省國(guó)際文化經(jīng)濟(jì)交流中心、西安武警工程學(xué)院主辦),任華東組組長(zhǎng),作“佛教對(duì)中土取名命字的影響”的學(xué)術(shù)報(bào)告。
2013年4月12日—4月15日,出席“《漢語(yǔ)大詞典》第二版修訂會(huì)議”(上
海漢語(yǔ)大詞典編纂處、辭書(shū)出版社主辦,武漢大學(xué)文學(xué)院承辦),在會(huì)上作“《漢語(yǔ)大詞典》(第二版)修訂方案讀后”的報(bào)告,
2013年 7 月 10-14 日,在山東煙臺(tái)出席“《漢語(yǔ)大詞典》第二版修訂工作
會(huì)議”(《漢語(yǔ)大詞典編纂處、上海辭書(shū)出版社主辦,魯東大學(xué)承辦),在會(huì)上作“中中古漢語(yǔ)研究語(yǔ)料庫(kù)與《漢語(yǔ)大詞典》(第二版)修訂”的報(bào)告。
(五)國(guó)際交流:
2012年1月始,項(xiàng)目首席專家董志翹教授應(yīng)邀參加日本東京駒澤大學(xué)佛教研究所主持的國(guó)際合作項(xiàng)目“東亞諸國(guó)漢語(yǔ)變格研究”的研究工作,該項(xiàng)目由日本國(guó)文部省立項(xiàng),2012年——2015年,項(xiàng)目組由5名日本學(xué)者、1名中國(guó)學(xué)者、2名韓國(guó)學(xué)者組成。中、日、韓三國(guó)語(yǔ)言接觸的研究對(duì)于漢語(yǔ)史研究將是一個(gè)很大的促進(jìn)。項(xiàng)目研究期間,每年赴日本1-2次進(jìn)行共同研究。
三、成果宣傳推介情況
(一)尚未舉行專門(mén)的成果發(fā)布會(huì)。但多次在國(guó)際、全國(guó)學(xué)術(shù)會(huì)議上介紹推薦過(guò)本項(xiàng)目成果(見(jiàn)前參加學(xué)術(shù)會(huì)議部分)在南京師范大學(xué)召開(kāi)的“深加工中古漢語(yǔ)語(yǔ)料庫(kù)”前期成果專家評(píng)估會(huì)上,本項(xiàng)目前期成果也作了宣傳介紹、演示。
(二)2011年上半年、下半年分別向國(guó)家社科基金辦、省社科基金辦報(bào)送了《工作簡(jiǎn)報(bào)》(一)(二)兩期,2012年(三)(四)兩期《工作》簡(jiǎn)報(bào)材料都已準(zhǔn)備好,但6月份適遇年中檢查,項(xiàng)目研究進(jìn)展情況均通過(guò)填表形式報(bào)送;12月份又遇年終檢查,項(xiàng)目研究進(jìn)展情況又通過(guò)填表形式報(bào)送。2013年上半年的《工作簡(jiǎn)報(bào)》正準(zhǔn)備編集,又要進(jìn)行項(xiàng)目中期評(píng)估,項(xiàng)目研究進(jìn)展情況又只能通過(guò)填表報(bào)送。(因?yàn)椤豆ぷ骱?jiǎn)報(bào)》內(nèi)容基本與檢查、評(píng)估表相同,如果另外再印一份《簡(jiǎn)報(bào)》,不僅浪費(fèi),也給相關(guān)部門(mén)增加負(fù)擔(dān)。我們是這樣理解的。)
(三)2012年9月,本項(xiàng)目首席專家董志翹教授接受了《中國(guó)社會(huì)科學(xué)報(bào)》
記者聞錚的書(shū)面采訪,對(duì)于漢語(yǔ)語(yǔ)料庫(kù)建設(shè)的意義以及高校將重大研究項(xiàng)目的進(jìn)行與人才培養(yǎng)緊密結(jié)合的做法作了闡述(分六個(gè)方面形成5000多字的文章交稿),相關(guān)內(nèi)容見(jiàn)《中國(guó)社會(huì)科學(xué)報(bào)》2012年9月20日“社科基金?蔽恼隆按蛟煨畔r(shí)代的學(xué)術(shù)利器——近年來(lái)國(guó)家社科基金資助數(shù)據(jù)庫(kù)建設(shè)與研究進(jìn)展”: “引領(lǐng)人文社科新發(fā)展: 數(shù)據(jù)庫(kù)技術(shù)的誕生和發(fā)展不僅帶來(lái)了計(jì)算機(jī)信息管理的巨大革命,而且給人文社會(huì)科學(xué)發(fā)展注入了新的活力,有力促進(jìn)了現(xiàn)代學(xué)術(shù)體系和研究范式的建立。在社會(huì)科學(xué)領(lǐng)域,數(shù)據(jù)庫(kù)在經(jīng)濟(jì)學(xué)、人口學(xué)、社會(huì)學(xué)等學(xué)科領(lǐng)域的重要作用已是顯見(jiàn)的事實(shí);在文史哲等人文科學(xué)領(lǐng)域,加快文獻(xiàn)數(shù)字化、推動(dòng)研究型資料庫(kù)建設(shè)的重要性、緊迫性也已成為學(xué)界共識(shí)。基于這一背景,加大資料庫(kù)建設(shè)支持力度、推進(jìn)學(xué)科信息化基礎(chǔ)建設(shè)就成為國(guó)家社科基金立項(xiàng)資助的重要考量。
以語(yǔ)言學(xué)為例,僅2010—2011年就有4個(gè)重大項(xiàng)目涉及資料庫(kù)建設(shè)與研究,涵蓋從漢語(yǔ)史語(yǔ)料庫(kù)到民族語(yǔ)言語(yǔ)法標(biāo)注文本,從出土古文獻(xiàn)語(yǔ)料庫(kù)到英漢平行語(yǔ)料庫(kù)等不同研究領(lǐng)域,體現(xiàn)了語(yǔ)言學(xué)研究的最新進(jìn)展和前沿趨勢(shì)。正如“漢語(yǔ)史語(yǔ)料庫(kù)建設(shè)研究”項(xiàng)目首席專家、南京師范大學(xué)教授董志翹所言,語(yǔ)料庫(kù)建設(shè)是為語(yǔ)言學(xué)、文獻(xiàn)學(xué)、辭書(shū)編纂學(xué)的深入系統(tǒng)研究服務(wù)的一項(xiàng)基礎(chǔ)建設(shè),而語(yǔ)料庫(kù)語(yǔ)言學(xué)則是當(dāng)前語(yǔ)言研究的主流。據(jù)他介紹,目前國(guó)內(nèi)已建成的語(yǔ)料庫(kù)中,現(xiàn)代漢語(yǔ)語(yǔ)料庫(kù)占80%以上,且多為生語(yǔ)料庫(kù)。因此,國(guó)家社科基金項(xiàng)目對(duì)中古漢語(yǔ)、出土古文獻(xiàn)的語(yǔ)料庫(kù)建設(shè)在很大程度上具有填補(bǔ)空白的意義。”
因?yàn)椤吨袊?guó)社會(huì)科學(xué)報(bào)》是采取綜合報(bào)道形式,所以,董志翹教授所撰“加強(qiáng)漢語(yǔ)史語(yǔ)料庫(kù)建設(shè),促進(jìn)漢語(yǔ)史研究手段的現(xiàn)代化”一文由《西南大學(xué)學(xué)報(bào)》全文發(fā)表。
代表性成果:
1. 自主開(kāi)發(fā)研制成功“中古漢語(yǔ)語(yǔ)料庫(kù)綜合檢索系統(tǒng)(第三版)”(曲維光教授、付佳博士):該系統(tǒng)在VS2010平臺(tái)上開(kāi)發(fā),編程語(yǔ)言C#,數(shù)據(jù)庫(kù)是Sql Server 2008.系統(tǒng)主要包括以下幾個(gè)功能模塊:
不帶義項(xiàng)的查詢,根據(jù)書(shū)名、詞、詞類、語(yǔ)法功能等條件進(jìn)行查詢。
帶義項(xiàng)的查詢, 根據(jù)書(shū)名、詞、義項(xiàng)、詞類、語(yǔ)法功能等條件進(jìn)行查詢。
書(shū)籍對(duì)比查詢,先選定兩本要比較的書(shū)籍,然后根據(jù)詞、詞類、語(yǔ)法功能等條件進(jìn)行查詢,查詢結(jié)果以對(duì)比形式呈現(xiàn)。
字詞組合查詢,允許查詢條件中出現(xiàn)若干個(gè)字詞的邏輯組合(與、或、非)。
疑難字查詢,輸入疑難字編號(hào),輸出對(duì)應(yīng)的疑難字圖片。
語(yǔ)料庫(kù)建設(shè)者與語(yǔ)料庫(kù)使用者互動(dòng)平臺(tái)。
2.版本異文自動(dòng)發(fā)現(xiàn)的研究(陳小荷教授),針對(duì)中古漢語(yǔ)語(yǔ)料改進(jìn)了算法,速度更快、異文定位更加準(zhǔn)確。這種新穎的版本異文發(fā)現(xiàn)算法的基本思想是通過(guò)“同文”搜索為異文發(fā)現(xiàn)提供可靠的錨點(diǎn)序列,然后在在兩錨點(diǎn)之間的未匹配文本中查找異文。新算法的特點(diǎn)是:用PAT數(shù)組作為索引結(jié)構(gòu)以加快同文搜索的速度;用全局雙序列比對(duì)算法準(zhǔn)確定位異文。我們用這個(gè)算法處理《論衡》的兩個(gè)電子版本各20萬(wàn)字,在普通臺(tái)式機(jī)上僅用546毫秒即處理完畢,發(fā)現(xiàn)異文1929種、7390次,無(wú)一遺漏。論文《同文搜索與序列比對(duì)相結(jié)合的版本異文發(fā)現(xiàn)算法》已投稿。
3.中古漢語(yǔ)語(yǔ)料庫(kù)為《漢語(yǔ)大詞典》(第二版)修訂作出貢獻(xiàn)。2012年12月10日,國(guó)家重大文化工程《漢語(yǔ)大詞典》(第二版)編輯出版啟動(dòng)大會(huì)在北京人民大會(huì)堂召開(kāi)。全國(guó)人大副委員長(zhǎng)、《漢語(yǔ)大詞典》(第二版)主編華建敏,新聞出版總署署長(zhǎng)、《漢語(yǔ)大詞典》(第二版)工委會(huì)主任柳斌杰,教育部副部長(zhǎng)、國(guó)家語(yǔ)委主任、《漢語(yǔ)大詞典》(第二版)工委會(huì)副主任李衛(wèi)紅,中共上海市委常委、宣傳部長(zhǎng)、《漢語(yǔ)大詞典》(第二版)工委會(huì)副主任楊震武出席會(huì)議并講話,《漢語(yǔ)大詞典》(第二版)學(xué)術(shù)顧問(wèn)委員會(huì)、編纂委員會(huì)的專家學(xué)者出席會(huì)議。
本項(xiàng)目首席專家董志翹應(yīng)邀擔(dān)任編纂委員及分冊(cè)主編。在2013年4月12日武漢召開(kāi)的“《漢語(yǔ)大詞典》(第二版)編纂出版學(xué)術(shù)研討會(huì)”上,董志翹作了長(zhǎng)篇發(fā)言,指出:“《漢語(yǔ)大詞典》(第一版)在收詞、分項(xiàng)、釋義、引證方面存在的最大問(wèn)題是較少利用中古漢語(yǔ)、近代漢語(yǔ)及出土文獻(xiàn)材料。而近30年來(lái),中古、近代漢語(yǔ)及出土文獻(xiàn)語(yǔ)言研究成果大量涌現(xiàn),必須廣泛收集,合理利用。同時(shí),要與時(shí)俱進(jìn),在編纂方法手段上要有突破,要充分運(yùn)用現(xiàn)代計(jì)算機(jī)、互聯(lián)網(wǎng)和語(yǔ)料庫(kù)技術(shù),特別是要充分調(diào)查和利用《漢語(yǔ)大詞典》(第一版)有關(guān)數(shù)據(jù)庫(kù),來(lái)提高第二版編纂工作的質(zhì)量和進(jìn)度。而我們目前承擔(dān)的國(guó)家社科重大招標(biāo)項(xiàng)目“漢語(yǔ)史語(yǔ)料庫(kù)建設(shè)研究”,已經(jīng)研制了《漢語(yǔ)大詞典》(第一版)全文數(shù)據(jù)庫(kù),同時(shí)目前在建的中古漢語(yǔ)語(yǔ)料庫(kù)正可以為《漢語(yǔ)大詞典》(第二版)的編纂提供有力支撐!边@一意見(jiàn)得到了與會(huì)領(lǐng)導(dǎo)與主編人員的高度重視。
2013年7月10日,董志翹教授作為主編特別提名的中古漢語(yǔ)專家應(yīng)邀出席在山東煙臺(tái)召開(kāi)的“《漢語(yǔ)大詞典》(第二版)編纂出版工作會(huì)議”,具體討論了利用我們重大招標(biāo)項(xiàng)目階段成果為《漢語(yǔ)大詞典》(第二版)編纂工作服務(wù)的相關(guān)問(wèn)題。目前,我們已經(jīng)為《漢語(yǔ)大詞典》(第二版)提供了中古漢語(yǔ)核心復(fù)音詞詞表(10000詞條),并通過(guò)通過(guò)正在建設(shè)的漢語(yǔ)史語(yǔ)料庫(kù)的調(diào)查分析,提出建議增收中古漢語(yǔ)新詞條5040條,提供相關(guān)釋義、書(shū)證材料110萬(wàn)字。我們研制的《漢語(yǔ)大詞典》(第一版)全文數(shù)據(jù)庫(kù),也將為第一版的相關(guān)問(wèn)題的核查、研究提供快捷準(zhǔn)確的手段。同時(shí),在具體修訂編寫(xiě)過(guò)程中,我們的漢語(yǔ)史語(yǔ)料庫(kù)還將發(fā)揮更大的作用。
4.董志翹教授結(jié)合本項(xiàng)目研究所指導(dǎo)的兩篇博士論文(2012屆周超《(劉)宋詩(shī)詞匯研究》、2013屆張俊之《二王雜帖詞匯研究》)通過(guò)制作《(劉)宋詩(shī)》、《二王雜帖》數(shù)據(jù)庫(kù),采用計(jì)量詞匯研究的方法進(jìn)行,因材料扎實(shí),方法得當(dāng),頗多創(chuàng)新,均順利通過(guò)答辯,獲得“優(yōu)秀”等級(jí)。
階段性成果清單:
序號(hào) |
成果名稱 |
作者 |
成果 形式 |
刊物、出版社名稱及刊發(fā)、出版時(shí)間 |
字?jǐn)?shù) |
轉(zhuǎn)載、引用、獲獎(jiǎng)等情況 |
1 |
同源詞研究與漢語(yǔ)辭書(shū)編纂 |
董志翹 |
論文 |
《語(yǔ)言研究》2010年1期 |
1.2萬(wàn) |
2012年10月獲江蘇省社科優(yōu)秀成果二等獎(jiǎng) |
2 |
敦煌寫(xiě)本《啟顏錄》箋注 |
董志翹 |
論文 |
《西南民族大學(xué)學(xué)報(bào)》2012年3期 |
1萬(wàn) |
CSSCI收錄,下載頻次61 |
3 |
逯欽立《先秦漢魏晉南北朝詩(shī)》校釋舉誤 |
周 超 |
論文 |
《圖書(shū)館理論與實(shí)踐》2012年4期 |
0.6萬(wàn) |
CSSCI收錄,載頻次30 |
4 |
敦煌詩(shī)歌語(yǔ)詞釋證 |
趙家棟 董志翹 |
論文 |
《貴州師范大學(xué)學(xué)報(bào)》2012年1期 |
0.6萬(wàn) |
CSSCI收錄,下載頻次69 |
5 |
敦煌文獻(xiàn)中并不存在量詞“笙” |
趙家棟 董志翹 |
論文 |
《語(yǔ)言科學(xué)》 2012年第4期 |
0.5萬(wàn) |
CSSCI收錄,下載頻次22 |
6 |
《經(jīng)律異相》(5-11卷)校讀札記 |
趙家棟 董志翹 |
論文 |
《南京師范大學(xué)文學(xué)院學(xué)報(bào)》 2012年第3期 |
0.4萬(wàn) |
CSSCI收錄,下載頻次4 |
7 |
敦煌碑銘贊語(yǔ)詞釋證 |
趙家棟 |
論文 |
《敦煌研究》 2012年第4期 |
0.6萬(wàn) |
|
8 |
唐代佛寺所在考異二則 |
趙家棟 付義琴 |
論文 |
《湖南科技大學(xué)學(xué)報(bào)》2012年1期 |
0.4萬(wàn) |
下載頻次32 |
9 |
從語(yǔ)法史角度看“一元?jiǎng)釉~帶賓句”現(xiàn)象 |
付義琴 |
論文 |
《外語(yǔ)學(xué)刊》2012年2期 |
0.45萬(wàn) |
CSSCI收錄,下載頻次32 |
10 |
賓語(yǔ)前數(shù)量詞隱現(xiàn)的篇章分析 |
付義琴 趙家棟 |
論文 |
《華文教學(xué)與研究》2012年第3期 |
0.6萬(wàn) |
CSSCI收錄 |
11 |
二王雜帖釋文訂正四例 |
張俊之 |
論文 |
《東岳論叢》 2012年4期 |
0.4萬(wàn) |
CSSCI收錄,下載頻次22 |
12 |
“憂”是傷心事嗎 |
張俊之 |
論文 |
《語(yǔ)文建設(shè)》 2012年6期 |
0.4萬(wàn) |
CSSCI收錄,下載頻次32 |
13 |
南北朝時(shí)期漢語(yǔ)詞匯的南北差異研究 |
李 麗 |
論文 |
《西南交通大學(xué)學(xué)報(bào)》 2012年4期 |
0.6萬(wàn) |
CSSCI收錄,下載頻次12 |
14 |
《〈大字典〉疑難字考辨六則》 |
趙家棟 |
論文 |
《漢字文化》 2012年2期 |
0.15萬(wàn) |
CSSCI收錄 下載頻次9 |
15 |
Analysis of the Diffusion Process of Buddhist Vocabulary from Memoirs of Eminent Monks |
化振紅 |
論文 |
Cross-Cultural Communication Vol.8,No.5,2012 |
0.8萬(wàn) |
|
16 |
經(jīng)典古籍注疏文獻(xiàn)的知識(shí)網(wǎng)絡(luò)研究與設(shè)計(jì) |
馬創(chuàng)新 陳小荷 曲維光 |
論文 |
圖書(shū)情報(bào)工作 第57卷第9期 2013年5月《 |
0.9萬(wàn) |
|
17 |
基于學(xué)科本體的訓(xùn)詁學(xué)知識(shí)組織體系初步構(gòu)建 |
馬創(chuàng)新 陳小荷 |
論文 |
圖書(shū)情報(bào)工作》 第57卷第12期 2013年6月 |
0.9萬(wàn) |
|
16 |
加強(qiáng)漢語(yǔ)史語(yǔ)料庫(kù)建設(shè),促進(jìn)漢語(yǔ)史研究手段的現(xiàn)代化 |
董志翹 |
論文 |
《西南大學(xué)學(xué)報(bào)》2013年待發(fā) |
1萬(wàn) |
CSSCI收錄 |
17 |
深加工中古漢語(yǔ)語(yǔ)料庫(kù)建設(shè)若干問(wèn)題的思考 |
化振紅 汪 祎 |
論文 |
《西南大學(xué)學(xué)報(bào)》2013年待發(fā) |
0.8萬(wàn) |
CSSCI收錄 |
18 |
同文搜索與序列比對(duì)相結(jié)合的異文發(fā)現(xiàn)算法 |
陳小荷 |
論文 |
《西南大學(xué)學(xué)報(bào)》2013年待發(fā) |
0.7萬(wàn) |
CSSCI收錄 |
19 |
從信息處理角度考察察各類中古漢語(yǔ)語(yǔ)料的特點(diǎn) |
陳小荷 |
研究報(bào)告 |
|
0.24萬(wàn) |
|
20 |
中古漢語(yǔ)語(yǔ)料檢索系統(tǒng)(第二版) |
曲維光 付 佳 |
研究報(bào)告 軟件 |
|
0.4萬(wàn) |
|
21 |
詞性標(biāo)注研究 |
馮敏萱 徐潤(rùn)華 |
研究報(bào)告 |
|
0.48萬(wàn) |
|
22 |
中古漢語(yǔ)自動(dòng)分詞訓(xùn)練庫(kù)簡(jiǎn)要說(shuō)明 |
梁社會(huì) |
研究報(bào)告 |
|
0.11萬(wàn) |
|
23 |
中古漢語(yǔ)自動(dòng)分詞軟件(升級(jí)版) |
李 斌 |
軟件 |
|
|
|