一、研究進展情況
一、研究計劃總體執(zhí)行情況
本項目2012年10月中標(biāo)。2013年1月13日舉行開題論證會,開題至今(2016年7月)已有三年半。項目按計劃推進,總體順利。
本項目分前期(2013)、中期(2014-2016)、后期(2017)三個階段。前期的理論研究與語料庫設(shè)計已如期完成,2014年至今(2016)為中期,有兩項主要任務(wù):(1)語料采制;(2)軟件研究(語料轉(zhuǎn)寫核對軟件與語料庫管理軟件)。這兩項是本項目的中心工作。以下逐項匯報。
1.1 語料采制(2014年7月-2016年7月)
語料采制分采錄(調(diào)查錄制)與轉(zhuǎn)寫(研究標(biāo)注)兩項工作。兩年來,分屬三個方言子課題的20個方言子項目按照《漢語方言語料采制手冊》的規(guī)范與要求工作,現(xiàn)有17方言點已完成語料采錄,開始轉(zhuǎn)寫;另3方言因故略延,正在籌備語料采錄。以下就方言布點、語料內(nèi)容、研究進展與項目管理逐一匯報。
1.1.1 方言布點:兼顧方言與文化選擇20方言點
依據(jù)投標(biāo)書設(shè)定的“兼顧方言與文化”的布點原則,選了20個方言點,覆蓋全國九個一級方言區(qū)和官話的八個二級分區(qū)(《中國語言地圖集》)。這20方言點均為當(dāng)?shù)亟?jīng)濟文化中心(或為古城),具有方言與地域文化的雙重代表。
1.1.2 語料內(nèi)容:基礎(chǔ)語料與語篇語料數(shù)量大
每方言點有4位發(fā)音人:老年男女、青年男女,分別錄制基礎(chǔ)語料字、詞、句和語篇語料。基礎(chǔ)語料以老男為主,同時錄制另三人音系基礎(chǔ)字。語篇語料4人均錄。為方便多人對話,專設(shè)一引話人(方言地道、清楚本項目任務(wù))參與雙口語篇與三口語篇錄制。語篇分話本語篇、話題語篇與自話語篇,三類語篇的口語自然度依序遞增。每方言點共錄制6105字,約5600詞(核心詞200、基礎(chǔ)詞5260、特征詞100-200),100語法例句,900分鐘語篇(見下頁表1)。語料數(shù)量大于一般方言調(diào)查和一些在研方言數(shù)據(jù)庫。
表1 本項目單方言點語料結(jié)構(gòu)表
注:6105字含老男4002同音字和1092雙字調(diào)式字,老女、青男、青女各337音系例字。
1.1.3 研究進展:已完成17方言點的語料采錄
2014年上半年完成南京語料的試點采錄、修訂完善了語料采制大綱《漢語方言語料采制手冊》后,即籌備路途最遠的新疆哈密方言的采錄。7月,新疆大學(xué)哈密方言子項目完成采錄的前期準(zhǔn)備:擬定當(dāng)?shù)鬲氂蟹窖晕幕射浀妆荆ㄌ卣髟~、熟語、傳說、故事、軼事、歌謠、非遺曲藝),為4位發(fā)音人分擬獨用的語料底本,選定合適的發(fā)音人,擬定采錄工作日程,勘查預(yù)定錄音錄像場地等。8月,5人團隊赴哈密,全天調(diào)查并錄制。首席專家劉俐李教授率隊,哈密方言研究專家新疆大學(xué)張洋教授同步監(jiān)聽發(fā)音質(zhì)量,發(fā)現(xiàn)問題隨即質(zhì)疑、討論、重錄,子項目負責(zé)人新疆大學(xué)楊洪建副教授與研究生卜元彬負責(zé)檢查、復(fù)核、剪輯與整理音檔,發(fā)現(xiàn)不合格的音檔隨即補錄,項目組侯超實驗師負責(zé)錄音與錄像,確保各技術(shù)參數(shù)達標(biāo)。5人團隊白天錄制,晚上總結(jié)整理,各司其職、相互配合,緊張而有序地按計劃完成了哈密語料采錄。
2014年10月上旬,經(jīng)費撥至各方言,各子項目陸續(xù)開始語料采錄。10月,北京官話首先啟動,12月,蘭州、銀川兩方言啟動。2015年1月,徽語、東北官話、晉語、粵語、溫州吳語啟動。2015年暑假前后,閩語、常熟吳語、湘語、膠遼官話啟動。目前這12方言點均已完成語料采錄,開始語料轉(zhuǎn)寫。2016年上半年完成客家話、西南官話、黃岡江淮官話的語料采錄。截止2016年7月,共有17個方言點完成語料采錄。
首席專家參與了5個方言點的語料采錄,其余由各方言責(zé)任人負責(zé):蘭州城市學(xué)院莫超、張建軍兩教授,暨南大學(xué)陳曉錦、浙江師范大學(xué)王洪鐘、山西大學(xué)史秀菊、山東女子學(xué)院王淑霞教授,哈爾濱師范大學(xué)梁曉玲、新疆大學(xué)楊洪建、安徽大學(xué)栗華益、常熟理工學(xué)院顧勁松、鹽城師范學(xué)院馮青青等副教授,南京師范大學(xué)侯超實驗師。博士研究生唐志強、付康,碩士研究生施小梅、漆盈、郭文娟、張敏怡、卜元彬等參加調(diào)查采錄。
1.1.4 項目管理
依據(jù)開題研討會專家的意見,各方言語料的采制聘請當(dāng)?shù)赜性煸劦姆窖詫W(xué)者承擔(dān)!爱(dāng)?shù)胤窖詫W(xué)者”一指本籍方言學(xué)者,二指雖非本籍但工作于當(dāng)?shù)夭⒂诋?dāng)?shù)胤窖杂性煸務(wù)摺?0個方言點有20位責(zé)任人,人多力大,但需要規(guī)范與統(tǒng)一,這是保質(zhì)、如期完成語料研制的前提。
項目組以《漢語方言語料采制手冊》為法規(guī),規(guī)約并統(tǒng)一20方言點的語料研究,采用兩級責(zé)任制管束并推進各方言點的工作。啟用法規(guī)手冊與兩級責(zé)任制的實質(zhì)是協(xié)助與推動各子項目的工作,以保證任務(wù)的完成。
(1)用《漢語方言語料采制手冊》規(guī)約并統(tǒng)一研究
該手冊由首席專家牽頭、項目組核心成員集體研究(2013),經(jīng)南京方言試點檢驗后修訂完善(2014上半年)。手冊有上下兩編。上編是“語料采制規(guī)范”,規(guī)范并約定各方言點的采錄內(nèi)容、采錄對象以及錄音、錄像、攝像等技術(shù)指標(biāo),規(guī)范音頻與視頻的剪輯整理、語料標(biāo)注、漢字與國際音標(biāo)的使用、語料入庫路徑,提供快捷轉(zhuǎn)寫語料的方法與相應(yīng)軟件,提供語料庫結(jié)構(gòu)模型,提供音頻、視頻、標(biāo)注、文本等入庫語料的電子安放模板“××方言語料包”。下編是“語料采制底本”,提供各方言通用的字、詞、句、語篇的采錄底本。
(2)用兩級責(zé)任制管束并推進研究
項目組下設(shè)子課題,子課題下設(shè)子項目,子項目對子課題負責(zé)、子課題對項目組負責(zé)。每一方言為一子項目,20方言點隸屬三個子課題:西部北部方言組(北京、東北、中原、蘭銀、膠遼、西南、冀魯官話,晉語),由蘭州城市學(xué)院、華東師范大學(xué)博導(dǎo)莫超教授主持;中部東部方言組(吳語、江淮官話、徽語、湘語),由浙江師范大學(xué)王洪鐘教授主持;南部方言組(粵語、閩語、客家話、贛語),由暨南大學(xué)陳曉錦教授主持。子項目承擔(dān)各方言點語料的研制,包括人員組織、經(jīng)費使用、研究進度、結(jié)項成果等,與項目組簽有協(xié)議書。
(3)用協(xié)助與監(jiān)管來保證各子項目完成任務(wù)
項目組采用通訊(電子郵件、QQ群、電話)、視頻課件、會議、派員等方式,在各方言語料研究的不同階段實施協(xié)助與監(jiān)管,以保證各子項目按設(shè)計要求不走彎路順利完成任務(wù)。
◇語料采錄前:審核采錄底本與發(fā)音人選,提供語料包與語料研究軟件包。
采錄底本與發(fā)音人選是采錄語料的關(guān)鍵,各方言在錄制前要報首席專家審核批準(zhǔn)。
各方言的采錄底本分全國通用與本地特有兩類。通用語料集中于字、詞、句等基礎(chǔ)語料,特有語料集中于語篇。通用語料取自《漢語方言語料采制手冊》,各方言相同,但要將每條語料的編碼改為本方言的唯一碼。特有語料由各方言自擬,有方言特征詞、當(dāng)?shù)厥煺Z、傳說、故事、軼事、歌謠、非遺曲藝、名產(chǎn)、名物等。特有語料底本由各子項目自擬、報首席專家審批,然后將通用底本與特有底本合成本方言采錄底本。再拆分成4位發(fā)音人專用的分角色底本,經(jīng)首席專家審批后再使用。
2015年1月,在語料采錄普遍啟動時,項目組將語料包與軟件包下發(fā)各子項目。語料包是語料研究與語料入庫的電子模板,可使各方言在研究伊始就清楚結(jié)項要求,避免走彎路,同時也規(guī)約并統(tǒng)一各方言的語料采制。軟件包提供6種語料研究軟件,以方便并統(tǒng)一各方言語料采錄。有(1)音頻處理軟件、(2)文件更名軟件、(3)國際音標(biāo)軟件、(4)語篇處理軟件、(5)語音分析軟件、(6)同音類記法與文件更名操作視頻。(6)是培訓(xùn)視頻,講授字表快速記音的“同音類記法”與批量更換文件名的“拖把更名器”的使用方法。
◇語料采錄中
有些方言點技術(shù)力量不足,項目組派員并攜帶設(shè)備協(xié)助,例如哈密、長沙、北京。有些方言點在錄制中遇到問題,項目組則通過電話、短信、電子郵件等協(xié)助解決,例如平遙、廣州、銀川、蘭州、北京、長沙、黟縣、溫州等。
◇語料采錄后
項目組逐一檢查各方言報送的原始語料,及時通告所發(fā)現(xiàn)的問題。
提供語料轉(zhuǎn)寫軟件。語料轉(zhuǎn)寫耗時費力,是語料研究的難點與重點。子課題“方言口語庫的數(shù)字化新技術(shù)研究”(簡稱軟件組)設(shè)兩個分組,專項研究開發(fā)輔助4個子庫轉(zhuǎn)寫語料的軟件與方法。在開始語料轉(zhuǎn)寫前,將這些軟件和方法提供給各方言。
培訓(xùn)專用語料轉(zhuǎn)寫軟件的使用。
2015年11月,軟件組完成了兩款專用軟件和兩種快速記音法的研制,部分方言點完成了語料采錄,即將開始語料轉(zhuǎn)寫。11月7日,項目組召開中期研討會,邀請各方言負責(zé)人和骨干成員參加,議程之一是培訓(xùn)以下4款軟件的使用:
1)詞表標(biāo)音軟件的使用與實習(xí)(鮑培明副教授講授)
2)聲調(diào)分析軟件VoiceSort的使用與實習(xí)(宋益丹講師講授)
3)字表同音類記法的使用與實習(xí)(侯超實驗師講授)
4)詞表快速標(biāo)音法說明與實習(xí)(劉俐李教授講授)
1)和2)是自行研制的軟件,3)和4)是綜合已有軟件、excel表以及方言學(xué)知識研制的字表、詞表快捷標(biāo)音方法。這4種軟件與方法以及后來研制的句表標(biāo)音系統(tǒng)有效提高了語料的標(biāo)音效率。
下圖1是課題組成員學(xué)習(xí)詞表標(biāo)音軟件的場景一角。
圖1 學(xué)習(xí)詞表標(biāo)音軟件
下圖2是課題組成員學(xué)習(xí)聲調(diào)分析軟件VoiceSort的場景一角。后排三人是軟件組成員,彎腰站立者是軟件組的鮑培明副教授,她根據(jù)與會者提出的意見正指導(dǎo)團隊現(xiàn)場修改詞表標(biāo)音軟件的程序。
圖2 學(xué)習(xí)聲調(diào)分析軟件VoiceSort
1.2 軟件研究
2014年7月至今(2016年7月)的兩年里,軟件組研制了兩類軟件。 一是語料庫管理軟件,二是語料轉(zhuǎn)寫軟件。語料庫管理軟件體現(xiàn)語料庫的信息化構(gòu)架并保障其運行,適用于本庫;語料轉(zhuǎn)寫軟件針對語料個體,既可用于本庫語料也可用于其他語料,具有一定通用性。語料轉(zhuǎn)寫軟件是方言研究的數(shù)字化工具。
2014年7月3日,首席專家劉俐李教授召集計算機科學(xué)、地理信息系統(tǒng)、實驗方言學(xué)三領(lǐng)域的項目成員,專題研討語料庫管理軟件及語料轉(zhuǎn)寫軟件的研制。9月中旬,劉俐李教授與軟件組負責(zé)人曲維光教授再次商討,確定了具體研究方案。
1.2.1 字庫與詞庫管理軟件初步完成
由熟悉方言語料庫的計算機學(xué)者鮑培明副教授具體執(zhí)行語料庫管理軟件的研究。本項目所建語料庫有字、詞、句、篇4個子庫,各庫數(shù)據(jù)結(jié)構(gòu)不同,4子庫每條數(shù)據(jù)分別為52、137、38、30字段,管理軟件需要分別設(shè)計與研制。
2014年11月,完成語料庫整體設(shè)計。2015年5月,首先研制出字段最多的字庫與詞庫管理軟件。6月,首席專家與實驗方言學(xué)者查看字庫與詞庫的管理界面,提出修改意見。2015年10月完成修訂,11月7日,在項目中期研討會上演示,全體與會者審閱并提出修改意見。軟件組當(dāng)即研究并修改。會后建立了項目組專用QQ群,交流討論問題。目前已完成修訂,字庫與詞庫的界面已可使用。
句庫與篇庫管理軟件在研制中。
1.2.2 標(biāo)音軟件“語料庫標(biāo)音系統(tǒng)”初步完成
2015年7月完成詞庫標(biāo)音系統(tǒng),經(jīng)方言組試用,提出修改意見,修改后再試用,再修改。2015年 11月7日培訓(xùn)骨干成員學(xué)習(xí)使用,聽取意見,現(xiàn)場修改。在詞庫標(biāo)音系統(tǒng)的基礎(chǔ)上,11月中旬完成句庫自動標(biāo)音系統(tǒng),并將詞庫與句庫標(biāo)音系統(tǒng)合為語料庫標(biāo)音系統(tǒng)。
句庫標(biāo)音系統(tǒng)也可用于語篇標(biāo)音:將語篇拆分為句,即可應(yīng)用從而實現(xiàn)篇庫的快速標(biāo)音,而拆篇為句也是語篇標(biāo)注的要求。由是,語料庫標(biāo)音系統(tǒng)可實現(xiàn)詞、句、篇3個子庫的快速標(biāo)音。
1.2.3 初步完成聲調(diào)分析軟件VoiceSort的研究
聲調(diào)是方言記音中的難題,本項目多采用聲學(xué)語音實驗來完成。聲調(diào)實驗
數(shù)據(jù)的處理是語音學(xué)與方言音系學(xué)的接口,工作量大,處理尺度不易把握,是聲調(diào)實驗研究的難點。本項目研制的聲調(diào)分析軟件VoiceSort可緩解這一難題。
1.2.4 創(chuàng)建字表快速標(biāo)音的“同音類記法”
2015年1月,侯超實驗師與首席專家歸納整理出“同音類記法”。其原理是同音聚類與批量標(biāo)音,作用是給字表快速標(biāo)音。首先要完成方言音系聲韻調(diào)例字的標(biāo)音,然后利用字表中的古音信息聚類,再應(yīng)用EXCEL表的批量處理功能就可快速標(biāo)音。
二、各子課題進展情況
本項目有五個子課題。子課題一是軟件組,研制建庫系列軟件;子課題二、三、四是方言組,負責(zé)方言語料的研究;子課題五研究方言韻律。五個子課題基本依照計劃完成任務(wù)。
2.1 子課題一:軟件組
負責(zé)研究語料庫管理軟件和語料轉(zhuǎn)寫軟件,使語料的處理軟件化或半軟件化。設(shè)兩個分組。第一組由南京師范大學(xué)計算機學(xué)院曲維光教授牽頭、鮑培明副教授負責(zé)。第二組由首席專家劉俐李教授負責(zé),文學(xué)院宋益丹講師、侯超實驗師實施。
第一分組已完成四項工作:
(1)語料庫管理軟件的總體設(shè)計;
(2)字庫和詞庫管理軟件的研制,界面已可使用;
(3)詞庫與句庫標(biāo)音軟件“語料庫標(biāo)音系統(tǒng)”的編程,已提交各方言語料研究小組使用,普遍反映良好;
(4)完成項目組前期成果“現(xiàn)代漢語有聲詞匯庫”的上網(wǎng)改造,并獲得國家專利。
第二分組已完成兩項工作:
(1) 聲調(diào)分析軟件VoiceSort;
(2) 字表快速標(biāo)音的“同音類記法”。
聲調(diào)分析軟件與同音類記法各方言已使用,反映良好。
該組成員同時進行語言處理及計算語言學(xué)的相關(guān)研究,發(fā)表論文2篇,獲得專利1項。
2.2 子課題二:西部北部方言語料研究
負責(zé)北方官話二級分區(qū)及晉語的9個方言點的語料研究。負責(zé)人蘭州城市學(xué)院莫超教授。2014年7月至今(2016年7月),完成了7個方言點的語料采錄,開始語料轉(zhuǎn)寫。另2個方言點預(yù)計2016年12月前完成采錄。
該組成員同時進行本方言的相關(guān)研究,出版專著2部,發(fā)表論文21篇,完成3.3萬字的調(diào)研報告1份,該報告獲市社科聯(lián)科研二等獎。
自2014年至今,該組成員獲得國家社科基金課題2項:語言接觸視閾下的河州方言形成與演變研究(2015),黑龍江省漢語方言地圖集(2016);獲得國家語委、教育部“中國語言資源保護工程專項任務(wù)”5項(山西平遙,黑龍江哈爾濱、肇東,甘肅蘭州、文縣);獲得教育部社科項目1項:絲綢之路經(jīng)濟帶甘肅段語言文字使用狀況研究(2015)。
2.3 子課題三:中部東部方言語料研究
負責(zé)吳語、徽語、湘語、江淮官話共6個方言點的語料研究。負責(zé)人浙江師范大學(xué)王洪鐘教授。
2014年7月至今,6個方言點全部完成語料錄制,已開始語料轉(zhuǎn)寫。
該組成員同時進行本方言的相關(guān)研究,出版著作1部,發(fā)表論文18篇。
自2014年至今,該組成員獲得國家社科基金課題2項:蘇北江淮官話的地理語言學(xué)研究(2015)、南部吳語發(fā)聲類型多維特征參數(shù)實驗研究(2015);教育部人文社科基金課題1項:吳語特殊發(fā)聲類型研究(2014);國家語委、教育部“中國語言資源保護工程專項任務(wù)”3項(浙江江山方言、江山文化、衢州);中國博士后基金課題2項:蘇北方言語音的現(xiàn)狀及歷史演變研究(2014),石臼湖流域方言的地理語言學(xué)研究(2015);省教育廳課題2項:安徽宣州吳語語言資源調(diào)查(2014),湘語與贛語共同特征的歷史比較研究(2014)。
2.4 子課題四:南部方言語料研究
負責(zé)粵語、閩語、客家話、贛語4個方言點的語料研究,負責(zé)人暨南大學(xué)陳曉錦教授。2014年7月至今(2016年7月),該組完成3方言點語料的錄制,開始語料轉(zhuǎn)寫。剩余的1個方言點預(yù)計2016年12月前完成采錄。
該組成員同時進行本方言的相關(guān)研究,發(fā)表論文10篇。
2014年該組成員獲得國家社科基金課題2項(重大與重點各一):海外華人社區(qū)漢語方言與文化研究(重大)、美國華人社區(qū)漢語方言與文化研究(重點)。
2.5 子課題五:方言口語韻律研究
負責(zé)人南京師范大學(xué)顧文濤教授。根據(jù)開題評審專家“收縮任務(wù)”“研究韻律詞變調(diào)”的意見,本組研究任務(wù)有所調(diào)整。
該組目前已完成的研究:
(1) 南京、徐州、蘇州、常州方言句焦點重音的韻律編碼方法的對比研究;
(2) 基于聲調(diào)格局的“邊緣吳語”概念研究;
(3) 仙居話內(nèi)爆音發(fā)聲態(tài)研究。
正在進行的研究:
(1)江淮官話和吳語的發(fā)聲態(tài)研究;
(2)方言區(qū)的情感語音特征研究。
該組成員同時進行韻律及方言的相關(guān)研究,發(fā)表論文6篇。
三、調(diào)查研究
有文獻調(diào)查和實地語料調(diào)查研究兩類。
3.1 文獻調(diào)查
文獻調(diào)查的主要目的是擬制各方言語料采制底本,其次是梳理各方言音系的已有研究。已完成采錄的17方言在2014年7月前已完成文獻調(diào)查,F(xiàn)有3個方言點正在調(diào)查研究相關(guān)文獻。
3方言之一的贛語已完成語料采制底本的擬制,正在查閱梳理音系研究文獻。冀魯官話與中原官話正在調(diào)查研究本方言特有文化與特征詞的相關(guān)文獻,查閱梳理本方言音系研究的相關(guān)文獻,然后撰寫本方言特有語料采制底本與音系研究綜述,預(yù)計于8月底完成并提交審核。
3.2 實地調(diào)研
已完成的17方言點的語料均在方言當(dāng)?shù)卣{(diào)查與錄制。有些方言點調(diào)查與錄制分數(shù)次完成(多在上課期間),有的集中時間一次完成(多在假期)。另3個方言點將于2016年9月至12月赴當(dāng)?shù)卣{(diào)查。
四、舉辦學(xué)術(shù)會議
2015-2016年舉辦了三次學(xué)術(shù)會議:
(1) 本項目中期研討會(項目組全體骨干成員會議,南京,2015)
(2) 2015實驗方言學(xué)論壇(全國性學(xué)術(shù)會議,南京,2015)
(3) 第五屆海外漢語方言國際學(xué)術(shù)研討會(國際學(xué)術(shù)會議,美國舊金山,2016)
4.1本項目中期研討會2015年11月在南京召開
11月6日報到,11月7日召開。項目組全體骨干成員從全國各地赴會(有兩人請假,派員參會)。下圖3為與會者合影。
圖3 項目中期研討會合影
會議有三項議程:(1)匯報課題進展與問題:(2)審議語料庫管理軟件;(3)培訓(xùn)4款語料轉(zhuǎn)寫軟件(方法)。
表2 “漢語方言自然口語有聲基礎(chǔ)語料庫建設(shè)”中期研討會日程
會議按照以上日程順利進行。聚焦點是鮑培明副教授演示的語料庫網(wǎng)頁設(shè)計,與會者提出了各種建設(shè)性意見。其次是各方言點語料采制工作,全體成員具體探討了語料采錄、整理及語料轉(zhuǎn)寫的各類問題。
4款語料轉(zhuǎn)寫軟件(方法)的培訓(xùn)采用講解與現(xiàn)場實習(xí)模式,講解后隨即試用并提出修改意見,講者與聽者均有收益。
4.2 舉辦“2015實驗方言學(xué)論壇”(南京,11月)
這是第二屆實驗方言學(xué)論壇。由中國語言學(xué)會語音學(xué)分會主辦、本項目所屬南京師范大學(xué)文學(xué)院與南京師范大學(xué)綜合語音實驗室承辦。五十余名國內(nèi)外著名實驗語音學(xué)家、方言學(xué)家及青年學(xué)者出席會議,本項目中期會議與會者均出席。下圖是合影。會議的主旨之一是推動方言研究數(shù)字化,這是本項目建設(shè)的兩項目標(biāo)之一。項目組發(fā)布了前期電子成果“現(xiàn)代漢語方言有聲詞匯庫”。
應(yīng)《方言》雜志主編麥耘教授約稿,“2015實驗方言學(xué)論壇”的會訊發(fā)布于《方言》2016年第1期。
圖4 項目組舉辦的全國性學(xué)術(shù)會議的
4.3 舉辦“第五屆海外漢語方言國際研討會學(xué)術(shù)”(2016,美國舊金山)
7月15-17日在美國舊金山召開。由美國舊金山大學(xué)與中國暨南大學(xué)聯(lián)合主辦,本項目子課題負責(zé)人陳曉錦教授是中方主辦人,本項目首席專家與另一位方言子課題負責(zé)人出席。這是漢語方言學(xué)術(shù)會議第一次走出國門,與陳曉錦教授2014年中標(biāo)的國家社科基金重大項目“海外華人社區(qū)漢語方言與文化研究”(14ZDB107)相呼應(yīng)。國際國內(nèi)50余名方言學(xué)者出席會議,中心議題除海外漢語方言與文化的研究外,還包括方言研究的數(shù)字化。
五、學(xué)術(shù)交流
5.1 出席學(xué)術(shù)會議
2014年7月至2016年7月,項目組成員出席國際、國內(nèi)重要學(xué)術(shù)會議50人次。
除由項目組舉辦的“第五屆海外漢語方言國際研討會學(xué)術(shù)”“(2016年7月,美國舊金山)和“2015實驗方言學(xué)論壇”(2015年11月,南京)外,其他重要會議還有:“第十二屆全國語音學(xué)學(xué)術(shù)會議”(2016年7月,通遼),“漢語方言國際學(xué)術(shù)高端論壇”(2015年9月,成都),“首屆亞太語言文化生態(tài)國際會議”(2015年6月,廣州),“中國語言學(xué)會第十七屆學(xué)術(shù)年會” ( 2014年9月,北京),“he 3rd CCF Conference on Natural Language Processing & Chinese Computing(NLPCC 2014)”(2014年12月,深圳),“‘動態(tài)普通話:變異與規(guī)范’首屆學(xué)術(shù)研討會”(2014年11月,澳門),“第47屆國際漢藏語言暨語言學(xué)會議”(2014年10月,昆明),“第十三屆全國計算語言學(xué)學(xué)術(shù)會議(CCL2014)”(2014年10月,武漢),“第十一屆中國語音學(xué)學(xué)術(shù)會議”(2014年8月,烏魯木齊),“Australian International Speech Science and Technology Conference 2014”(2014年12月,新西蘭Christchurch),等。
5.2學(xué)術(shù)講座
2014年7月至2016年7月,項目組成員應(yīng)邀在國內(nèi)外講座11人次。
2016年4月,劉俐李教授應(yīng)邀在南京曉莊學(xué)院做“漢語方言地理信息系統(tǒng)”講座。
2016年4月,顧文濤教授應(yīng)邀在日本東京大學(xué)做“Speech prosody of Chinese languages(漢語演講的韻律)”講座。
2015年11月,顧文濤教授應(yīng)邀在意大利那不勒斯東方大學(xué)做“Quantitative analysis of L1 and L2 Mandarin speech prosody(L1和L2普通話韻律的定量分析)”講座。
2015年9月,顧文濤教授應(yīng)邀在德國基爾大學(xué)做“From function to form in the study of Mandarin speech prosody(漢語韻律的功能與形式研究)”講座。
2015年7月,劉俐李教授應(yīng)全國漢語方言學(xué)會邀請在“漢語方言田野調(diào)查高級研修班”(上海交通大學(xué))做“方言研究數(shù)字化”講座。
2015年4月,劉俐李教授應(yīng)邀在湖南科技大學(xué)做“漢語方言地理信息系統(tǒng)”講座。
2015年3月,莫超教授應(yīng)邀在隴南市政府做“‘氐羌來賓’:遠古走來的白馬藏人”。
2014年12月,顧文濤教授應(yīng)邀在澳大利亞麥考瑞大學(xué)做“Stress, tone and intonation in L2 Mandarin speech by English and Cantonese learners”講座。
2014年11月,劉俐李教授應(yīng)邀在澳門大學(xué)講學(xué)一周,有兩個專題:(1)現(xiàn)代語音學(xué)研究與應(yīng)用;(2)方言音系(聲韻調(diào))的系列實驗研究。
2014年8月,劉俐李教授應(yīng)全國漢語方言學(xué)會邀請在“2014田野調(diào)查語音學(xué)研修班”(珠海)講授“方言音系實驗”。
六、成果宣傳推介情況
成果推介。項目組在“2015實驗方言學(xué)論壇”宣傳并推介前期電子成果“現(xiàn)代漢語方言有聲詞匯庫”。
2014年7月至今(2016年7月),項目組在《中國社會科學(xué)報》發(fā)表4篇文章介紹本項目學(xué)術(shù)思想與研究成果:“數(shù)字化推動特色方言口語庫建設(shè)”(2014/8/11),“漢語河州話的形成及其語言性質(zhì)”(2015/9/10),“從西北方言文獻角度考察文化變遷”(2016/2/25),“氐羌來賓”:遠古走來的白馬藏人”(2015/4/15)。
本項目倡導(dǎo)并實踐的“方言研究數(shù)字化”已為國家社科規(guī)劃辦采納,列為2014年度國家社會科學(xué)基金項目語言學(xué)課題指南的第12號“方言研究數(shù)字化基礎(chǔ)建設(shè)研究”(首席專家劉俐李教授2011年將“方言研究數(shù)字化基礎(chǔ)建設(shè)”上報“國家哲學(xué)社會科學(xué)重大基礎(chǔ)理論研究選題建議”)。
工作簡報。2014年7月呈報中期評估報告(1.76萬字),2015年7月撰寫了中期評估報告(2.37萬字,上報未收),12月呈報《工作簡報》(0.8萬字)。
七、研究中存在的主要問題和改進措施
因經(jīng)費少、工作量大而造成一些操作性困難。開題時項目組根據(jù)下?lián)芙?jīng)費情況收縮了任務(wù),但方言布點與語料庫結(jié)構(gòu)只能微調(diào)無法大減,否則會傷及項目的基礎(chǔ)設(shè)計。項目組想方設(shè)法應(yīng)對這一困難,主管單位也盡力協(xié)助。
7.1 因任務(wù)重經(jīng)費少有6方言負責(zé)人請辭
方言子項目負責(zé)人先后有6人請辭(贛語、閩語(2)、客家話、冀魯官話與西南官話)。
不少方言點負責(zé)人同時承擔(dān)國家語委、教育部的“中國語言資源保護工程專項任務(wù)”。該項目每方言點撥經(jīng)費8萬(方言語料)和15萬(文化語料),本項目只有2萬。以8萬計,為本項目的4倍,而本項目工作量為其4倍多(見表3數(shù)據(jù))。負責(zé)人請辭也是事出有因。
表3 兩項目單方言點語料量及經(jīng)費對比
解決辦法:改由項目組承擔(dān)此6方言的語料研制。
項目組曾多方設(shè)法另找方言點負責(zé)人,但無合適者:或本人愿意但與課題要求不符,或雖符合課題要求而本人得知任務(wù)后又打退堂鼓。
問題雖已解決,但此6方言進度后延,影響到項目的整體進度。原計劃2016年12月完成全部語料研制,2017年試運行語料庫并完善語料庫管理軟件。但此6方言的語料研制預(yù)計分別于2017年與2018年完成,原定2017年的工作只得順延。
二、研究成果情況
一、代表性成果
以下所列5項成果均與方言研究的革新和數(shù)字化有關(guān),方言研究數(shù)字化是本項目的建設(shè)目標(biāo)之一。
國家社科重大項目除完成所設(shè)定的研究任務(wù)外,還應(yīng)有益于學(xué)科建設(shè)。漢語方言學(xué)從20世紀(jì)20年代誕生至今已近一個世紀(jì),碩果累累。但需要發(fā)展。我們認為,漢語方言學(xué)承繼先賢智慧與碩果,對語言靜態(tài)基礎(chǔ)單位字、詞的研究已達極致,儲備了足夠的發(fā)展勢能。探索語言動態(tài)運作基本單位語篇,應(yīng)是本世紀(jì)漢語方言學(xué)發(fā)展的重要方向,因為語篇的動態(tài)研究更能揭示語言本質(zhì),故此,國際語言學(xué)界近年推崇立足于語篇研究的功能語言學(xué)。但研究語篇的工作量遠大于字詞,傳統(tǒng)的作坊式手工勞動已不能勝任,與之匹配的應(yīng)是方言研究的數(shù)字化,包括①采錄語料數(shù)字化,②確定語料音質(zhì)實驗數(shù)據(jù)化,③轉(zhuǎn)寫標(biāo)注語料軟件化,④匯集語料數(shù)據(jù)庫化,⑤繪制方言地圖平臺化,⑥刊布成果自控化(《中國社會科學(xué)報》2014年8月11日)。所報5項成果與上述①至④有關(guān)。這5項成果都很稚嫩,但這是我們邁出的第一步,祈望能拋磚引玉,推動方言研究的數(shù)字化發(fā)展。
1.1《漢語方言語料采制手冊》(16.6萬字)
這是本項目工作的法規(guī)性文件。2013年完成初稿,2014年試用后修訂,2015年再試用再修訂,同年11月在項目中期研討會印發(fā)紙質(zhì)本。該手冊分上下兩編。
如上所述,轉(zhuǎn)型語篇研究是本世紀(jì)漢語方言學(xué)發(fā)展的重要方向,本手冊下編為方言學(xué)轉(zhuǎn)型提供了語料采集的初本。與方言語篇研究匹配的研究方式是方言研究的數(shù)字化,本手冊上編提供了語料采集數(shù)字化初案。
上編有梳理資料、采錄語料與整理語料三項規(guī)范。
(1)資料規(guī)范:有擬制文化語料及特征詞規(guī)范,確定音系規(guī)范。
(2)采錄規(guī)范:有采錄對象、采錄內(nèi)容、音頻采錄與處理、視頻采錄與處理、拍照等五項規(guī)范。同時提供具體操作指導(dǎo)。
(3)語料整理規(guī)范:有音頻與視頻剪輯、轉(zhuǎn)寫漢字、標(biāo)注國際音標(biāo)、字詞標(biāo)注及復(fù)核、例句標(biāo)注及復(fù)核、語篇標(biāo)注、數(shù)據(jù)模板、入庫數(shù)據(jù)語料包等八項操作規(guī)范。同時寫明各類軟件的使用方法、操作步驟與具體要求。
下編有語料概覽、基礎(chǔ)語料與語篇語料三部分。
(1)語料概覽:用6張表列出采錄底本的結(jié)構(gòu)、語料種類、數(shù)量,各類語料錄制時長、錄制方式,不同角色發(fā)音人的具體任務(wù)。
(2)基礎(chǔ)語料:有單字4002個,雙音節(jié)韻律詞546組(研究變調(diào)用),詞匯約5600(核心詞200、基礎(chǔ)詞29類5260詞、特征詞100-300),語法例句100。
(3)語篇語料:有話本、話題、自話三類。話本語篇有六類,分所有方言通用與各方言特用。話題語篇有四類:單口敘述型、多口交互型、儀式型、藝術(shù)型,每類提供話題及引導(dǎo)詞。自話語篇有自然場景與特定場景兩種。
上編集中闡述采制方言語料的數(shù)字化方式與技術(shù)手段。下編是以語篇為核心的自成體系的語篇采錄大綱。就我們目力所及,語篇調(diào)查大綱在漢語方言學(xué)界尚未見,本手冊應(yīng)是首次。
1.2 現(xiàn)代漢語方言有聲詞匯庫V1.0(網(wǎng)址:fych.njnu.edu.cn,4.94G)
語料庫是儲存語料的數(shù)字化方式!艾F(xiàn)代漢語方言有聲詞匯庫”是本項目的前期成果,可在網(wǎng)上查詢使用,是一個兼顧語音的方言有聲詞匯庫。2016年取得國家計算機軟件著作權(quán)(登記號2016SR157089)。由兩期211重點學(xué)科建設(shè)項目資助建設(shè),10年中約40名碩士生、博士生參與研究。2008年建成單機光盤版,2012年改造成網(wǎng)絡(luò)版。經(jīng)多次語料復(fù)核后2015年11月上網(wǎng),更名為“現(xiàn)代漢語方言有聲數(shù)據(jù)庫”(該庫還有二期建設(shè)的其他語料,但未完成復(fù)核,未上網(wǎng),該庫目前只有詞匯)。下圖是其首頁。
圖8 “現(xiàn)代漢語方言有聲詞匯庫”首頁
該庫所選方言點分布于全國10大方言區(qū),覆蓋官話的8個二級區(qū),以及湘、閩、吳語的部分二級區(qū)。每方言點錄制詞匯3600~4000條。每條數(shù)據(jù)有26字段,分5類:詞項,詞屬,詞音,詞義,詞性。詞項是綱,統(tǒng)領(lǐng)各方言詞義;“詞屬”標(biāo)明每一詞條的詞匯大類(基礎(chǔ)詞、核心詞、特征詞);“詞音、詞義、詞性”
描寫詞條的內(nèi)部構(gòu)造。詞音與詞義并注,聲音與文本同現(xiàn),集中反映方言詞匯的共性和個性?蓮姆窖、詞項、詞屬、詞音、詞義、詞性等不同角度檢索詞匯,還可進行聲母、韻母、韻尾、調(diào)類、調(diào)值、音節(jié)數(shù)等單項或多項語音檢索。可選擇單點或多點方言組合檢索。可在檢索結(jié)果中進行10次再檢索。每種檢索同時匹配文本與聲音,并有計數(shù)?捎糜谡Z音、詞匯的專項研究,也可用作教學(xué)演示,如方言課、語音課,中小學(xué)語文課,文化課等,也可供社會使用。
本項目所建語料庫與此詞匯庫不同:(1)本項目所建庫有字庫、詞庫、句庫和語篇庫,該庫只是兼顧語音的詞匯庫;(2)本項目詞庫每方言有5600詞,該庫是3600~4000詞;(3)本項目詞庫數(shù)據(jù)有137字段,該庫為26字段;(4)兩庫的方言布點與發(fā)音人皆有不同。
1.3 語料庫標(biāo)音系統(tǒng)
這是一個給方言詞和方言句子自動標(biāo)注國際音標(biāo)的軟件。由鮑培明副教授團隊研制。軟件自身占用空間6兆。無需安裝,直接復(fù)制即可使用。該標(biāo)音系統(tǒng)附有使用說明,有文有圖,按圖索驥便可操作。使用前將要標(biāo)音的詞表、句表與已標(biāo)好音的字表復(fù)制到軟件指定位置。然后運行程序,即可自動完成詞表與句表的標(biāo)音。漢字標(biāo)音后需要手動標(biāo)注詞匯中的音變,如變調(diào)、變聲與變韻。
本項目各方言已使用,普遍反映提高了標(biāo)音效率。其他方言也可使用,前提是按照本項目字表、詞表與句表的格式輸入數(shù)據(jù)。
1.4 同音類記法
是一種快速記音法,基本原理是聚類同音字、批量記音,而不必一字一記。按照同音聚類原理,利用EXCEL表的批量處理功能,即可實現(xiàn)字表的快速記音。關(guān)鍵步驟是聚類同音字、批量記音與校音。記音的第一步是給方言音系的聲韻調(diào)例字標(biāo)注方音;第二步利用方音與古音的對應(yīng)關(guān)系聚類同音字;第三步用EXCEL表的批量處理功能記錄字音;第四步關(guān)聯(lián)漢字音檔與標(biāo)音,運用同音校對法核對標(biāo)記的字音,校正與古音不對應(yīng)的字音。
該方法由侯超實驗師與劉俐李教授歸納整理。
1.5方言聲調(diào)分析軟件VoiceSort
這是一款用于分析和歸納方言聲調(diào)的軟件。由宋益丹講師研制。
軟件的設(shè)計思路是對接praat基頻提取腳本,實現(xiàn)方言聲調(diào)五度值轉(zhuǎn)換的批量處理,提升方言聲調(diào)系統(tǒng)歸納的效率。VoiceSort分析和歸納方言聲調(diào)系統(tǒng)的
優(yōu)勢:
(1)根據(jù)五度值曲線進行調(diào)類歸納,不受主觀因素干擾,聲調(diào)系統(tǒng)的歸納過程更具科學(xué)性,并有助于發(fā)現(xiàn)聲調(diào)系統(tǒng)的動態(tài)變化;
(2)批量處理多個文件(如老男、老女、青男、青女),無需分次打開,大大提高聲調(diào)歸納的效率;
(3)所有樣本的作圖自動完成,一步到位;數(shù)據(jù)與圖表直接以excel表形式輸出,便于數(shù)據(jù)匯總和結(jié)果呈現(xiàn)。
目前已完成單字調(diào)的分析部分,預(yù)計于2017年1月完成雙字調(diào)系統(tǒng)的自動化處理,實現(xiàn)軟件的全部功能。
同音類記法、語料庫標(biāo)音系統(tǒng)與方言聲調(diào)分析軟件VoiceSort,是針對本項目字表、詞表、句表的標(biāo)音以及聲調(diào)研究的數(shù)據(jù)處理工具,覆蓋了本項目4個子庫的語料標(biāo)音(語篇可拆分成句應(yīng)用標(biāo)音系統(tǒng))。這套方言研究的系列數(shù)字化工具有效緩解了本項目語料標(biāo)注的難題,同樣也應(yīng)有助于其他同類研究。
2014年至2016年,項目組成員獲立國家社科基金課題6項,其中重大項目1項,重點課題1項。
二、成果清單 見下頁。
成果清單
課題組供稿