黨的十八大以來,習(xí)近平總書記高度重視語言文字工作,對(duì)推廣普及國(guó)家通用語言文字、傳承弘揚(yáng)中華優(yōu)秀語言文化等作出一系列重要指示,為我國(guó)語言資源建設(shè)進(jìn)一步指明了方向,確立了根本遵循。近年來,學(xué)術(shù)界、社會(huì)上對(duì)于語言資源建設(shè)的重要意義正在形成越來越廣泛的共識(shí),認(rèn)為語言和基因一樣,是附著于人類自身的物質(zhì)存在,不僅承載著人類思維和經(jīng)驗(yàn),還承載著族群的歷史和文化,亟待調(diào)查、整理、保護(hù)、傳承。隨著這一認(rèn)識(shí)理念的深化和傳播,尤其是借助大數(shù)據(jù)時(shí)代提供的各種便利條件,語言資源建設(shè)在全國(guó)范圍如火如荼開展起來,各個(gè)語言資源建設(shè)中心如雨后春筍,紛紛破土而出、茁壯成長(zhǎng),呈現(xiàn)出生機(jī)勃勃的景象。
新中國(guó)的語言資源建設(shè)成就前所未有
我國(guó)歷來重視語言資源,在語言資源的建設(shè)方面取得了許多成就,如石文碑刻、韻書字典等,但也有缺憾和不足,如偏重書面語、對(duì)口語較為忽視等。新中國(guó)成立以來,黨和政府在繼承基礎(chǔ)上大膽創(chuàng)新,語言資源建設(shè)取得了前所未有的成就。
新中國(guó)成立之初,我國(guó)語言資源建設(shè)處于草創(chuàng)期,主要工作在于語言普查和文字創(chuàng)制。1956年,全國(guó)漢語方言普查和民族語普查幾乎同步開展。草創(chuàng)期語言資源建設(shè)的主要方式是使用卡片展開記錄。20世紀(jì)八九十年代,我國(guó)語言資源建設(shè)進(jìn)入發(fā)展期,語言資源建設(shè)手段更加多元、工作更為深入,集中表現(xiàn)為:一是繪制《中國(guó)語言地圖集》,全面反映了我國(guó)漢語方言和少數(shù)民族語言分布的復(fù)雜面貌。二是出版語言志書、語言研究叢書和系列詞典等。各地不僅新修方志都增加了方言志,而且專門的方言志、民族語言志也大量出現(xiàn),如“山西省方言志叢書”等。語言研究叢書中較有代表性的是賀巍、張振興主持的“漢語方言重點(diǎn)調(diào)查”的成果,以及中國(guó)社會(huì)科學(xué)院民族學(xué)與人類學(xué)研究所組織編寫的《中國(guó)新發(fā)現(xiàn)語言研究叢書》和《中國(guó)少數(shù)民族語言方言研究叢書》。影響較大的詞典是中國(guó)社會(huì)科學(xué)院語言研究所組織編纂的《現(xiàn)代漢語方言大詞典》41種分卷本和中國(guó)社會(huì)科學(xué)院民族學(xué)與人類學(xué)研究所主編的“中國(guó)少數(shù)民族語言系列詞典叢書”。三是建立了一批方言音檔,其中較有代表性的是侯精一組織建設(shè)的“現(xiàn)代漢語方言音庫”,內(nèi)含漢語方言40種代表點(diǎn)的語音系統(tǒng)、字音、詞匯、語法例句和長(zhǎng)篇語料。四是組織了數(shù)次語言使用情況調(diào)查,如中國(guó)社會(huì)科學(xué)院民族學(xué)與人類學(xué)研究所和加拿大拉瓦爾大學(xué)合作,按照語言活力參項(xiàng)框架展開的少數(shù)民族語言文字使用情況調(diào)查。發(fā)展期的語言資源建設(shè)仍以紙筆調(diào)查為主,已經(jīng)涉及現(xiàn)代化錄音技術(shù),實(shí)現(xiàn)了自然語音采錄。21世紀(jì)以來,我國(guó)語言資源建設(shè)迎來了繁榮期,其特點(diǎn)在于實(shí)驗(yàn)語音等現(xiàn)代手段和多媒體技術(shù)的普遍應(yīng)用,集中表現(xiàn)為出了若干有分量、有代表性的重大學(xué)術(shù)成果,如《中國(guó)的語言》《漢語方言地圖集》和“新時(shí)期中國(guó)少數(shù)民族語言使用情況研究叢書”等。這一時(shí)期,國(guó)家層面組織了幾次較大的語言保護(hù)工作。如2015年,教育部、國(guó)家語委啟動(dòng)“中國(guó)語言資源保護(hù)工程”,利用現(xiàn)代化技術(shù)記錄漢語方言、民族語言和口頭語言文化的動(dòng)態(tài)語料,成果形式為語言志、語言文化典藏、語言地圖集和語言資料深度開發(fā)服務(wù)等。
直面大數(shù)據(jù)時(shí)代語言資源建設(shè)的機(jī)遇與挑戰(zhàn)
近年來,隨著計(jì)算機(jī)和互聯(lián)網(wǎng)技術(shù)的發(fā)展,語言學(xué)的研究逐漸進(jìn)入了大數(shù)據(jù)時(shí)代。一些龐大的語言數(shù)據(jù)庫紛紛建立起來。不過,數(shù)據(jù)庫材料來源良莠不齊,記音方法各不相同,給學(xué)術(shù)界使用這些資料帶來困難,也影響了以此為素材進(jìn)一步分析得出結(jié)論的可信性和科學(xué)性。對(duì)語言資源建設(shè)而言,大數(shù)據(jù)既是機(jī)遇,又有挑戰(zhàn)。
一是對(duì)語言資源建設(shè)的規(guī)模提出了更高的要求。以語言地圖的繪制為例,《漢語方言地圖集》中以各地?cái)?shù)百個(gè)方言中“家”字的讀音,反映見母開口二等字在現(xiàn)代漢語方言的語音面貌。大數(shù)據(jù)時(shí)代的語言資源建設(shè),要求我們必須獲取海量數(shù)據(jù),既不能僅限于幾百個(gè)方言點(diǎn)的材料,更不只是以“家”這一個(gè)字的讀音來代替見母開口二等這一批字。我們可以通過全國(guó)方言材料來獲取一大批見母開口二等字在一兩千個(gè)現(xiàn)代漢語方言土語中的語音形式,用大數(shù)據(jù)的方法規(guī)避個(gè)別數(shù)據(jù)錯(cuò)誤所帶來的影響,使研究的結(jié)論更為科學(xué)。
二是對(duì)語言資源建設(shè)的人才和技術(shù)提出了更高的要求。比如,如何調(diào)試信噪比、如何避免撲麥和削波等現(xiàn)象,從而獲取高質(zhì)量、高保真的錄音材料,建設(shè)有聲語言數(shù)據(jù)庫;如何開發(fā)設(shè)計(jì)同音校驗(yàn)軟件,組織專業(yè)人士對(duì)調(diào)查材料進(jìn)行反復(fù)校驗(yàn),從而確保材料準(zhǔn)確可靠;如何進(jìn)一步建設(shè)聲學(xué)參數(shù)數(shù)據(jù)庫,如何深入挖掘數(shù)據(jù)、利用語言數(shù)據(jù)展開深入的專業(yè)研究。這不僅需要對(duì)調(diào)查人員和研究人員進(jìn)行相應(yīng)的技能培訓(xùn),而且大數(shù)據(jù)時(shí)代所帶來的研究范式的改變,迫使研究人員不斷提高專業(yè)素養(yǎng)和研究能力。
三是對(duì)語言資源建設(shè)的標(biāo)準(zhǔn)化和規(guī)范化提出了新的要求。除了需要建立行業(yè)統(tǒng)一的記音規(guī)范和錄音規(guī)范,使不同人員和不同團(tuán)隊(duì)的調(diào)查數(shù)據(jù)可以統(tǒng)一開發(fā)利用,我們還需對(duì)以往的調(diào)查數(shù)據(jù)進(jìn)行檢驗(yàn)整理和二次規(guī)范,從而建設(shè)更為龐大的語言資源數(shù)據(jù)庫。統(tǒng)一規(guī)范的制定,需要業(yè)內(nèi)專家們共同擬定并達(dá)成學(xué)界共識(shí);如何對(duì)已有數(shù)據(jù)庫迅速實(shí)現(xiàn)機(jī)助校驗(yàn)和二次規(guī)范,更是需要深入探討的問題。
把握大數(shù)據(jù)時(shí)代語言資源建設(shè)新特點(diǎn)
當(dāng)前,借助于飛速發(fā)展的現(xiàn)代信息技術(shù),語言資源建設(shè)駛上快車道,呈現(xiàn)出若干新趨勢(shì)、新特點(diǎn)。一是高度集聚、整體推進(jìn)。黨和國(guó)家的高度重視、政府和相關(guān)單位的大規(guī)模投入以及廣大優(yōu)秀人才的積極參與,都將使我國(guó)語言資源建設(shè)取得豐碩成果。隨著相關(guān)項(xiàng)目組織越來越有效、調(diào)查越來越集中、研究越來越規(guī)范,語言資源建設(shè)會(huì)出現(xiàn)相對(duì)集聚、高度融合的態(tài)勢(shì),并形成一定程度的規(guī)模效應(yīng),進(jìn)而促進(jìn)整體發(fā)展。我國(guó)語言資源建設(shè)將呈現(xiàn)更集聚、更綜合、更系統(tǒng)的勢(shì)頭,推動(dòng)語言資源得到統(tǒng)一規(guī)劃、綜合開發(fā),從而實(shí)現(xiàn)整體發(fā)展,形成規(guī)模效應(yīng),以更好地為國(guó)家語言戰(zhàn)略、社會(huì)語言生活和語言學(xué)術(shù)研究服務(wù)。
二是共建共享、團(tuán)結(jié)合作?v觀全國(guó)語言資源建設(shè)的發(fā)展脈絡(luò)和運(yùn)行軌跡,可以發(fā)現(xiàn)其發(fā)展和運(yùn)行的每個(gè)步驟、每一環(huán)節(jié)都離不開共建共享、團(tuán)結(jié)合作。新時(shí)代的語言資源建設(shè)對(duì)此提出了新的更高要求,這不是某個(gè)單位、某個(gè)團(tuán)隊(duì)就能做好的,而是需要多個(gè)領(lǐng)域、多個(gè)單位、多個(gè)地域的專家學(xué)者和科研人員共同參與、群策群力,發(fā)揮出集團(tuán)作戰(zhàn)優(yōu)勢(shì)。如國(guó)家語委和教育部的語言資源建設(shè)都是舉全國(guó)之力,各大科研院所和高校幾乎全部投入,無一置身事外。通過合作共建,加大了人類語言音變通則提取的可能性,促進(jìn)了演化語言學(xué)的長(zhǎng)足發(fā)展,既能八仙過海、各顯神通,又能群英薈萃、百舸爭(zhēng)流。一方面,田野調(diào)查的錄音設(shè)備和技術(shù)可以共享,以提升整體的攝錄質(zhì)量;由各人調(diào)查記錄自己所擅長(zhǎng)和熟悉的語言或方言,能夠提升整體的專業(yè)質(zhì)量。另一方面,調(diào)查成果也可以共享,研究成果可以互促。一旦有了語言數(shù)據(jù)庫的有力支撐,有時(shí)候表面看起來雜亂無章的現(xiàn)象,也能夠通過計(jì)算、處理和分析,挖掘出潛藏的重要信息。
三是形式多樣、內(nèi)容豐富。以前的語言資源建設(shè)和保護(hù)工作,形式較為簡(jiǎn)單,內(nèi)容也十分有限,最終形成只有專業(yè)人士才能看懂的語言或方言調(diào)查報(bào)告。相比之下,現(xiàn)在的語言資源建設(shè)和保護(hù)工作發(fā)生了歷史性變化。形式上,不再限于書面的紙筆記錄,已經(jīng)擴(kuò)大到高質(zhì)量、高保真的聲音和圖像攝錄。內(nèi)容上,不僅限于方言字表、詞表或民族語義項(xiàng)表的調(diào)查記錄,還涵蓋豐富的民歌、故事、曲藝、說唱、成語、歇后語、口傳文化、非物質(zhì)文化遺產(chǎn)等內(nèi)容。成果上,不僅包括語言調(diào)查報(bào)告及其有聲資料,還有方言和民族語電影、小品、相聲等。隊(duì)伍上,與過去只有學(xué)者和學(xué)生參與語言資源建設(shè)工作不同,如今的語言資源建設(shè)隊(duì)伍更加壯大,除了語言學(xué)專業(yè)人士,還會(huì)邀請(qǐng)媒體加盟,舉辦一系列宣傳活動(dòng),受到普遍歡迎。效果上,過去的語言資源建設(shè)成果,主要用于小眾的語言研究,現(xiàn)在的語言資源建設(shè)成果,不僅促進(jìn)了語言學(xué)大發(fā)展大繁榮,更為國(guó)家語言戰(zhàn)略、規(guī)劃和政策的制定實(shí)施提供了可靠依據(jù),為各民族之間交往交流提供了平臺(tái)和服務(wù),大大豐富了社會(huì)公眾的語言文化生活。
放眼未來,語言資源建設(shè)充滿希望,是一項(xiàng)需要共同奮斗、長(zhǎng)期堅(jiān)持的任務(wù)。只要解放思想、與時(shí)俱進(jìn),將語言資源建設(shè)置于社會(huì)進(jìn)步和文化繁榮的大背景之下,充分調(diào)動(dòng)各方面資源,廣泛匯聚各方面力量,就能夠更好地開發(fā)、保護(hù)和利用中國(guó)的語言資源,使語言資源建設(shè)始終能夠與國(guó)家齊發(fā)展、同時(shí)代共進(jìn)步。
(作者單位:中國(guó)社會(huì)科學(xué)院民族學(xué)與人類學(xué)研究所)