隨著5G、語言智能和物聯(lián)網(wǎng)的快速發(fā)展,人類社會正在發(fā)生劃時(shí)代的變化。人類的認(rèn)識也應(yīng)隨著時(shí)代進(jìn)步而不斷更新,重新審視已然,及時(shí)預(yù)判將然。語言究竟是一種什么現(xiàn)象?語言學(xué)究竟如何發(fā)展?就是需要審視、需要預(yù)判的。
1. 語言數(shù)據(jù)是生產(chǎn)要素
生產(chǎn)要素與生產(chǎn)力發(fā)展水平和經(jīng)濟(jì)制度密切相關(guān)。數(shù)據(jù)具有生產(chǎn)要素性質(zhì),只有信息化發(fā)展到一定階段才能成為現(xiàn)實(shí),才能被人認(rèn)識。
早在2017年12月8日,習(xí)近平總書記就提出“要構(gòu)建以數(shù)據(jù)為關(guān)鍵要素的數(shù)字經(jīng)濟(jì)”。之后,在2018年4月“首屆數(shù)字中國建設(shè)峰會”(福州)、2018年5月中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會、2018年9月江蘇互聯(lián)網(wǎng)大會,以及2019年12月第六屆中國國際大數(shù)據(jù)大會上,都突出了“數(shù)據(jù)是數(shù)字經(jīng)濟(jì)關(guān)鍵要素”的話題。特別是在2018江蘇互聯(lián)網(wǎng)大會上,工業(yè)和信息化部總經(jīng)濟(jì)師王新哲強(qiáng)調(diào),“以數(shù)據(jù)作為關(guān)鍵生產(chǎn)要素的數(shù)字經(jīng)濟(jì)正在成為繼農(nóng)業(yè)經(jīng)濟(jì)、工業(yè)經(jīng)濟(jì)之后的新型經(jīng)濟(jì)形態(tài)”。至此,人們獲得了兩個(gè)基本認(rèn)識:1.數(shù)字經(jīng)濟(jì)是繼農(nóng)業(yè)經(jīng)濟(jì)、工業(yè)經(jīng)濟(jì)之后的新型經(jīng)濟(jì)形態(tài);2.數(shù)字經(jīng)濟(jì)的關(guān)鍵生產(chǎn)要素是數(shù)據(jù)。
黨的十九屆四中全會提出,“健全勞動、資本、土地、知識、技術(shù)、管理、數(shù)據(jù)等生產(chǎn)要素由市場評價(jià)貢獻(xiàn)、按貢獻(xiàn)決定報(bào)酬的機(jī)制!边@是對數(shù)據(jù)具有生產(chǎn)要素性質(zhì)這一認(rèn)識的總結(jié),把數(shù)據(jù)與勞動、資本、土地、知識、技術(shù)、管理并列為第七大生產(chǎn)要素,可以通過市場按貢獻(xiàn)取酬。這是重大的理論創(chuàng)新,體現(xiàn)著對信息化社會的本質(zhì)認(rèn)識,是在數(shù)字經(jīng)濟(jì)快速發(fā)展背景下經(jīng)濟(jì)制度的與時(shí)俱進(jìn)。
一般認(rèn)為,數(shù)據(jù)是信息的表現(xiàn)形式和載體。隨著科技與社會的進(jìn)步,數(shù)據(jù)的內(nèi)涵和外延都可能會發(fā)生變化。但有一點(diǎn)現(xiàn)在是可以肯定的,那就是多數(shù)數(shù)據(jù)都是“語言數(shù)據(jù)”。其一,語言(包括文字)是人類信息最為重要的載體,大約80%的信息是用語言負(fù)載的。沒有用語言負(fù)載的信息,也常常需要語言來幫助闡釋,比如圖畫、雕塑、音樂、服裝、建筑等藝術(shù)。其二,語言資源本身也是語言數(shù)據(jù)。語言數(shù)據(jù)是最為重要的數(shù)據(jù),應(yīng)當(dāng)屬于“生產(chǎn)要素”范疇。
語言數(shù)據(jù)是信息時(shí)代的生產(chǎn)要素,如同土地之于農(nóng)民,機(jī)器之于工人,計(jì)算機(jī)通過對語言數(shù)據(jù)的加工學(xué)習(xí)可以獲得知識與智能,從而去創(chuàng)造人類的新生活。隨著語言智能的發(fā)展,語言數(shù)據(jù)的生產(chǎn)要素屬性定會越來越清晰。
2.語言數(shù)據(jù)納入數(shù)字經(jīng)濟(jì)視野
20世紀(jì)50年代,人類就開始進(jìn)行機(jī)器翻譯的嘗試,訓(xùn)練機(jī)器進(jìn)行語言信息處理的進(jìn)程由此開始。中文信息處理經(jīng)過字處理、詞處理階段的艱難行進(jìn),已順利步入話語處理階段,努力讓計(jì)算機(jī)具有語言智能。信息檢索、自動翻譯、機(jī)器寫作、人機(jī)對話等領(lǐng)域的快速進(jìn)展,得益于語言大數(shù)據(jù)的集聚與應(yīng)用。
語言是人類獨(dú)有的符號系統(tǒng),這是語言學(xué)的經(jīng)典認(rèn)識。但是隨著語言智能的發(fā)展,語言將為人類和機(jī)器這兩個(gè)“物種”共同享有。如今重要的語言交際,多數(shù)都是“人-機(jī)-機(jī)-人”的交際,是“人-機(jī)”“機(jī)-機(jī)”“機(jī)-人”的合成,疫情期間的云端會議、線上課程、網(wǎng)絡(luò)購物、網(wǎng)上就醫(yī)等,都屬于這種交際模式。如果與“人形機(jī)器人”對話,機(jī)器擁有語言這一現(xiàn)象,就會看得更為明顯。隨著物聯(lián)網(wǎng)的發(fā)展,只要在需要驅(qū)動的目的物上植入“語言感應(yīng)器”,人就可以通過具有語言智能的機(jī)器與萬物關(guān)聯(lián),與萬物對話,使萬物具有“語言智能”。
2018年12月召開的中央經(jīng)濟(jì)工作會議重新定義了基礎(chǔ)設(shè)施建設(shè),把5G、人工智能、工業(yè)互聯(lián)網(wǎng)、物聯(lián)網(wǎng)定義為“新型基礎(chǔ)設(shè)施建設(shè)”,簡稱“新基建”。一年多來,新基建的內(nèi)容不斷豐富,面貌逐漸清晰。新基建不僅是信息網(wǎng)絡(luò)等的基礎(chǔ)設(shè)施建設(shè),還讓基建物具有“智能”,特別是語言智能,以便實(shí)現(xiàn)人與萬物的關(guān)聯(lián)對話。
與信息相關(guān)的產(chǎn)業(yè),有許多是語言產(chǎn)業(yè)。在較高的工業(yè)化時(shí)代,據(jù)瑞士語言經(jīng)濟(jì)學(xué)家的研究,語言產(chǎn)業(yè)為社會GDP的貢獻(xiàn)接近10%。信息化時(shí)代,數(shù)據(jù)可以成為生產(chǎn)要素的時(shí)代,語言產(chǎn)業(yè)的經(jīng)濟(jì)能量會大幅提升,可以預(yù)測,沒有語言產(chǎn)業(yè)的繁榮,發(fā)展不出繁榮的數(shù)字經(jīng)濟(jì)。
未來,也許是不久的未來,語言數(shù)據(jù)將成為重要的生產(chǎn)要素,語言將進(jìn)入重要的生產(chǎn)力范疇。集聚、管理語言數(shù)據(jù)并使其發(fā)揮最大作用,將成為發(fā)展生產(chǎn)的重要任務(wù),語言產(chǎn)業(yè)、語言職業(yè)將成為數(shù)字經(jīng)濟(jì)的一方重要支柱。
3. 語言與物理、社會、信息“三元空間”
人類形成之前,世界就是自然界,只是一個(gè)“物理空間”。人類的形成與發(fā)展,便在物理空間中生長出一個(gè)“社會空間”。語言與社會空間一起成長,大約距今3到5萬年前的舊石器時(shí)代,人類已有較成熟的口頭語言,口語的載體是聲波。大約距今5000至5500年前,文字在兩河流域產(chǎn)生,語言有了新載體光波。20世紀(jì)20年代,廣播、電視相繼出現(xiàn),有聲媒體使語言有了第三大載體電波。20世紀(jì)末,互聯(lián)網(wǎng)商業(yè)化,語言信息處理也快速進(jìn)步,人類開始建構(gòu)一個(gè)新空間——“信息空間”,也就是常說的“虛擬空間”“網(wǎng)絡(luò)空間”。潘云鶴院士2019年在題為《人工智能2.0與數(shù)字經(jīng)濟(jì)》的報(bào)告中,敏銳指出人類正由傳統(tǒng)的“物理空間”“人類社會”二元空間,逐步進(jìn)入了“物理空間”“人類社會”“信息空間”所構(gòu)成的三元空間。
信息空間是一個(gè)正在發(fā)展的空間,其結(jié)構(gòu)和運(yùn)行機(jī)理還在被逐步認(rèn)識、逐漸完善中。但有一點(diǎn)相對明確,那就是信息空間主要是被數(shù)字化了的語言空間。語言過去是在社會空間中使用,如今是在社會空間、信息空間這兩個(gè)空間中使用。隨著物聯(lián)網(wǎng)、語言智能的發(fā)展和智能化新基建的實(shí)施,語言將跨入物理空間,在人類的三元空間中運(yùn)用。語言在人類生產(chǎn)活動的作用將更為顯著。
語言已經(jīng)不僅僅是人文現(xiàn)象,它是“具有聲光電三大媒介、為人類與機(jī)器兩個(gè)‘物種’共享、將應(yīng)用在社會、信息、物理三元空間中”的事物。語言學(xué)作為“研究語言及其相關(guān)問題”的科學(xué),也不能局限于“語言文學(xué)”,而應(yīng)當(dāng)是橫跨文理工的綜合學(xué)科。
2017年10月,美國希拉姆學(xué)院提出“新文科”的教育理念,對其29個(gè)專業(yè)重組,把新技術(shù)融入哲學(xué)、文學(xué)、語言等課程中。這反映了學(xué)科交叉融合的時(shí)代大趨勢。我國也在積極推進(jìn)“新工科、新醫(yī)科、新農(nóng)科、新文科”建設(shè)。根據(jù)語言的性質(zhì),就應(yīng)當(dāng)依照“新文科”的思路發(fā)展語言學(xué)。綜合、交叉、融入新技術(shù)的語言學(xué),才能夠適應(yīng)“數(shù)據(jù)是數(shù)字經(jīng)濟(jì)的關(guān)鍵生產(chǎn)要素”的時(shí)代命題和經(jīng)濟(jì)制度,促進(jìn)知識經(jīng)濟(jì)的發(fā)展,推進(jìn)智能化新基建的發(fā)展。當(dāng)然,新基建和知識經(jīng)濟(jì)的謀劃者,也應(yīng)當(dāng)充分重視語言和語言學(xué),獲取語言學(xué)的科學(xué)紅利。