語(yǔ)料庫(kù)范文10篇
時(shí)間:2024-04-12 03:24:43
導(dǎo)語(yǔ):這里是公務(wù)員之家根據(jù)多年的文秘經(jīng)驗(yàn),為你推薦的十篇語(yǔ)料庫(kù)范文,還可以咨詢客服老師獲取更多原創(chuàng)文章,歡迎參考。
語(yǔ)料庫(kù)研究論文
語(yǔ)料庫(kù)語(yǔ)言學(xué)主要研究機(jī)器可讀自然語(yǔ)言文本的采集、存儲(chǔ)、檢索、統(tǒng)計(jì)、語(yǔ)法標(biāo)注、句法語(yǔ)義分析,以及具有上述功能的語(yǔ)料庫(kù)在語(yǔ)言定量分析、詞典編纂、作品風(fēng)格分析、自然語(yǔ)言理解和機(jī)器翻譯等領(lǐng)域中的應(yīng)用。多年來(lái),機(jī)器翻譯和自然語(yǔ)言理解的研究中,分析語(yǔ)言的主要方法是句法語(yǔ)義分析。因此,在很長(zhǎng)一段時(shí)間內(nèi),許多系統(tǒng)都是基于規(guī)則的,而根據(jù)當(dāng)前計(jì)算機(jī)的理論和技術(shù)的水平很難把語(yǔ)言學(xué)的各種事實(shí)和理解語(yǔ)言所需的廣泛的背景知識(shí)用規(guī)則的形式充分地表達(dá)出來(lái),這樣,這些基于規(guī)則的機(jī)器翻譯和自然語(yǔ)言理解系統(tǒng)只能在極其受限的某些子語(yǔ)言(sub-language)中獲得一定的成功。為了擺脫困境,自然語(yǔ)言處理的研究者者們開(kāi)始對(duì)大規(guī)模的非受限的自然語(yǔ)言進(jìn)行調(diào)查和統(tǒng)計(jì),以便采用一種基于統(tǒng)計(jì)的模型來(lái)處理大量的非受限語(yǔ)言。不言而喻,語(yǔ)料庫(kù)語(yǔ)言學(xué)將有可能在大量語(yǔ)言材料的基礎(chǔ)上來(lái)檢驗(yàn)傳統(tǒng)的理論語(yǔ)言學(xué)基于手工搜集材料的方法所得出的各種結(jié)論,從而使我們對(duì)于自然語(yǔ)言的各種復(fù)雜現(xiàn)象獲得更為深刻全面的認(rèn)識(shí)。
本文首先簡(jiǎn)要介紹國(guó)外語(yǔ)料庫(kù)的發(fā)展情況,然后,比較詳細(xì)地介紹中國(guó)語(yǔ)料庫(kù)的發(fā)展情況和主要的成績(jī),使我們對(duì)于語(yǔ)料庫(kù)研究得到一個(gè)鳥(niǎo)瞰式的認(rèn)識(shí)。
一、國(guó)外語(yǔ)料庫(kù)概況
現(xiàn)在,美國(guó)Brown大學(xué)建立了BROWN語(yǔ)料庫(kù)(布朗語(yǔ)料庫(kù)),英國(guó)Lancaster大學(xué)與挪威Oslo大學(xué)與Bergen大學(xué)聯(lián)合建立了LOB語(yǔ)料庫(kù)。歐美各國(guó)學(xué)者利用這兩個(gè)語(yǔ)料庫(kù)開(kāi)展了大規(guī)模的研究,其中最引人注目的是對(duì)語(yǔ)料庫(kù)進(jìn)行語(yǔ)法標(biāo)注的研究。他們?cè)O(shè)計(jì)了基于規(guī)則的自動(dòng)標(biāo)注系統(tǒng)TAGGIT來(lái)給布朗語(yǔ)料庫(kù)的100萬(wàn)詞的語(yǔ)料作自動(dòng)標(biāo)注,正確率為77%.他們還設(shè)計(jì)了CLAWS系統(tǒng)來(lái)給LOB語(yǔ)料庫(kù)的100萬(wàn)詞的語(yǔ)料作自動(dòng)標(biāo)注,根據(jù)統(tǒng)計(jì)信息來(lái)建立算法,自動(dòng)標(biāo)注正確率達(dá)96%,比基于規(guī)則的TAGGIT系統(tǒng)提高了將近20%.最近他們同時(shí)考察三個(gè)相鄰標(biāo)記的同現(xiàn)頻率,使自動(dòng)語(yǔ)法標(biāo)注的正確率達(dá)到99.5%。這個(gè)指標(biāo)已經(jīng)超過(guò)了人工標(biāo)注所能達(dá)到的最高正確率。
現(xiàn)在,國(guó)外的主要語(yǔ)料庫(kù)還有:
London-Lund口語(yǔ)語(yǔ)料庫(kù):收篇目87篇,每篇5000詞,共為43.4萬(wàn)詞,有詳細(xì)的韻律標(biāo)注(prosodicmarking)。
語(yǔ)料庫(kù)語(yǔ)言學(xué)研究
一、研究基礎(chǔ):語(yǔ)料語(yǔ)言學(xué)庫(kù)研究范式
利用語(yǔ)料庫(kù)研究語(yǔ)言或者語(yǔ)言變體就是語(yǔ)料庫(kù)語(yǔ)言學(xué)。語(yǔ)料庫(kù)語(yǔ)言學(xué)形成了獨(dú)特的研究范式,包括研究目的、研究對(duì)象和研究方法。各種語(yǔ)料庫(kù)為包括閱讀在內(nèi)的教學(xué)提供了豐富的素材。教師可從中提取大量的語(yǔ)言素材,創(chuàng)造真實(shí)語(yǔ)境,擺脫了傳統(tǒng)教學(xué)的一些弊端?;谡Z(yǔ)料庫(kù)的研究主要從三個(gè)方面開(kāi)展:詞匯、句法和語(yǔ)篇。下面我們從這三個(gè)方面簡(jiǎn)述語(yǔ)料庫(kù)研究的思路。詞匯是指詞素、單詞、連續(xù)的短語(yǔ)和詞塊等。這是語(yǔ)料庫(kù)研究的優(yōu)勢(shì)所在。在詞匯方面,Sin-clair通過(guò)對(duì)nakedeye的探討提出了語(yǔ)料庫(kù)中詞項(xiàng)分析的思路。具體來(lái)說(shuō),在詞匯分析時(shí),首先檢索一個(gè)或者多個(gè)詞項(xiàng),在索引行中觀察分析詞項(xiàng)的搭配情況,概括詞匯的搭配關(guān)系,歸納出與詞項(xiàng)有關(guān)的類聯(lián)接。然后基于這些形式上的分析可進(jìn)一步探索詞項(xiàng)的語(yǔ)義傾向問(wèn)題以及詞項(xiàng)的感情色彩等語(yǔ)義韻問(wèn)題。語(yǔ)言句法層面研究關(guān)注的焦點(diǎn)是句法結(jié)構(gòu),或者稱為型式。在語(yǔ)料庫(kù)研究范式下,對(duì)句法結(jié)構(gòu)的研究需要對(duì)語(yǔ)料庫(kù)中的語(yǔ)料進(jìn)行詞性標(biāo)注,并使用正則表達(dá)式進(jìn)行復(fù)雜檢索以深度挖掘。目前研究最多也是技術(shù)操作上最為成熟的句法結(jié)構(gòu)為類聯(lián)接。類聯(lián)接是句法層面的“結(jié)伴關(guān)系”,包括詞的類聯(lián)接、詞組或短語(yǔ)的類聯(lián)接、詞類或語(yǔ)法類的類聯(lián)接,是“搭配的更高層次,與語(yǔ)言的句法層面有密切關(guān)系”。通過(guò)類聯(lián)接不僅可以探討語(yǔ)義韻等語(yǔ)義方面的問(wèn)題,還可以研究某些結(jié)構(gòu)所體現(xiàn)的社會(huì)文化屬性,從而洞察語(yǔ)言的語(yǔ)體和語(yǔ)用等方面。
二、基于語(yǔ)料庫(kù)語(yǔ)言學(xué)的讀寫(xiě)教學(xué)模式構(gòu)建
(一)悉尼學(xué)派基于語(yǔ)類的讀寫(xiě)教學(xué)法
前兩個(gè)階段側(cè)重閱讀教學(xué),而后兩個(gè)階段重點(diǎn)是寫(xiě)作教學(xué)。所有四個(gè)階段處于循環(huán)中。在設(shè)定的真實(shí)的情景中,教師與學(xué)生磋商、互動(dòng)以充分理解閱讀文本,同時(shí)學(xué)生不斷獲得教師關(guān)于語(yǔ)類的知識(shí),直至能夠單獨(dú)完成語(yǔ)篇的寫(xiě)作。
(二)語(yǔ)料庫(kù)語(yǔ)言學(xué)視角下的讀寫(xiě)教學(xué)模式構(gòu)建
商務(wù)英語(yǔ)語(yǔ)料庫(kù)構(gòu)建
摘要:京津冀地區(qū)是我國(guó)北方經(jīng)濟(jì)發(fā)展的一塊腹地。加大對(duì)該地區(qū)的經(jīng)濟(jì)開(kāi)發(fā),推進(jìn)多樣化的經(jīng)濟(jì)形式向外延展是河北省現(xiàn)階段的重大戰(zhàn)略。當(dāng)前,河北省外貿(mào)企業(yè)順勢(shì)發(fā)展,外貿(mào)企業(yè)對(duì)外的經(jīng)濟(jì)需求也增大,因而對(duì)商務(wù)英語(yǔ)語(yǔ)料庫(kù)的構(gòu)建提出了更高的要求?;诖耍圆栀Q(mào)易英語(yǔ)語(yǔ)料庫(kù)為例,分析商務(wù)英語(yǔ)語(yǔ)料庫(kù)的構(gòu)建要素,探討對(duì)外茶貿(mào)易對(duì)語(yǔ)言和茶文化的要求,研究商務(wù)英語(yǔ)語(yǔ)料庫(kù)的構(gòu)建在茶貿(mào)易中的應(yīng)用。另外,全面增強(qiáng)商務(wù)英語(yǔ)應(yīng)用化的作用力,推進(jìn)商務(wù)英語(yǔ)語(yǔ)料庫(kù)的經(jīng)濟(jì)應(yīng)用價(jià)值,為茶貿(mào)易經(jīng)濟(jì)結(jié)構(gòu)系統(tǒng)化構(gòu)建穩(wěn)固奠基,彰顯出河北省對(duì)外經(jīng)濟(jì)發(fā)展的新動(dòng)態(tài)、新方向。
關(guān)鍵詞:對(duì)外經(jīng)濟(jì);商務(wù)英語(yǔ);語(yǔ)料庫(kù)構(gòu)建;茶貿(mào)易
河北省是人口大省,人口基數(shù)大,同時(shí)也是中國(guó)的對(duì)外貿(mào)易大省。依據(jù)2016年石家莊海關(guān)數(shù)據(jù)記錄,2016年進(jìn)出口總貿(mào)易額達(dá)到了746.8億美元,對(duì)外貿(mào)易處于出超地位。同比上年增長(zhǎng)8個(gè)百分點(diǎn)。自河北省實(shí)施對(duì)外貿(mào)易的重大戰(zhàn)略以來(lái),其貿(mào)易總額1.4的百分點(diǎn)發(fā)展到25的百分點(diǎn)。另外,區(qū)域經(jīng)濟(jì)對(duì)外發(fā)展是經(jīng)濟(jì)發(fā)展到成熟階段呈現(xiàn)出來(lái)的特征,顯現(xiàn)出經(jīng)濟(jì)發(fā)展的態(tài)勢(shì)?;趯?duì)外經(jīng)濟(jì)需求的發(fā)展背景,河北省借助地理位置、優(yōu)厚的人才、科技資源等優(yōu)勢(shì),充分地將資源嵌入到經(jīng)濟(jì)的發(fā)展當(dāng)中。商務(wù)英語(yǔ)在對(duì)外貿(mào)易中起到的聯(lián)系紐帶作用,是推進(jìn)對(duì)外貿(mào)易持續(xù)動(dòng)力,也是貿(mào)易經(jīng)濟(jì)發(fā)展的不竭力量之源。
1商務(wù)英語(yǔ)語(yǔ)料庫(kù)的構(gòu)建
為了與經(jīng)濟(jì)社會(huì)發(fā)展的步伐相適應(yīng),在競(jìng)爭(zhēng)劇烈的貿(mào)易市場(chǎng)中逆流而上。河北省對(duì)外貿(mào)易經(jīng)濟(jì)提出更為嚴(yán)格的專業(yè)要求。商務(wù)英語(yǔ)語(yǔ)料庫(kù)的構(gòu)建是一個(gè)商務(wù)語(yǔ)言體系化、學(xué)科專業(yè)化的前提,更是英語(yǔ)語(yǔ)言與實(shí)際經(jīng)濟(jì)應(yīng)用資源相銜接的根本途徑。1.1語(yǔ)料的采集與錄入在龐大的商務(wù)英語(yǔ)語(yǔ)料庫(kù)中,數(shù)據(jù)庫(kù)需要定期的進(jìn)行資源的更新,以適應(yīng)新時(shí)代知識(shí)的融合與完善,而數(shù)據(jù)輸入的準(zhǔn)確性直接影響到后期使用戶的使用效果。因此,在進(jìn)行商務(wù)英語(yǔ)語(yǔ)料的采集與錄入時(shí),須確保錄入商務(wù)英語(yǔ)語(yǔ)料庫(kù)真實(shí)性。為保證商務(wù)英語(yǔ)語(yǔ)料輸入的準(zhǔn)確性,就需要對(duì)英語(yǔ)數(shù)據(jù)輸入的端口進(jìn)行篩選檢查。首先,從錄入的信息源來(lái)看,錄入進(jìn)電子商務(wù)英語(yǔ)數(shù)據(jù)庫(kù)的信息資源需要從有權(quán)威的刊物或者相關(guān)文獻(xiàn)中選取,而不是任意地從出版刊物中選?。黄浯?,對(duì)相關(guān)不確定、待考證的信息資源需要進(jìn)行明確的標(biāo)注;最后,在錄入商務(wù)英語(yǔ)信息資料時(shí),需要平衡各二級(jí)學(xué)科的應(yīng)用領(lǐng)域的信息,按照一定的比例調(diào)研各二級(jí)學(xué)科的數(shù)據(jù)資源,分別與商務(wù)英語(yǔ)相銜接契合。1.2語(yǔ)料庫(kù)的檢索電子商務(wù)英語(yǔ)語(yǔ)料庫(kù),如現(xiàn)代化的浩如煙海的活字典,它是為了滿足人們快速檢索商務(wù)英語(yǔ)詞匯、詞義以及語(yǔ)法等資源而構(gòu)建的。實(shí)質(zhì)上是根據(jù)商務(wù)用途的而合成的電子數(shù)據(jù)資料庫(kù)。商務(wù)英語(yǔ)語(yǔ)料庫(kù)檢索詞匯、錄入詞義的功能。在商務(wù)英語(yǔ)語(yǔ)料庫(kù)中,英語(yǔ)知識(shí)被轉(zhuǎn)化為字符,以字節(jié)為單位輸入到計(jì)算機(jī)數(shù)據(jù)庫(kù)中,計(jì)算機(jī)根據(jù)數(shù)字統(tǒng)計(jì)將英語(yǔ)字碼進(jìn)行多層次的歸類處理,從而使商務(wù)英語(yǔ)可以更好地應(yīng)用到語(yǔ)言教育學(xué)、語(yǔ)言經(jīng)濟(jì)學(xué)中。此外茶貿(mào)易發(fā)展如火如荼,在商務(wù)英語(yǔ)的語(yǔ)料采集與錄入時(shí),就應(yīng)該注重茶文化知識(shí)與商務(wù)英語(yǔ)的承接,將可利用的茶信息資源與商務(wù)英語(yǔ)深度融合。如,增大對(duì)茶詞匯、茶詞義、茶語(yǔ)法信息要素的錄入,以便用戶對(duì)商務(wù)英語(yǔ)的檢索,保證茶貿(mào)易經(jīng)濟(jì)的內(nèi)應(yīng)力與商務(wù)英語(yǔ)的原生力的協(xié)同配合。
2茶貿(mào)易經(jīng)濟(jì)對(duì)語(yǔ)言資源整合的要求分析
語(yǔ)料庫(kù)在英語(yǔ)教學(xué)中的運(yùn)用透析
隨著科技進(jìn)步,計(jì)算機(jī)技術(shù)的發(fā)展?jié)u漸滲透到了語(yǔ)言文學(xué)與教學(xué)領(lǐng)域。語(yǔ)料庫(kù)語(yǔ)言學(xué)作為一門新興的邊緣學(xué)科,很好地結(jié)合了自然科學(xué)與文學(xué),憑借其大規(guī)模的語(yǔ)料資源以及先進(jìn)的語(yǔ)料庫(kù)檢索軟件和工具對(duì)語(yǔ)言文本進(jìn)行深加工,再創(chuàng)造。語(yǔ)料庫(kù)檢索工具可以分析統(tǒng)計(jì)出文本中需查詞語(yǔ)的出現(xiàn)頻率,詞語(yǔ)與詞語(yǔ)間的搭配狀況,以及在全文本的各個(gè)章節(jié)關(guān)鍵詞(人物,事物等)出現(xiàn)的疏密程度等(王雁2007)。使用語(yǔ)料庫(kù)檢索工具(concordancer)對(duì)文學(xué)文本進(jìn)行量化分析(quantitativeanalysis),為文學(xué)提供了更加科學(xué)的分析方法,能夠幫助我們提高課堂教學(xué)的質(zhì)量,增加思考的角度,拓展新的想象空間,使學(xué)生更好的掌握教學(xué)內(nèi)容(陳瑩瑩2007)。
如今建立在語(yǔ)料庫(kù)基礎(chǔ)上的分析,對(duì)文學(xué)作品的研究而言,經(jīng)歷了一個(gè)從質(zhì)評(píng)到量化、從主觀到客觀的飛躍。當(dāng)然這一轉(zhuǎn)變歸功于計(jì)算機(jī)的飛速發(fā)展。本文基于語(yǔ)料庫(kù)對(duì)《小王子》的文學(xué)語(yǔ)言進(jìn)行分析,對(duì)文本的情節(jié)發(fā)展進(jìn)行掌握,為文學(xué)作品《小王子》的研究者提供了一種新的視角,以便更好的進(jìn)行課堂教學(xué),用詳實(shí)的語(yǔ)言數(shù)據(jù)證實(shí)了它的文學(xué)和教學(xué)價(jià)值。
文章結(jié)構(gòu)清晰,引言部分介紹寫(xiě)作目的、意義和價(jià)值,并提出文章的結(jié)構(gòu)框架;第二部分文獻(xiàn)綜述介紹語(yǔ)料庫(kù)與文學(xué)研究的背景及不足,提出本文使用的研究方法和語(yǔ)料庫(kù);第三部分是數(shù)據(jù)收集、數(shù)據(jù)分類、數(shù)據(jù)分析及提供圖表說(shuō)明,通過(guò)圖表稱述分析過(guò)程和觀點(diǎn);最后結(jié)語(yǔ)部分對(duì)文章進(jìn)行總結(jié)。
1.系統(tǒng)介紹
語(yǔ)料庫(kù)應(yīng)用廣泛,實(shí)用性強(qiáng),在文學(xué)研究方面的應(yīng)用已取得成效,而文學(xué)教學(xué)的開(kāi)放性,使它可以面向語(yǔ)料庫(kù)語(yǔ)言學(xué)開(kāi)放。語(yǔ)料庫(kù)語(yǔ)言學(xué)可以為語(yǔ)言文學(xué)的教學(xué)提供一套行之有效的方法和工具,使人們可以對(duì)文學(xué)作品進(jìn)行更詳實(shí)、深入和具體的描述?;谡Z(yǔ)料庫(kù)的語(yǔ)言文學(xué)教學(xué)不僅僅可以從個(gè)別的現(xiàn)象中歸納出答案,還更加重視從眾多的現(xiàn)象和現(xiàn)象之間的聯(lián)系中歸納答案。此外,理論的真實(shí)性和概括性可以通過(guò)實(shí)證研究得以驗(yàn)證。文學(xué)理論也不例外。
由于文學(xué)語(yǔ)料庫(kù)可以容納幾百萬(wàn)、幾千萬(wàn)、甚至上億詞的文學(xué)作品語(yǔ)料,人們可以從中得到充分的例證、驗(yàn)證或說(shuō)明某些文學(xué)理論(王一川2004)。
自建語(yǔ)料庫(kù)在商務(wù)英語(yǔ)翻譯的應(yīng)用
【摘要】因大型或?qū)iT語(yǔ)料庫(kù)的翻譯教學(xué)模式不具推廣性,教師可根據(jù)課程設(shè)計(jì)需要,有針對(duì)性地采集語(yǔ)料,充分利用自建語(yǔ)料庫(kù)來(lái)輔助翻譯教學(xué)。本研究展示教師如何利用在線計(jì)算機(jī)輔助翻譯平臺(tái)、免費(fèi)語(yǔ)料庫(kù)工具等自建平行語(yǔ)料庫(kù)和可比語(yǔ)料庫(kù),并以實(shí)際教學(xué)案例展示如何運(yùn)用語(yǔ)料庫(kù)輔助翻譯教學(xué)。自建語(yǔ)料庫(kù)在商務(wù)翻譯教學(xué)的價(jià)值在于,遵循真實(shí)的翻譯情景,提供真實(shí)語(yǔ)料,充分發(fā)揮教師的引導(dǎo)作用,訓(xùn)練學(xué)生自主學(xué)習(xí)能力。
【關(guān)鍵詞】自建語(yǔ)料庫(kù);商務(wù)英語(yǔ)翻譯教學(xué);教學(xué)案例
一、引言
關(guān)于語(yǔ)料庫(kù)在翻譯教學(xué)中的應(yīng)用,秦洪武、王克非[1]曾指出因語(yǔ)料庫(kù)的創(chuàng)建目的、創(chuàng)建技術(shù)、檢索技術(shù)的限制,國(guó)內(nèi)的研究還沒(méi)有解決語(yǔ)料庫(kù)與微觀教學(xué)環(huán)節(jié)的銜接問(wèn)題,語(yǔ)料庫(kù)翻譯教學(xué)的模式研究還有待發(fā)展。而近年來(lái)國(guó)內(nèi)學(xué)者結(jié)合翻譯教學(xué)實(shí)踐,不斷提出基于語(yǔ)料庫(kù)的翻譯教學(xué)應(yīng)用范例。其中具代表性的如劉澤權(quán)、劉鼎甲[2]提出通過(guò)建設(shè)學(xué)習(xí)者譯文平行語(yǔ)料庫(kù),并在課堂中引入專業(yè)譯者譯文對(duì)應(yīng)語(yǔ)料庫(kù)與大型通用語(yǔ)料庫(kù),設(shè)計(jì)了以學(xué)生主動(dòng)探索為中心的翻譯教學(xué)路線。王惠[3]則認(rèn)為如果缺乏深層次加工,語(yǔ)料庫(kù)在翻譯教學(xué)及學(xué)生自主學(xué)習(xí)中有一定難度,所以他以香港城市大學(xué)的“英漢漢英翻譯遠(yuǎn)程教學(xué)系統(tǒng)”語(yǔ)料庫(kù)平臺(tái)為例,展示如何將“精加工”平行語(yǔ)料庫(kù)與教學(xué)內(nèi)容、過(guò)程和課后反饋等環(huán)節(jié)相結(jié)合。此外,另有學(xué)者提出單語(yǔ)語(yǔ)料庫(kù)在翻譯教學(xué)中不可替代的作用,如朱曉敏[4]探討了COCA和CCL語(yǔ)料庫(kù)在翻譯教學(xué)中的用途,孫東云[5]則以BCC漢語(yǔ)語(yǔ)料庫(kù)在英漢翻譯教學(xué)中的應(yīng)用為例,總結(jié)出母語(yǔ)語(yǔ)料庫(kù)驅(qū)動(dòng)的翻譯教學(xué)模式。以上研究的共性是從教學(xué)實(shí)踐出發(fā),探索如何將語(yǔ)料庫(kù)的豐富語(yǔ)料和便捷的檢索工具等優(yōu)勢(shì)服務(wù)于教學(xué)目標(biāo),并且也注重發(fā)揮語(yǔ)料庫(kù)在培養(yǎng)學(xué)生的自主學(xué)習(xí)能力上的作用。需要指出的是,在翻譯教學(xué)中,語(yǔ)料庫(kù)的使用主體是翻譯初學(xué)者,他們還無(wú)法深入針對(duì)真實(shí)語(yǔ)料或某些翻譯現(xiàn)象做出快速準(zhǔn)確的總結(jié),而語(yǔ)料庫(kù)檢索出的大量的例子往往容易使其受挫。在學(xué)生具備基本翻譯能力和翻譯素養(yǎng)之前直接使用COCA、BNC等語(yǔ)料庫(kù)對(duì)翻譯教學(xué)的作用并不直接。而上述研究中其他基于語(yǔ)料庫(kù)的教學(xué)實(shí)踐都有系統(tǒng)成熟的專門語(yǔ)料庫(kù)支持,這些語(yǔ)料庫(kù)在前期建設(shè)上有非常高的要求,往往因版權(quán)無(wú)法公開(kāi)使用,所以,其在教學(xué)實(shí)踐推廣上有一定的限制。因此,文本認(rèn)為教師可根據(jù)課程設(shè)計(jì)需要,有針對(duì)性地采集語(yǔ)料,制作旨在幫助學(xué)生理解特定語(yǔ)言現(xiàn)象的語(yǔ)料庫(kù),充分利用自建語(yǔ)料庫(kù)來(lái)輔助翻譯教學(xué)。相較大型語(yǔ)料庫(kù),小型的自建語(yǔ)料庫(kù)在輔助教學(xué)、編寫(xiě)翻譯教材和教輔材料方面更具有針對(duì)性、即時(shí)性和新穎性。[6]不僅如此,在翻譯教學(xué)中,教師可以將平行語(yǔ)料庫(kù)、可比語(yǔ)料庫(kù)及單語(yǔ)語(yǔ)料庫(kù)等多種形式語(yǔ)料庫(kù)結(jié)合以配合教學(xué)目的。筆者將以自己教授的“商務(wù)英語(yǔ)翻譯”課程為例,介紹如何根據(jù)教學(xué)目標(biāo)自建小型專題語(yǔ)料庫(kù),并在微觀層面展示如何運(yùn)用語(yǔ)料庫(kù)開(kāi)展商務(wù)翻譯教學(xué)活動(dòng)。
二、自建語(yǔ)料庫(kù)
(一)語(yǔ)料的分類與選擇。商務(wù)英語(yǔ)文本專業(yè)性明顯,且新詞層出不窮,且各類語(yǔ)篇都“使用各種程式化語(yǔ)言使商務(wù)文本表達(dá)格式規(guī)范”。[4]所以在語(yǔ)料選擇上需要甄選有時(shí)效性、代表性的文本,語(yǔ)料來(lái)源可以包括網(wǎng)絡(luò)、時(shí)報(bào)、雜志等。建庫(kù)時(shí)可根據(jù)教學(xué)安排和需求把每類商務(wù)體裁文本分別建成小型的專門用途語(yǔ)料庫(kù)。蘇雯超、李德鳳、何元建[7]通過(guò)統(tǒng)計(jì)分析國(guó)內(nèi)具有影響力的商務(wù)翻譯教材,通過(guò)確定商務(wù)翻譯的核心話題與拓展話題來(lái)界定商務(wù)翻譯的內(nèi)涵和外延。筆者借鑒其統(tǒng)計(jì)的核心話題來(lái)確定商務(wù)翻譯課堂教學(xué)的文本,包括“公司宣傳文本”“商務(wù)信函”及“商務(wù)廣告”等。舉例而言,本文中筆者將介紹的“企業(yè)簡(jiǎn)介”的語(yǔ)料來(lái)源主要來(lái)自于全球知名企業(yè)官方網(wǎng)站,《金融時(shí)報(bào)》(FinancialTimes)、《經(jīng)濟(jì)學(xué)人》(TheEconomist)等。(二)語(yǔ)料對(duì)齊。收集語(yǔ)料后,構(gòu)建平行語(yǔ)料庫(kù)的下一個(gè)核心步驟是進(jìn)行語(yǔ)料對(duì)齊。王正、孫東云[8]介紹過(guò)如何利用計(jì)算機(jī)輔助翻譯軟件(CAT)進(jìn)行語(yǔ)料對(duì)齊。他們利用TRADOSTranslator’sWorkbench帶有的組件WinAlign組件進(jìn)行對(duì)齊,但是對(duì)齊后的語(yǔ)料導(dǎo)出后的文件還再導(dǎo)入DéjàvuCAT軟件進(jìn)行文本格式的一系列轉(zhuǎn)換才能生成純文本。其他計(jì)算機(jī)輔助翻譯軟件如雪人CAT的語(yǔ)料也帶有對(duì)齊功能[9],但是同樣需要一系列格式轉(zhuǎn)換成可以使用的TXT文本。為省去這一系列操作,現(xiàn)在的在線語(yǔ)料大數(shù)據(jù)及智能翻譯平臺(tái)可以提供更快捷的操作,比如Tmaxmall()自主研發(fā)的智能對(duì)齊算法可以快速地自動(dòng)對(duì)齊原文譯文,能自動(dòng)識(shí)別“一對(duì)多”“多對(duì)一”“多對(duì)多”句子對(duì)應(yīng)關(guān)系,極大地提高對(duì)齊的效率以及準(zhǔn)確度。調(diào)整對(duì)齊的界面直觀,操作便捷,用戶可以便捷地在線預(yù)覽對(duì)齊語(yǔ)料,并且該平臺(tái)支持docx、xlsx、pptx、pdf、txt等36種主流格式的導(dǎo)入,并且可直接導(dǎo)出tmx、xlsx、txt、docx等4種格式。(三)自建平行語(yǔ)料庫(kù)。準(zhǔn)備好對(duì)齊的txt語(yǔ)料文件后,一種方法是可以使用平行語(yǔ)料庫(kù)檢索工具進(jìn)行檢索。Paraconc是經(jīng)典的雙語(yǔ)平行語(yǔ)料庫(kù)檢索工具,可以在其官網(wǎng)下載Demo體驗(yàn)軟件。但是中文文本仍不能直接使用Paraconc進(jìn)行檢索,需對(duì)語(yǔ)料進(jìn)行分詞處理。本文推薦使用北京外國(guó)語(yǔ)大學(xué)的BFSUParaConc,漢語(yǔ)文本可不進(jìn)行分詞處理,中英文文本文件要求分別以*.ZH.txt和*.EN.txt方式命名后導(dǎo)入就可以使用,方便地呈現(xiàn)翻譯中原文與譯文在字/詞/句層面的對(duì)應(yīng)關(guān)系。另外一種是利用計(jì)算機(jī)翻譯輔助軟件,因?yàn)檫@些軟件本身也提供了靈活簡(jiǎn)便的雙語(yǔ)平行語(yǔ)料庫(kù)功能。只要把對(duì)齊后語(yǔ)料tmx文件可以導(dǎo)入CAT軟件存為翻譯記憶庫(kù),可以在軟件上查看、調(diào)用來(lái)輔助翻譯教學(xué)??梢酝ㄟ^(guò)下載Trados試用版或者雪人免費(fèi)版,但是這些軟件在安裝操作上較費(fèi)時(shí),所以筆者推薦更簡(jiǎn)易的在線翻譯管理平臺(tái)如Yicat,Yicat帶有CAT的所有核心功能,直接打開(kāi)網(wǎng)頁(yè)就可以免費(fèi)使用。用戶注冊(cè)后進(jìn)入主界面在記憶庫(kù)管理里導(dǎo)入tmx文件就可以進(jìn)行雙語(yǔ)平行語(yǔ)料庫(kù)的檢索查看。(四)自建雙語(yǔ)可比語(yǔ)料庫(kù)。與譯者培訓(xùn)有關(guān)的雙語(yǔ)可比語(yǔ)料庫(kù),Zanettin[10]將其定義為在不同語(yǔ)言中基于相似的內(nèi)容、領(lǐng)域和交際功能收集的相互獨(dú)立的文本。而將這種雙語(yǔ)可比文本用于翻譯研究和培訓(xùn)在語(yǔ)料庫(kù)出現(xiàn)之前已很常見(jiàn),如Snell-Hornby[11]分別收集了英文和德文的公示語(yǔ)進(jìn)行比較,她認(rèn)為通過(guò)比較源語(yǔ)和目的語(yǔ)同一文本類型的大量文本有助于定義該文本的原型特征,為譯者呈現(xiàn)譯文的基本“輪廓”。而在翻譯課堂中這類的雙語(yǔ)可比語(yǔ)料庫(kù)是培養(yǎng)其語(yǔ)言的直覺(jué),學(xué)習(xí)專用文體特有表達(dá)方式的理想工具。在課堂教學(xué)活動(dòng)設(shè)計(jì)與實(shí)施過(guò)程中,可比語(yǔ)料庫(kù)可以“構(gòu)建輸入目標(biāo)語(yǔ)材料”,相對(duì)于平行語(yǔ)料庫(kù),學(xué)生可以“在自主研究所提供的語(yǔ)言數(shù)據(jù)中分析現(xiàn)象、找到規(guī)律,而不是一味地去模仿前人的翻譯”。[4]建立這一類語(yǔ)料庫(kù)的分析工具比較多且都很成熟,最廣為使用的是AntConc,其界面簡(jiǎn)約直觀、功能專業(yè)實(shí)用,使用者只需下載安裝就能使用,但這款軟件只能用于英文文本的語(yǔ)料分析。所以,筆者也推薦BFSUPowerConc,這款軟件支持漢語(yǔ)和英語(yǔ)兩種語(yǔ)言,同時(shí)支持粗語(yǔ)料和標(biāo)注語(yǔ)料兩種形式的語(yǔ)料檢索。研究者可用其建設(shè)英漢雙語(yǔ)的可比語(yǔ)料庫(kù)。比如教學(xué)設(shè)計(jì)中讓學(xué)生掌握英漢兩種語(yǔ)言同一文體的語(yǔ)言特征,就需要用到BFSUPowerConc來(lái)分別建立中英文雙語(yǔ)可比語(yǔ)料庫(kù)。
我國(guó)語(yǔ)料庫(kù)的研究歷史分析論文
語(yǔ)言學(xué)的研究必須以語(yǔ)言事實(shí)作為根據(jù),必須詳盡地、大量地占有材料,才有可能在理論上得出比較可靠的結(jié)論。傳統(tǒng)的語(yǔ)言材料的搜集、整理和加工完全是靠手工進(jìn)行的,這是一種枯燥無(wú)味、費(fèi)力費(fèi)時(shí)的工作。計(jì)算機(jī)出現(xiàn)后,人們可以把這些工作交給計(jì)算機(jī)去作,大大地減輕了人們的勞動(dòng)。后來(lái),在這種工作中逐漸創(chuàng)造了一整套完整的理論和方法,形成了一門新的學(xué)科——語(yǔ)料庫(kù)語(yǔ)言學(xué)(corpuslinguistics),并成為了自然語(yǔ)言處理的一個(gè)分支學(xué)科。
語(yǔ)料庫(kù)語(yǔ)言學(xué)主要研究機(jī)器可讀自然語(yǔ)言文本的采集、存儲(chǔ)、檢索、統(tǒng)計(jì)、語(yǔ)法標(biāo)注、句法語(yǔ)義分析,以及具有上述功能的語(yǔ)料庫(kù)在語(yǔ)言定量分析、詞典編纂、作品風(fēng)格分析、自然語(yǔ)言理解和機(jī)器翻譯等領(lǐng)域中的應(yīng)用。多年來(lái),機(jī)器翻譯和自然語(yǔ)言理解的研究中,分析語(yǔ)言的主要方法是句法語(yǔ)義分析。因此,在很長(zhǎng)一段時(shí)間內(nèi),許多系統(tǒng)都是基于規(guī)則的,而根據(jù)當(dāng)前計(jì)算機(jī)的理論和技術(shù)的水平很難把語(yǔ)言學(xué)的各種事實(shí)和理解語(yǔ)言所需的廣泛的背景知識(shí)用規(guī)則的形式充分地表達(dá)出來(lái),這樣,這些基于規(guī)則的機(jī)器翻譯和自然語(yǔ)言理解系統(tǒng)只能在極其受限的某些子語(yǔ)言(sub-language)中獲得一定的成功。為了擺脫困境,自然語(yǔ)言處理的研究者者們開(kāi)始對(duì)大規(guī)模的非受限的自然語(yǔ)言進(jìn)行調(diào)查和統(tǒng)計(jì),以便采用一種基于統(tǒng)計(jì)的模型來(lái)處理大量的非受限語(yǔ)言。不言而喻,語(yǔ)料庫(kù)語(yǔ)言學(xué)將有可能在大量語(yǔ)言材料的基礎(chǔ)上來(lái)檢驗(yàn)傳統(tǒng)的理論語(yǔ)言學(xué)基于手工搜集材料的方法所得出的各種結(jié)論,從而使我們對(duì)于自然語(yǔ)言的各種復(fù)雜現(xiàn)象獲得更為深刻全面的認(rèn)識(shí)。
本文首先簡(jiǎn)要介紹國(guó)外語(yǔ)料庫(kù)的發(fā)展情況,然后,比較詳細(xì)地介紹中國(guó)語(yǔ)料庫(kù)的發(fā)展情況和主要的成績(jī),使我們對(duì)于語(yǔ)料庫(kù)研究得到一個(gè)鳥(niǎo)瞰式的認(rèn)識(shí)。
一、國(guó)外語(yǔ)料庫(kù)概況
現(xiàn)在,美國(guó)Brown大學(xué)建立了BROWN語(yǔ)料庫(kù)(布朗語(yǔ)料庫(kù)),英國(guó)Lancaster大學(xué)與挪威Oslo大學(xué)與Bergen大學(xué)聯(lián)合建立了LOB語(yǔ)料庫(kù)。歐美各國(guó)學(xué)者利用這兩個(gè)語(yǔ)料庫(kù)開(kāi)展了大規(guī)模的研究,其中最引人注目的是對(duì)語(yǔ)料庫(kù)進(jìn)行語(yǔ)法標(biāo)注的研究。他們?cè)O(shè)計(jì)了基于規(guī)則的自動(dòng)標(biāo)注系統(tǒng)TAGGIT來(lái)給布朗語(yǔ)料庫(kù)的100萬(wàn)詞的語(yǔ)料作自動(dòng)標(biāo)注,正確率為77%.他們還設(shè)計(jì)了CLAWS系統(tǒng)來(lái)給LOB語(yǔ)料庫(kù)的100萬(wàn)詞的語(yǔ)料作自動(dòng)標(biāo)注,根據(jù)統(tǒng)計(jì)信息來(lái)建立算法,自動(dòng)標(biāo)注正確率達(dá)96%,比基于規(guī)則的TAGGIT系統(tǒng)提高了將近20%.最近他們同時(shí)考察三個(gè)相鄰標(biāo)記的同現(xiàn)頻率,使自動(dòng)語(yǔ)法標(biāo)注的正確率達(dá)到99.5%。這個(gè)指標(biāo)已經(jīng)超過(guò)了人工標(biāo)注所能達(dá)到的最高正確率。
現(xiàn)在,國(guó)外的主要語(yǔ)料庫(kù)還有:
BNC語(yǔ)料庫(kù)的近義詞對(duì)比研究
摘要:近義詞辨析一直是中學(xué)英語(yǔ)詞匯教學(xué)的重點(diǎn)和難點(diǎn),近義詞意思相近但是在具體使用上卻有細(xì)微的差別。學(xué)生在記憶相近意思的單詞時(shí),一般都會(huì)選擇死記硬背或者一概而論,教師在教授近義詞時(shí)也大多進(jìn)行字面解釋。而語(yǔ)料庫(kù)可以為學(xué)習(xí)者提供大量真實(shí)的材料,這將為近義詞的辨析和使用提供強(qiáng)大的數(shù)據(jù)支持。該文選取近義詞acknowledge和ad?mit,以BNC(英國(guó)當(dāng)代語(yǔ)料庫(kù))為工具,從語(yǔ)域、搭配、語(yǔ)義韻等方面研究這一對(duì)近義詞的搭配和使用,旨在為中國(guó)英語(yǔ)學(xué)習(xí)者提供學(xué)習(xí)近義詞的方法,并為英語(yǔ)詞匯教學(xué)帶來(lái)啟示。
關(guān)鍵詞:語(yǔ)料庫(kù);近義詞;語(yǔ)義韻;詞匯教學(xué)
1引言
1.1研究背景
二語(yǔ)教學(xué)是為了提高學(xué)習(xí)者的詞匯能力,詞匯是提高英語(yǔ)寫(xiě)作、閱讀、會(huì)話等技能的關(guān)鍵[1]。然而對(duì)于詞語(yǔ)的研究到近代才剛剛開(kāi)始,“Lexis”一詞在英語(yǔ)中只有相對(duì)短暫的歷史,直到大約20世紀(jì)50年代才開(kāi)始在英國(guó)英語(yǔ)中使用[2]。Firth提出了著名的“語(yǔ)境論”,他認(rèn)為詞的意義不在人的大腦里,而是在語(yǔ)境之中。近義詞在二語(yǔ)詞匯教學(xué)和習(xí)得中是一個(gè)重難點(diǎn),因?yàn)樗鼈冊(cè)诮Y(jié)構(gòu)、詞形、詞義和語(yǔ)義等方面具有較大的相似性。近義詞在英語(yǔ)詞匯中占比較大,在中學(xué)階段,英語(yǔ)詞匯教學(xué)的重難點(diǎn)也在于如何辨析這類詞匯。傳統(tǒng)的詞匯教學(xué)采用中文釋義或同義詞講解的方法,學(xué)生利用漢語(yǔ)意思記憶和歸類單詞,忽略了單詞所處的語(yǔ)境。學(xué)生在使用近義詞時(shí),也會(huì)因?yàn)檎Z(yǔ)境不當(dāng),概念模糊而導(dǎo)致誤用。語(yǔ)料庫(kù)中有大量的語(yǔ)言事實(shí),也就是人們?cè)诮浑H中使用的真實(shí)的語(yǔ)言。因此,語(yǔ)料庫(kù)將單詞與真實(shí)語(yǔ)境相結(jié)合,能夠幫助學(xué)生辨析近義詞之間的異同,因此學(xué)生能理解詞匯的準(zhǔn)確內(nèi)涵并正確使用。
1.2國(guó)內(nèi)外研究現(xiàn)狀
語(yǔ)料庫(kù)在商務(wù)英語(yǔ)口譯的應(yīng)用
[摘要]新經(jīng)濟(jì)環(huán)境的變革影響著社會(huì)整體環(huán)境的變化,從全球化的經(jīng)濟(jì)貿(mào)易形式,到我國(guó)的整體經(jīng)濟(jì)產(chǎn)業(yè)結(jié)構(gòu),都會(huì)受到新經(jīng)濟(jì)環(huán)境的影響。人才培養(yǎng)基本方向和需求也將發(fā)生一定程度的轉(zhuǎn)變,商務(wù)英語(yǔ)口譯類人才在新經(jīng)濟(jì)環(huán)境作為對(duì)外交流的高級(jí)人才其市場(chǎng)需求將不斷增大,克服目前商務(wù)英語(yǔ)口譯教學(xué)難點(diǎn),培養(yǎng)商務(wù)英語(yǔ)口譯人才,可以從語(yǔ)料庫(kù)的建設(shè)入手,通過(guò)平行語(yǔ)料庫(kù)在教學(xué)中的應(yīng)用,實(shí)現(xiàn)內(nèi)涵式的高等人才培養(yǎng)。
[關(guān)鍵詞]語(yǔ)料庫(kù);商務(wù)英語(yǔ);口譯;應(yīng)用
2017年國(guó)家教育部反饋的數(shù)據(jù)顯示,2017年報(bào)考口譯的人才僅有11772人,商務(wù)英語(yǔ)口譯人才短板是新經(jīng)濟(jì)環(huán)境下我國(guó)經(jīng)濟(jì)發(fā)展下的人才缺口之一。1997年,意大利舉行的CorpusUseandlearningtoTranslate中對(duì)翻譯教學(xué)中語(yǔ)料庫(kù)的運(yùn)用展開(kāi)了深入探討,隨著語(yǔ)料庫(kù)建設(shè)方式的多樣化和豐富化,翻譯教學(xué)管理和操作的多樣化教學(xué)展開(kāi)已經(jīng)成為翻譯教學(xué)的共識(shí)??谧g教學(xué)作為翻譯教學(xué)中的一個(gè)分支,能夠通過(guò)平行語(yǔ)料庫(kù)的運(yùn)用,在學(xué)生主題理解、術(shù)語(yǔ)選擇、慣用表達(dá)等方面都能夠得到提升。因此,研究語(yǔ)料庫(kù)在商務(wù)英語(yǔ)口譯教學(xué)中的應(yīng)用,對(duì)于商務(wù)英語(yǔ)口譯教學(xué)質(zhì)量和整體水平的提高有著重要價(jià)值。
一、商務(wù)英語(yǔ)口譯教學(xué)現(xiàn)狀
商務(wù)英語(yǔ)口譯教學(xué)具有實(shí)時(shí)和不可預(yù)測(cè)兩大性質(zhì),這兩大性質(zhì)讓商務(wù)英語(yǔ)口譯教學(xué)難度要遠(yuǎn)遠(yuǎn)大于商務(wù)英語(yǔ)的筆譯教學(xué)。由于口譯中對(duì)學(xué)生的語(yǔ)言輸入輸出能力有著極高的要求,因此教學(xué)過(guò)程中需要對(duì)學(xué)生語(yǔ)言能力、反應(yīng)能力、速記能力表達(dá)能力等方面均需要培養(yǎng)。就目前商務(wù)英語(yǔ)口譯教學(xué)現(xiàn)狀而言,高要求和高難度都讓商務(wù)英語(yǔ)口譯教學(xué)發(fā)展現(xiàn)狀存在較多問(wèn)題:一是商務(wù)英語(yǔ)口譯教學(xué)中的源語(yǔ)輸入問(wèn)題,在具體的教學(xué)展開(kāi)過(guò)程中學(xué)生無(wú)法規(guī)避誤聽(tīng)、信息遺漏等問(wèn)題,在當(dāng)下的教學(xué)方法中也無(wú)法有效規(guī)避以上問(wèn)題;二是商務(wù)英語(yǔ)口譯教學(xué)中的編碼問(wèn)題,學(xué)生在具體的口譯過(guò)程中會(huì)出現(xiàn)句型結(jié)構(gòu)混淆、遺漏,英漢轉(zhuǎn)換過(guò)程中的語(yǔ)態(tài)、時(shí)態(tài)難以有效轉(zhuǎn)換等問(wèn)題。在商務(wù)英語(yǔ)口譯教學(xué)中也并沒(méi)有針對(duì)這一問(wèn)題出現(xiàn)有效的解決措施;三是目的語(yǔ)的輸出問(wèn)題,詞匯的精準(zhǔn)選擇,中英語(yǔ)言轉(zhuǎn)換中的信息殘缺以及難以做到口譯翻譯的即時(shí)性;四是商務(wù)英語(yǔ)口譯教學(xué)的時(shí)間限制,口譯教學(xué)需要大量的教學(xué)時(shí)間和前期系統(tǒng)的學(xué)習(xí),但是就目前高校的商務(wù)英語(yǔ)口譯教學(xué)課時(shí)安排分析,一個(gè)學(xué)期的課時(shí)難以滿足當(dāng)前的教學(xué)需求,短暫的課時(shí)難以培養(yǎng)出大量?jī)?yōu)秀的口譯人才。
二、語(yǔ)料庫(kù)在商務(wù)英語(yǔ)口譯中的應(yīng)用
小議小學(xué)語(yǔ)文語(yǔ)料庫(kù)的設(shè)計(jì)與開(kāi)發(fā)
一、開(kāi)發(fā)和研究小學(xué)語(yǔ)文教學(xué)
語(yǔ)料庫(kù)主要是采用的ASP語(yǔ)言寫(xiě)程序,采用SQLSE1KVE1K2000數(shù)據(jù)庫(kù)服務(wù)器做數(shù)據(jù)存儲(chǔ)服務(wù)以及采用IIS60Web服務(wù)器語(yǔ)料庫(kù)檢索網(wǎng)站。這個(gè)過(guò)程主要有:語(yǔ)料采集、原料庫(kù)加工和開(kāi)發(fā)語(yǔ)料庫(kù)的檢索功能等環(huán)節(jié)。
1、語(yǔ)料一般都是來(lái)源于互聯(lián)網(wǎng)上的一些讀書(shū)網(wǎng)站,這是主要來(lái)源。
2、在小學(xué)語(yǔ)文教學(xué)語(yǔ)料庫(kù)設(shè)計(jì)時(shí)肯定會(huì)碰到難點(diǎn),在建設(shè)資料庫(kù)時(shí)需要收集的資料并不是匯集在一起的,需要設(shè)計(jì)者進(jìn)行搜集,要把這些結(jié)構(gòu)多樣的資源轉(zhuǎn)化為結(jié)構(gòu)統(tǒng)一的語(yǔ)料庫(kù)并不是一件簡(jiǎn)單的事,而且很多資源都是網(wǎng)頁(yè)形式的,而語(yǔ)料庫(kù)的全文卻是文本形式的,這樣就要求設(shè)計(jì)者進(jìn)行處理,這也是一項(xiàng)比較困難繁雜的工作。
3、對(duì)于小學(xué)語(yǔ)文教學(xué)語(yǔ)料庫(kù)所遇到問(wèn)題的解決方法,大多數(shù)網(wǎng)站的資源格式基本上都是一樣的。這樣我們就可以利用這些相同點(diǎn)來(lái)進(jìn)行解決,我們可以去發(fā)現(xiàn)各個(gè)網(wǎng)站對(duì)于文章的作者、標(biāo)題等的標(biāo)記的規(guī)則,將其轉(zhuǎn)化為我們需要的文本格式,運(yùn)用到我們的語(yǔ)料庫(kù)中。但是在有些情況下某個(gè)網(wǎng)站的不同的頁(yè)面中對(duì)文章的同一部分所用的標(biāo)記也不相同,這些地方我們的解決方法是尋找兩者之間的共性,尤其是在標(biāo)記部分的共性,利用這些共性對(duì)這兩種標(biāo)記方式進(jìn)行統(tǒng)一的表達(dá)。
4、注意結(jié)果的統(tǒng)計(jì)。小學(xué)的語(yǔ)料庫(kù)中共收集了一萬(wàn)零六百六十五篇,這些結(jié)果的收集對(duì)教學(xué)和研究是非常有益的。小學(xué)語(yǔ)文教學(xué)語(yǔ)料庫(kù)的加工要注意句子層次的加工和篇章層次的加工,句子層次的加工主要是將篇章分割成若干句子,同時(shí)確定每句話的長(zhǎng)度,而后將這些句子數(shù)據(jù)存入句子數(shù)據(jù)表中。篇章層次的加工在語(yǔ)料采集過(guò)程已經(jīng)部分的完成,包括對(duì)標(biāo)題、作者、體裁和字?jǐn)?shù)等屬性。
語(yǔ)料庫(kù)在英語(yǔ)詞匯教學(xué)中的應(yīng)用
1指導(dǎo)學(xué)習(xí)高頻詞
英語(yǔ)的詞匯總量可以說(shuō)是難以計(jì)數(shù)的,如此海量的詞匯,在實(shí)際學(xué)習(xí)中沒(méi)有必要完全掌握,教師應(yīng)當(dāng)引導(dǎo)學(xué)生充分掌握和學(xué)習(xí)最基本、能產(chǎn)性最強(qiáng)以及高頻使用的詞匯。(肖忠華、戴光榮,2010)語(yǔ)料庫(kù)的詞頻統(tǒng)計(jì)就正好符合該要求,通過(guò)詞頻統(tǒng)計(jì),學(xué)生能夠充分了解不同等級(jí)高頻詞匯的數(shù)量及應(yīng)用范圍。根據(jù)Kucera與Francis統(tǒng)計(jì),在Brown語(yǔ)料庫(kù)中進(jìn)行檢索,結(jié)果顯示,頻率排名在1000以內(nèi)的單詞,覆蓋普通文本72%;頻率排名在2000以內(nèi)的單詞,覆蓋普通文本達(dá)到了79.6%。為此,在實(shí)施教學(xué)時(shí),教師應(yīng)在有限的時(shí)間內(nèi),將精力集中在詞頻2000以內(nèi)的單詞,若學(xué)生能夠基本掌握這些詞匯,那么也就基本掌握了所閱讀文章的大概意思,這不僅能提高學(xué)生對(duì)詞匯積累的興趣和成就感,同時(shí)也有利于教師教學(xué)質(zhì)量和效率的提高。
2分析語(yǔ)義韻
語(yǔ)義韻是詞匯教學(xué)中重要的方面,根據(jù)節(jié)點(diǎn)詞與共現(xiàn)詞的語(yǔ)義特點(diǎn),可將語(yǔ)義韻分為消極、中性和積極三種類型。其中消極語(yǔ)義韻的語(yǔ)境通常具有濃厚的消極色彩;中性語(yǔ)義韻能夠吸引各種詞項(xiàng)語(yǔ)義,氛圍較為復(fù)雜,故又稱之為錯(cuò)綜語(yǔ)義韻;積極語(yǔ)義韻的語(yǔ)義氛圍具有強(qiáng)烈的積極語(yǔ)義。
3辨析詞語(yǔ)搭配錯(cuò)誤
單詞本身的含義,并非獨(dú)立存在,是與其他詞匯共同組成語(yǔ)句來(lái)體現(xiàn)的。詞項(xiàng)與結(jié)伴詞項(xiàng)間有一定的結(jié)伴規(guī)律,能夠相互吸引、相互期待,并且搭配成份的類聯(lián)接關(guān)系等都主要通過(guò)詞語(yǔ)搭配的方式存在,這也是詞語(yǔ)搭配研究的關(guān)鍵內(nèi)容。通過(guò)語(yǔ)料庫(kù)的運(yùn)用,學(xué)生不僅能夠更加形象、直觀地了解詞語(yǔ)搭配,而且能夠辨析和糾正詞語(yǔ)搭配錯(cuò)誤。
熱門標(biāo)簽
相關(guān)文章
1語(yǔ)料庫(kù)輔助高中英語(yǔ)詞匯教學(xué)研究
3自建語(yǔ)料庫(kù)中醫(yī)英語(yǔ)詞匯教學(xué)研究
4自建語(yǔ)料庫(kù)在商務(wù)英語(yǔ)翻譯的應(yīng)用
相關(guān)期刊
-
語(yǔ)料庫(kù)語(yǔ)言學(xué)
主管:中華人民共和國(guó)教育部
級(jí)別:部級(jí)期刊
影響因子:--
-
術(shù)語(yǔ)標(biāo)準(zhǔn)化與信息技術(shù)
主管:中華人民共和國(guó)國(guó)家質(zhì)量監(jiān)督檢驗(yàn)檢疫總局
級(jí)別:省級(jí)期刊
影響因子:--
-
國(guó)際漢語(yǔ)學(xué)報(bào)
主管:廈門大學(xué)海外教育學(xué)院;廈門大學(xué)海外文化研究所;新僑研究院
級(jí)別:省級(jí)期刊
影響因子:--
-
漢日語(yǔ)言對(duì)比研究論叢
主管:華東理工大學(xué)出版社有限公司
級(jí)別:省級(jí)期刊
影響因子:--