學(xué)術(shù)期刊PDF文件處理方法

時(shí)間:2022-02-25 08:25:00

導(dǎo)語(yǔ):學(xué)術(shù)期刊PDF文件處理方法一文來源于網(wǎng)友上傳,不代表本站觀點(diǎn),若需要原創(chuàng)文章可咨詢客服老師,歡迎參考。

學(xué)術(shù)期刊PDF文件處理方法

網(wǎng)絡(luò)出版具有傳播速度快、傳播范圍廣、檢索方便、閱讀便利等優(yōu)點(diǎn)[1-2],已成為傳播研究成果的重要方式。網(wǎng)絡(luò)出版主要有期刊網(wǎng)站和第三方數(shù)據(jù)庫(kù)平臺(tái)等模式。目前,已有越來越多的期刊自建網(wǎng)站,并通過期刊網(wǎng)站及時(shí)發(fā)布稿件全文,以便于讀者閱讀和作者下載,提高期刊的影響力。在第三方數(shù)據(jù)庫(kù)平臺(tái)提供商中,中國(guó)知網(wǎng)在2017年推出了網(wǎng)絡(luò)首發(fā)出版平臺(tái)[3],通過該平臺(tái)可進(jìn)一步縮短出版時(shí)滯,且該平臺(tái)支持增強(qiáng)出版的新型數(shù)字出版模式[4],允許期刊在上傳稿件根文獻(xiàn)的同時(shí)提交相關(guān)的附加材料,這極大有助于讀者對(duì)稿件的理解。PDF格式文獻(xiàn)可保持電子文獻(xiàn)與紙質(zhì)印刷的一致性,同時(shí)具有跨平臺(tái)、體積小、安全性高等優(yōu)點(diǎn),目前仍然是我國(guó)學(xué)術(shù)期刊實(shí)現(xiàn)數(shù)字出版的主要模式[5]。在整期定稿后進(jìn)行中國(guó)知網(wǎng)網(wǎng)絡(luò)首發(fā)及在期刊網(wǎng)站發(fā)布時(shí)需要對(duì)整期pdf文件進(jìn)行繁瑣的單篇拆分操作,對(duì)含有附錄的稿件,還需定位出是哪些稿件含有附錄以提醒稿件責(zé)編準(zhǔn)備附錄材料,在期刊網(wǎng)站發(fā)布時(shí),為便于讀者閱讀可將含附錄的稿件與相應(yīng)附錄進(jìn)行合并再上傳至后臺(tái)系統(tǒng)。這涉及一系列重復(fù)性操作,非常耗費(fèi)編輯的時(shí)間,也影響了稿件的及時(shí)網(wǎng)絡(luò)發(fā)布。VBA作為一種強(qiáng)大的編程語(yǔ)言,有助于實(shí)現(xiàn)重復(fù)工作的自動(dòng)化,已在編輯工作中有所應(yīng)用,并取得了較好的效果[6]。目前,暫未見到關(guān)于VBA處理整期PDF文件的文獻(xiàn)報(bào)道,為此,筆者根據(jù)在《電力自動(dòng)化設(shè)備》雜志社的工作實(shí)踐,建立稿件處理窗口,采用VBA編程分別實(shí)現(xiàn)一鍵整期PDF文件單篇稿件的拆分、在組稿單中含附錄稿件的標(biāo)注及單篇稿件與附錄的合并功能,以節(jié)省編輯工作時(shí)間,加快稿件的網(wǎng)絡(luò)發(fā)布,提高期刊的影響力。

1準(zhǔn)備工作

采用OfficeWord和AdobeAcrobat這2種常用辦公軟件,并在WordVBA編輯器中,將AdobeAcrobat9.0TypeLibrary和MicrosoftScriptingRuntime加入工具菜單的引用中。原始文件為組稿單Word文件和整期稿件PDF文件,以《電力自動(dòng)化設(shè)備》2021年第2期為例,組稿單如表1所示。

2功能實(shí)現(xiàn)

2.1窗口建立

在WordVBA編輯器的Normal工程下建立如圖1所示用戶窗體。其中,輸入單篇稿件的名稱前綴,再點(diǎn)擊“整期拆分及標(biāo)注含附錄稿”按鈕,可將整期PDF文件拆分為單篇稿件,并在組稿單中對(duì)含附錄的稿件進(jìn)行突出顯示,以提醒相應(yīng)責(zé)編準(zhǔn)備附錄。一方面,可將準(zhǔn)備好的附錄文件與拆分的單篇稿件進(jìn)行中國(guó)知網(wǎng)網(wǎng)絡(luò)首發(fā),另一方面,無(wú)需輸入,直接點(diǎn)擊“單篇合并附錄”按鈕可實(shí)現(xiàn)含附錄的稿件與相應(yīng)附錄文件夾中附錄文件的合并,并將合并后的文件在期刊網(wǎng)站進(jìn)行發(fā)布。

2.2整期拆分及標(biāo)注含附錄稿

整期期刊通常由數(shù)十篇稿件構(gòu)成,若對(duì)照每篇稿件在組稿單中的頁(yè)碼采用PDF軟件的提取頁(yè)面功能一一提取并命名保存將極其繁瑣耗時(shí),尤其在含有轉(zhuǎn)頁(yè)時(shí)還需單獨(dú)提取轉(zhuǎn)頁(yè),再將單篇稿件與相應(yīng)轉(zhuǎn)頁(yè)進(jìn)行合并。此外,由于整期文件中并非每篇稿件都有附錄,若對(duì)每篇稿件進(jìn)行一一查看是否含附錄將會(huì)浪費(fèi)時(shí)間。為此,筆者開發(fā)了整期PDF文件的拆分及標(biāo)注含附錄稿程序。表1組稿單中“頁(yè)碼”列采用符號(hào)“-”連接不含轉(zhuǎn)頁(yè)稿件的起止頁(yè)或含轉(zhuǎn)頁(yè)稿件主體部分的起止頁(yè),以符號(hào)“→”后頁(yè)碼表示轉(zhuǎn)頁(yè)。整期PDF文件拆分的實(shí)現(xiàn)思路為:遍歷表1組稿單中“頁(yè)碼”列,以“*#[→]#*”Like運(yùn)算判斷該行是否為含轉(zhuǎn)頁(yè)稿件信息,如果是,則分別創(chuàng)建整期PDF文件中該單篇稿件的主體部分PDF文件和轉(zhuǎn)頁(yè)部分PDF文件,并將這兩部分合并存儲(chǔ),如果不是,則以“*#[-]#*”Like運(yùn)算判斷該行是否為不含轉(zhuǎn)頁(yè)稿件信息,如果是,則創(chuàng)建一個(gè)PDF文件存儲(chǔ)整期PDF文件中該單篇稿件部分即可,依此循環(huán)完成對(duì)所有單篇稿件的拆分。需說明的是,在對(duì)各篇稿件創(chuàng)建新的PDF文件時(shí),PDF文件以0為起始頁(yè),則其在整期文件中起始頁(yè)為組稿單中起始頁(yè)+正文前的頁(yè)數(shù)-1,《電力自動(dòng)化設(shè)備》期刊正文前包括4頁(yè)目次和1頁(yè)宣傳內(nèi)容,因此,程序中各篇稿件在整期文件中的起始頁(yè)為組稿單中起始頁(yè)+4。此外,本程序的輸入為單篇稿件名稱的前綴,《電力自動(dòng)化設(shè)備》期刊采用“年+期+0+序號(hào)”的命名方式,序號(hào)不足10的在前面補(bǔ)0,如2021年第2期稿件的名稱前綴為202102?!峨娏ψ詣?dòng)化設(shè)備》期刊在包含附錄的稿件中以“附錄見本刊網(wǎng)絡(luò)版(http:∥www.epae.cn)。”對(duì)附錄進(jìn)行鏈接和標(biāo)注,基于此,標(biāo)注含附錄稿程序?qū)崿F(xiàn)思路為:將整期拆分后的單篇PDF稿件另存為txt格式臨時(shí)文件,遍歷圖1組稿單中“序號(hào)”列,以“*#*”Like運(yùn)算判斷是否為稿件序號(hào),即該行是否為稿件信息,如果是,則讀取該稿件對(duì)應(yīng)的txt文件,判斷是否包含附錄標(biāo)志,如果包含,則對(duì)組稿單中該序號(hào)所在單元格以黃色填充突出顯示,依此循環(huán)完成整期文件中所有包含附錄稿件的突出顯示,同時(shí)刪除臨時(shí)txt文件。

2.3單篇合并附錄

在責(zé)編準(zhǔn)備好稿件附錄后,即可將整期拆分文件與附錄一并上傳至中國(guó)知網(wǎng)網(wǎng)絡(luò)首發(fā)平臺(tái)進(jìn)行發(fā)布。在期刊網(wǎng)站,為方便讀者閱讀,可將含附錄稿件與附錄合并后再上傳。附錄按照中國(guó)知網(wǎng)的格式要求以“根文獻(xiàn)名稱_附加材料”的方式命名并放置于相同名稱的文件夾中,若將附錄從文件夾中取出并與相應(yīng)稿件一一合并較為繁瑣費(fèi)時(shí)。筆者開發(fā)出一鍵合并程序,實(shí)現(xiàn)思路為:遍歷附錄文件夾,將文件夾中附錄與相應(yīng)稿件合并替換原稿件,依此循環(huán)直到遍歷完所有附錄文件夾即完成所有附錄與相應(yīng)稿件的合并。該功能的具體操作方法為:在文件夾中放入準(zhǔn)備好的附錄文件夾,點(diǎn)擊“單篇合并附錄”按鈕即可。

3實(shí)例展示

以《電力自動(dòng)化設(shè)備》2021年第2期為例,將表1組稿單與整期PDF文件放置于同一文件夾中,在窗口中輸入名稱前綴“202102”并點(diǎn)擊“整期拆分及標(biāo)注含附錄稿”按鈕,得到結(jié)果如圖2、表2所示。在文件夾中放入準(zhǔn)備好的附錄文件夾,點(diǎn)擊“單篇合并附錄”按鈕,圖2中含附錄的單篇稿件即被單篇稿件與相應(yīng)附錄的合并文件所替代。

4結(jié)論

在整期稿件定稿后進(jìn)行中國(guó)知網(wǎng)網(wǎng)絡(luò)首發(fā)及期刊網(wǎng)站發(fā)布時(shí)需要對(duì)整期PDF文件進(jìn)行繁瑣的重復(fù)操作,為此筆者開發(fā)了稿件處理程序,實(shí)現(xiàn)整期稿件的拆分、含附錄稿件的標(biāo)注及單篇稿件與附錄的合并功能。實(shí)際應(yīng)用表明該程序功能有效,可幫助編輯解脫繁瑣的PDF文件操作。