word與LaTex概述
word是眾所周知的排版軟件之一,其最大的特點是“所見即所得”,因其方便、易于操作而擁有大量的用戶。而LaTex 是一種基于TeX 的排版系統,從嚴格意義上講并不是一種軟件,而是一類格式化排版程序,是在TeX 語言上發展起來的一種更加方便、強大的宏命令包,通過排版程序對LaTex 源文件(.TeX或者.ctx)進行處理并將結果傳到輸出設備,其最大優點是開源和高質量的輸出(常見輸出格式為PDF文件)。雖然TeX 系統是目前公認的數學公式排得最好的系統,但其排版命令繁瑣,源文件可讀性差,用戶不易掌握。這兩種排版系統各有千秋,而在排版高質量科技書籍或論文,尤其是含有大量數學公式的科技論文方面,LaTex 更受到科技學者的青睞。國際上許多著名出版機構也都推薦或要求使用LaTex 投稿,例如荷蘭愛思唯爾公司、德國施普林格公司等。
Tex2word與word2Tex軟件簡介
Tex2word
Tex2word軟件可以將TeX/LaTex 文件轉化為word文件。LaTex 源文件是ASCII碼的文本文件,本身并不能像word一樣實現“所見即所得”,需要運行程序編譯成PDF文件,才能顯示如同word一般的排版效果。也有人嘗試利用PDF 轉word 的軟件(如PDF2word)將LaTex 源文件生成的PDF文件轉換為word文件,但由于PDF格式與word格式解碼不同,所以對于科技論文尤其是數學類論文,轉換效果都不理想,即使可以轉換一部分文本,也會丟失所有數學公式,出現大量亂碼,排版混亂。那么,最可行的途徑還是直接由LaTex源文件轉換成word文件,而Tex2word恰好是目前LaTex源文件轉換成word文件的最好軟件。
word2Tex
word2Tex 軟件可以將word 文件轉化為TeX/LaTex文件。即使沒有學習過LaTex 也可以編寫LaTex格式文章,作者可以先用word撰寫論文及書籍,使用word 自帶公式編輯器或MathType編輯器編寫公式,插入圖形或建立表格,再通過word2Tex軟件將其轉換成LaTex文件,而不需要重新輸入LaTex 命令來編寫數學公式。轉換后只需做一些命令的調整,就可以編譯生成與原word內容基本一致的PDF文件。
Tex2word軟件的使用及轉換效果
安裝及使用說明
(1)操作系統必須是Windows XP SP2及以上;已安裝Microsoft word/Office(32位);如果版本低于word/Office2007,則必須安裝MathType數學公式編輯器4.0以上;硬盤空間不小于100M。
(2)下載并按提示安裝Tex2word軟件(官網地址http://www.chikrii.com/products/Tex2word/Tex2word/)。
(3)運行Microsoft word,點擊“文件”→“打開”→“文件類型”下拉菜單中選擇“TeX”格式。
(4)選擇待轉換LaTex源文件,點擊“打開”,跳出對話框選擇“是”,出現轉換界面,點擊“ok”,另存為“.doc”文件,即可得到轉換后的word文件。
注:即使電腦上未安裝LaTex相關軟件,也可以進行以上轉換操作。更方便地,可以直接右鍵點擊待轉換LaTex 源文件,選擇“打開方式”為“Microsoft word”,點擊“確定”即可轉換LaTex為word文件。如果LaTex 源文件的后綴名是“.ctx”,則只需將后綴名改為“.TeX”,再進行如上步驟。
轉換效果
衡量LaTex轉換成word是否成功的關鍵在于,其轉換后的文件內容是否可以跟源文件編譯的PDF文件內容保持高度一致。而事實證明,Tex2word能轉換LaTex中的絕大部分中英文文本,而不出現亂碼,且對于數學公式的轉換效能也非常出色。
圖1 Tex2word軟件對數學符號的轉換效果
圖1給出了Tex2word對于常用數學符號的轉換情況。從圖中可見,經Tex2word轉換后的word文件中的數學符號基本與由LaTex生成的PDF中的數學符號一致,少數符號出現了亂碼(圖1中顯示為“?”)。
圖2 Tex2word軟件對復雜數學公式的轉換效果
哪怕是較為復雜的數學公式,轉換效果也很理想,如圖2所示,公式中的希臘字母、運算符、上下角標等,在轉換過程中,未發生偏差。進一步,我們選取LaTex源文件的部分編譯命令,制成一個精簡的數學論文LaTex模板,來看一下Tex2word軟件對于整篇LaTex文件的轉換效果,如圖3所示(LaTex源文件略)。
圖3 Tex2word軟件對整篇LaTex模板的轉換效果
比較發現,經Tex2word轉換后的整篇word 文件(圖3b),與LaTex源文件生成的PDF文件(圖3a)相差無幾,不僅保留了絕大部分文本信息,而且也沒有丟失數學公式。即使LaTex源文件是中英文混排,其中還包含方程組、矩陣、復雜多排公式等,也都不影響轉換。雖然轉換成word后在排版格式上(如字號、字體、位置、間距等)會有些許改變,但只需后期再稍微調整一下即可,這就極大地減少了重排版時的工作量。
其中需要注意幾點:1)轉換過程中有一些LaTex語句word無法識別,會導致編譯陷入死循環,造成轉換失敗,這時只需在LaTex源文件中修改或刪除這些無法識別的指令,再運行Tex2word進行轉換。2)Tex2word只能轉換常見數學符號(圖1),對于LaTex中Amssymb宏包里的數學符號無法進行轉換。3)因為作者撰寫的LaTex模板不同,所以轉換后word文件中會多出一些LaTex語句(如字號、間距等命令),重排時需要刪去這些語句。
word2Tex軟件的使用及轉換效果
安裝及使用說明
(1)操作系統必須是Windows 95以上;已安裝Microsoft word 95 以上版本;硬盤空間不小于10M。
(2)下載并按提示安裝word2Tex軟件(官網地址http://www.chikrii.com/products/Tex2word/word2Tex/)。
(3)安裝完成后word2Tex會自動嵌入word,打開需要轉換的word文件,然后點擊“文件”→“另存為”→“保存類型”中選擇“.TeX”格式→屬性框(圖4)中點擊“確定”,即可完成轉換。
注:默認設置下(每次轉換文件時都會彈出該屬性對話框),輸出版本為LaTex 2e(與舊版LaTex 2.09區別主要在于導言、公式及樣式命令),輸出文件編碼為ANSI碼(Windows系統下),采用UNIX/Windows系統下的換行字符LF,且能夠識別文本中的內嵌公式。
圖4 Tex2word轉換屬性框
轉換效果
在對屬性框默認設置不做修改的情況下,word2Tex能夠迅速轉換word文件中的文本信息。而且,由于word公式編輯器(或者MathType編輯器)自帶的translator選項本身就提供了向LaTex/amsLaTex格式轉換的功能(只針對單個公式),所以word2Tex能夠非常完美地批量轉換這類編輯器創建的一系列數學符號及復雜公式。此外,我們還可以通過對屬性框子菜單的進一步設置,如轉換文本顏色、字號等(圖4),獲得更為理想的轉換效果。選取一篇含有數學公式、表格及圖片的中英文混排word文件(圖5a),經word2Tex轉換(其中屬性框設置稍作修改),得到LaTex源文件(略),編譯生成PDF文件(圖5b)。兩者對比發現,除了排版格式上的不同,如字體、標題位置、表樣式等,顯示內容基本一致,這說明word轉LaTex文件是比較成功的。
其中需要注意幾點:
1)對于中英文混排的word文件,轉換成LaTex文件后,如果直接編譯會丟失中文文本信息,因此,在LaTex文件導言部分需要使用CCT預處理(如輸入命令\documentclass{cctart}),或者調用CJK宏包,以便排版中文。
2)默認設置下,word中的圖片轉換成EPS格式,直接編譯可能會丟失圖片,為解決EPS圖片插入問題,可在源文件導言部分調用\usepackage{EPStoPDF}宏包;另外,圖片文件名中如果出現中文會導致編譯失敗,需重新用英文或數字命名。
3)原word文件盡可能使用適合的段落樣式排版(如利用“樣式與格式”菜單設置章節標題),這樣轉換出來的LaTex 文件中也將包含標題命令,如“\section{標題一}”,否則將轉換成不帶標題命令的普通文本。
4)利用word公式編輯器(或者MathType編輯器)編輯的數學公式內不能含有中文,否則轉換后會丟失中文信息;數學公式編號必須加括號(英文半角),如“(1)、(1.1)”,而不能表示為“1-1”,否則,將轉換成普通文本而不是LaTex的編號命令。當然,word2Tex轉換屬性框的設置畢竟是有限的,word2Tex 轉換出來的也只是一個簡單的LaTex模板,仍然無法達到一些用戶的更高要求。所以為了獲得更好的轉換輸出效果,推薦做法是先選取一個特定模板(一般利用LaTex排版的編輯部都會提供自己的LaTex模板),通過word2Tex將word轉換成LaTex文件,再將轉換后的內容(LaTex語句)分段復制粘貼到給定LaTex模板中的相應位置。每個模板都對字體、字號、章節段落等格式化排版命令做了嚴格規定,而分段粘貼能夠確保正文內容上的準確性,也避免了對模板格式命令的改動,不會對輸出版式造成很大影響,只要對局部命令稍作調整后再進行編譯,即可很快實現LaTex重排。
圖5 Word2Tex軟件對整篇Word文件的轉換效果
結 語
使用Tex2word與Word2Tex軟件,能夠最大限度地實現Word與LaTex文件的快速轉換,這為排版工作帶來極大方便。收到的稿件不論是Word格式還是LaTex格式,都可以根據編輯部排版系統的要求,選擇這兩款軟件其中之一進行轉換,從而得到所需的稿件格式。雖然轉換中會出現一些問題,但在很大程度上減少了重排時的工作量,提高了排版效率。
來源:中國科技期刊研究