首頁>>搜索技巧>>正文

 

 繁體版搜索引擎的使用

 ncchenlin  2002/07/26




  注:本節供使用 Windows 簡體中文版的讀者參考

  許多內容很豐富的搜索引擎只有繁體中文版,特別是港臺地區的搜索引擎。那么,對于電腦上安裝了簡體中文操作系統的用戶來說,怎樣使用這些繁體版的搜索引擎呢?

  (一)安裝支持繁體中文的軟件
  在簡體中文環境下使用繁體搜索引擎,需要安裝一套支持繁體中文的軟件。如果你的瀏覽器是微軟公司的探險者(Internet Explorer,即 IE,又譯“探索者”)4.0 簡體中文版,它本身就帶有繁體中文支持,只是需要在安裝的選項中選擇這一項。
  支持繁體中文的軟件,有的只有顯示功能(只有 Big5 繁體字庫),而沒有輸入功能(沒有繁體 Big5 輸入法)。如果僅僅想閱讀搜索引擎的分類目錄,那么只要能顯示繁體字就可以了。而要使用關鍵詞搜索,就必須有輸入繁體字的功能。此外,有些軟件可以在 Windows 3.1 環境下使用,有些軟件只能在 Windows 95 下使用。因此必須根據自己的情況選擇繁體中文軟件。下邊是一些常用軟件的網址和功能說明:

軟件名 Windows 3.1 Windows 95 輸入功能 下載界面
微軟繁體字 × √ √ 中文
南極星 √ √ √ 英、繁
兩岸通 √ √ × 中文
四通利方 √ √ √ 中文
雙橋 √ √ √ 英文
Unionway √ √ √ 英文

  使用蘋果機(MAC)者可試一試 Elixir 或者 Chinese Language Kit 。

  (二)繁體字搜索
  在繁體版搜索引擎中使用搜索功能時,不同的瀏覽器會有不同的方法。

  1. IE 4.0 簡體中文版以外的瀏覽器:
  如果你使用 IE 4.0 簡體中文版(包括4.01 5.0等更高的版本)以外的其他任何一種瀏覽器,如 IE 3.2 中文版、IE 4.0 英文版、網景公司的導航者(Netsgape Navigator,又譯“領航者”)等,那么問題很簡單,只要啟動支持繁體輸入的中文軟件,選擇繁體字輸入法(BIG5碼的輸入法),在搜索引擎的文字框中輸入關鍵詞的繁體字,就可以查詢搜索了。
  例如:使用南極星的全球通時,將當前的環境設置為“中文自動繁體”,打開其中文輸入法即可(參見 GBK 輸入法)。

  2. IE 4.0 簡體中文版:
  如果你使用 IE 4.0 簡體中文版(包括4.01、5.0等更高的版本),問題就有些復雜了。IE 4.0 簡體中文版在查閱繁體網站時,有時會需要手工指定語言版本(使用“查看”菜單的“字體”命令,或使用右鍵點擊頁面,選擇“語言”項)。它內部有一個簡、繁體自動轉換的功能,由于很不完善,所以會引起許多問題。
  這時我們不能使用繁體 BIG5 碼的輸入法,而需要使用 GBK 碼漢字輸入法,輸入 GBK 碼中的繁體字后,IE 會自動將 GBK 碼繁體轉換為 Big5 碼繁體,發送出去。
  關于 GBK 碼,詳見《繁體版搜索引擎的使用(二)—— GBK 碼漢字及輸入法》。
  當然,在個別情況下,即,要查詢的關鍵詞,簡體與繁體完全相同,如“故事”二字,簡體繁體寫法完全相同,我們也可以使用一般的簡體中文輸入法,直接輸入簡體字(GB碼),點擊查詢按鈕后,IE 會自動將簡體(GB 碼)轉換為繁體(Big5 碼)發送出去。

  (三)注意事項
  在使用繁體搜索引擎時,要特別注意,由于大陸與臺灣、香港的文化背景不同,因此形成的一些詞匯方面的差異。例如:

大陸詞匯 錄像   知識產權 磁盤   新西蘭  克林頓  硅谷  
臺港詞匯 錄影   智慧財產權 磁碟   紐西蘭  柯林頓  矽谷  

  所以,使用繁體搜索引擎,不但要輸入繁體字,而且要注意臺港詞匯。
  優秀的搜索引擎,應該有一個對應詞表,自動幫助用戶轉換詞匯,但目前的搜索引擎,大都未達到這一水平。本站以后會陸續提供一些相關的參考資料。

繁體版搜索引擎的使用(二)
     —— GBK 碼漢字及輸入法

! 本頁使用了 GBK 代碼,有些字在一般的中文環境中無法顯示,或出現亂碼。使用 Windows 95 英文版 + 外掛中文平臺者,請將當前環境設置為 GBK 中文,并關閉漢字自動識別功能。詳情參見 GBK 代碼表 的說明。

  使用 Windows 95 簡體中文版的用戶,也常用 IE 4.0 簡體中文版瀏覽器,如前所述,用它來查詢繁體搜索引擎,必須使用 GBK 碼繁體漢字輸入關鍵詞,它自動將 GBK 繁體字轉換為 BIG5 繁體漢字發送出去。下邊我們介紹一些必要的知識。

  (一)什么是 GBK 漢字
  GBK 碼漢字是一個大的漢字系統,它包括了目前流行的 GB 碼簡體漢字和 BIG5 繁體漢字。一般來說,GBK 碼中的漢字分為兩種情況,一是簡體字,即原來 GB 碼中的漢字,通常稱為 GBK 簡體;二是繁體字,即原來 BIG5 碼中的漢字,通常稱為 GBK 繁體。如“燈”是 GBK 簡體,“燈”是 GBK 繁體。
  關于 GBK 更進一步的了解,請參看《參考資料》單元的 GBK 漢字內碼擴展規范。
  Windows 95、98 簡體中文版都使用了 GBK 漢字系統(其宋體、黑體兩種字體為 GBK 字庫)。此外像南極星、四通利方等外掛式中文平臺,都提供了 GBK 漢字支持。

  (二)怎樣輸入 GBK 繁體字
  輸入 GBK 繁體字有多種方法,各有優劣,這里介紹常見的幾種:

  1. Windows 95、98 簡體中文版自帶的 GBK 漢字輸入法
  Windows 95 提供了 GBK 內碼、GBK 全拼、GBK 雙拼、GBK 表形碼和 GBK 鄭碼5種 GBK 輸入法。但這些輸入法不是安裝的默認選項,需要從“控置面板”中打開“輸入法”對話框來添加。Windows 98 默認安裝的全拼輸入法則可以選擇輸入一般漢字和 GBK 漢字(使用該輸入法的屬性設置)。
  這些 GBK 輸入法中只有全拼比較常用,而且,這些輸入法所輸入的漢字,包括了 GBK 繁體和 GBK 簡體,數量非常大,所以造成兩方面的不便:一是重碼率高,選字非常麻煩;二是繁體簡體同時出現,有些字不容易分辨繁簡。

  2. 微軟拼音輸入法 2.0 版
  這是一個免費軟件,我們可以從微軟公司的下列網址得到:
  http://www.microsoft.com/china/msdownload/mspy/default.htm
  (一些共享軟件下載的網站也有提供)。
  微軟拼音輸入法 2.0 版中,有一個輸入簡體字和輸入繁體字的選擇,當選擇繁體字輸入時,輸入的便是 GBK 繁體字。由于選擇繁體輸入后,它只列出 GBK 繁體,所以重碼率較 GBK 全拼低得多。但是這一輸入法體積非常龐大,有6.87 MB,同時,它不能在網景公司的導航者(Netscape Navigator)中使用。

  3. 微軟公司的 Global IME for Chinese (Tradition)
  這也是一個免費軟件,可以從微軟公司的下列網址得到:
  http://www.microsoft.com/ie_intl/cn/ie40/?/ie_intl/cn/ie40/ime.htm
  Global IME 中包括了一個可以在簡體中文版 IE 中輸入繁體字的輸入法,但這是一個通行于臺灣地區的“注音輸入法”,它與通行于大陸的“拼音輸入法”有相通之處,但記音符號、拼寫規定和鍵盤規定方面又有很大差異,所以并不實用。而且,它同樣不能用于其他的瀏覽器。

  4. 南極星公司的南極星全球通(Njstar Communicator 2.0)所帶的輸入法
  南極星全球通是一個中文環境,可以在任何語言版本的 Windows 95、98 中使用,它所帶的輸入法有拼音、雙拼、注音、五筆畫、四角號碼等許多種。啟動南極星后需要做四步工作:
  ① 擊當前環境設置按鈕,選擇 Chinese Auto Tradition(中文自動繁體);
  ② 擊輸入法按鈕,選擇 Chinese Input(中文輸入法);
  ③ 擊輸出代碼按鈕,選擇“中文擴展碼 GBK”,或“統一碼 Unicode”;如果你使用的瀏覽器是導航者(Netscape Navigator),則需要在此選擇“中文大五碼 BIG5”;
  ④ 擊輸入法按鈕,選擇你所熟悉的輸入法,便可以輸入GBK繁體中文字了。
  如下圖所示:

  南極星是一個非常優秀的中文軟件,它不僅可以在 IE 中使用,也可以在導航者(Netscape Navigator)或其他軟件中使用。但它不是一個免費軟件,你可以在南極星的網站中,下載到免費使用30天的試用版。

  (三)注意事項
  GBK 碼漢字雖然可以分為繁體和簡體,但對于以簡體字為基本環境的用戶來說,還有許多復雜的問題,需要有更多的繁體字知識,才能更好地掌握。繁體與簡體的對應關系,主要有三種情況:
  1. 繁體與簡體一一對應。如繁體字“燈”,只對應一個簡體字“燈”。
  2. 多個繁體字對應一個簡體字。如繁體的“復”、“復”、“複”,對應簡體的一個“復”字。
  3. 繁體、簡體相同。如“故事”二字。
  在上述第二種情況時,需要使用不同的繁體字。如簡體字“發”,對應“發”、“髮”、“髪”三個 GBK 繁體字。在“發展”一義時,用“發展”,在“頭發”一義時用“頭髮”,而“髪”是異體字,BIG5 繁體中沒有,一般也不用。再如“復”字,在“復雜”一義時用“複雜”,在“反復”一義時用“反復”。
  有些簡體字,雖然對應兩個繁體字,但有時可以通用。如簡體的“匯”,對應繁體的“匯”、“彙”和“彚”,在“詞匯”的意義上,繁體可以用“詞匯”,也可以用“詞彙”。
  類似一個對應多個的簡體字,有300多個。
  此外,有些字簡體、繁體差異很小,如“故宮”的“宮”,繁體字為“宮”,兩個口之間還有一撇。在使用 Windows 95 自帶的 GBK 漢字輸入法時,需要特別注意。

  好的搜索引擎,應該有這樣一個對應字表,自動幫助用戶轉換。但目前的搜索引擎,多數未達到如此完善的地步。本站以后會陸續提供一些相關的參考資料。



   發表觀點>>  


Copyright ©  2001-2002 SOWANG.COM All rights reserved. 
中文搜索引擎指南網  版權所有