(二) 資料庫
1.分類資料庫:
分類資料庫為本系統所有生物種類的身分識別資料庫,內容包含有害生物種類、作物種類、天敵種類等,這些生物種類與其他資料庫的連結,例如地理分布,以及生物種類間的關連,例如有害生物為害作物的範圍等,均須依賴分類資料庫的正確標誌出該生物的唯一性,才能有效的發揮各資料庫間的關聯關係,因此分類資料庫可為本系統的核心關連資料庫。
分類資料庫的分類階層有界、門、綱、目(部)、科(群)、屬、種等分類階層,另外尚包含同物異名、種下階(含亞種、品系等)、作者及參考文獻關聯等欄位。目前資料庫中共有7界、28門、49綱、198目、617科、3154屬、6299個種小名,資料庫各界之簡要數據資料如表一。
界 |
門 |
綱的數量 |
目的數量 |
動物界 |
節肢動物門 |
2 |
14 |
脊索動物門 |
2 |
2 |
軟體動物門 |
1 |
2 |
線蟲門 |
2 |
4 |
細菌界 |
放線菌門 |
1 |
1 |
厚壁菌門 |
3 |
3 |
變形菌門 |
3 |
6 |
原藻界 |
卵菌門 |
3 |
6 |
真菌界 |
子囊菌門 |
5 |
28 |
擔子菌門 |
3 |
17 |
壺菌門 |
1 |
2 |
接合菌門 |
1 |
1 |
Mitosporic fungi |
2 |
3 |
植物界 |
蘚類植物門 |
2 |
2 |
毬果門 |
1 |
2 |
蘇鐵門 |
1 |
1 |
木賊門 |
1 |
1 |
銀杏門 |
1 |
1 |
石松門 |
1 |
3 |
木蘭植物門 |
2 |
78 |
蕨類植物門 |
1 |
7 |
原生生物界 |
Cercozoa |
1 |
1 |
病毒界 |
未確定階層名 |
未確定階層名 |
3 |
2.有害生物資料庫:
目前資料庫內有2687種有害生物,其中病害有1819種,蟲害共592種,蟎害84種,草害183種和其他有害生物(鳥類、鼠類、蝸牛等)9種,各主要類別與細項類別種類數量如表二。
表二、有害生物資料庫主要類別與細項類別單筆資料數簡表 |
有害生物類別 |
單筆資料數 |
細項 |
單筆資料數 |
病害 |
1815 |
線蟲類 |
33 |
細菌類 |
61 |
原藻類 |
89 |
真菌類 |
1528 |
原生生物類 |
2 |
病毒類 |
102 |
蟲害 |
592 |
鞘翅目 |
115 |
彈尾目 |
1 |
雙翅目 |
48 |
半翅目 |
231 |
膜翅目 |
12 |
等翅目 |
2 |
鱗翅目 |
132 |
蜻蜓目 |
1 |
直翅目 |
13 |
嚙蟲目 |
2 |
纓翅目 |
35 |
草害 |
183 |
百合綱 |
69 |
木蘭綱 |
114 |
蟎害 |
84 |
真蟎目 |
75 |
疥蟎目 |
9 |
其他有害生物 |
9 |
鳥類 |
2 |
鼠類 |
4 |
蝸牛類 |
3 |
有害生物資料庫所儲存的資料內容,包含了有害生物之基礎生物學資料、危害資料、檢疫資料及防治資料等,詳如下述:
- 基礎生物學資料—分類學、同物異名、無性世代、通用俗名、型態描述、生活史等。
- 危害資料—危害作物、危害描述、地理分佈等。
- 檢疫資料—經濟影響、檢疫風險、他國檢疫規定、傳播方式等。
- 防治資料—防治方法、植物抗性、天敵資料等。
3.作物及作物類別資料庫:
作物資料庫為有害生物資料的兩大重要關連資訊之一,主要的功用是聯結作物與有害生物,目前作物資料庫僅儲存作物的分類資訊、類別資訊、同物異名及參考文獻關聯等;將來亦擬發展成完整的作物基礎資料庫,增加作物的一般生物學、經濟利用性以及地理分佈等資料。
作物類別資料庫是連結作物學術分類與應用分類的介面性功能資料庫,一般使用者在搜尋有害生物資料時,最常使用的搜尋邏輯,是以作物在生活上的應用類別來搜尋,例如欲搜尋豆菜類的有害生物等。為達到上述功能,本計畫首先收集各方面對於經濟作物的一般性應用分類文獻,嘗試彙集成具實用性的分類。初步的分類是依作物的應用功能及特性區分為下列8大作物類別,並再區分成54種細項(表三)。這項工作的困難度極高,應用性分類本身就是一個具有極大歧異性的主觀性研究,又本計畫所牽涉的範圍太廣,更增加其困難度。因此,這部份的工作,常隨著作物種類資料的增加,呈現一種常態的變動特性,特別會發生在細項類別。但是,本計畫將持續的在目前已有的基礎,同時尋求更多學者的力量加以改進,以增加其可用性。
作物類別 |
細項 |
糧食作物 |
水田作物、旱田作物、其他糧食作物 |
特用作物 |
藥用作物(中草藥、西藥等)、保健食用中草藥、香料作物(香料、調味料等)、纖維作物、油料作物、糖料作物、飼料作物、綠肥作物、嗜好作物(飲品、消遣、乾果等)、能源作物、染料作物、橡膠作物、化妝品原料作物、其他特用作物 |
果樹 |
熱帶果樹、亞熱帶果樹、溫帶果樹 |
蔬菜瓜果 菇蕈類 |
根菜類、莖葉類、蔥類、豆菜類、葉菜類、花菜類、果瓜菜類、菇蕈類、其他蔬菜 |
花卉 |
切花植物、球根植物、盆栽草花植物、觀葉植物、蘭科植物、其他花卉 |
景觀園藝植物 |
花壇植物、庭園苗木、環境路樹、草皮、景觀園藝植物 |
林木植物 |
環境保護林、經濟林木、竹類、木材製品、野生林木 |
其它類別 |
野生草本、野生木本(喬木)、野生灌木(小喬木)、野生藤本(蔓生)、蕨類、水生植物、海濱植物、水濱植物、其他寄主 |
4.草害類別資料庫:
由於雜草的共生性危害特性有別於其他寄生性有害生物,為讓使用者在搜尋雜草類有害生物時,能更貼近實際應用時思考模式,特別規畫一個雜草的類別資料庫,並與作物資料庫相對應(如表四),提供使用者欲搜尋某一作物所有有害生物種類時能有更完整的資訊。
雜草危害範圍分類 |
寄主植物分類 |
次類別 |
主類別 |
水田區 |
水田作物 |
糧食作物 |
糧食作物田區 |
旱田作物 |
糧食作物 |
其他糧食作物 |
糧食作物 |
特用作物-蔗田區 |
甘蔗 |
特用作物-茶園 |
茶 |
果樹-常綠果樹林區 |
熱帶果樹 |
果樹 |
亞熱帶果樹 |
果樹 |
果樹-落葉果樹林區 |
溫帶果樹 |
果樹 |
蔬菜-葉菜類田區 |
葉菜類 |
蔬菜瓜果菇蕈類 |
蔬菜-瓜果類田區 |
果瓜菜類 |
蔬菜瓜果菇蕈類 |
蔬菜-豆類田區 |
豆菜類 |
蔬菜瓜果菇蕈類 |
蔬菜-根莖類田區 |
根菜類 |
蔬菜瓜果菇蕈類 |
莖葉類 |
蔬菜瓜果菇蕈類 |
蔬菜-花菜類田區 |
花菜類 |
蔬菜瓜果菇蕈類 |
花卉田區 |
切花植物 |
花卉 |
球根植物 |
花卉 |
盆栽草花植物 |
花卉 |
觀葉植物 |
花卉 |
蘭科植物 |
花卉 |
其他花卉 |
花卉 |
林地 |
環境保護林 |
林木植物 |
經濟林木 |
林木植物 |
竹類 |
林木植物 |
非耕地 |
尚未定案 |
水域 |
水生植物 |
其它類別 |
水濱植物 |
其它類別 |
草皮 |
草皮 |
景觀園藝植物 |
其他 |
環境路樹 |
景觀園藝植物 |
5.地理分布資料庫:
地理分布為有害生物資料的兩大重要關連資訊之一,也是政策參考的重要資料,目前地理資料庫分成「洲」、「洲分區」、「國家」、「行政區」(僅國土面積較大國家及我國有行政區資料)等4個階層。目前該資料庫的資料概況及國家數(如表五)。地理分布資料除有助於瞭解有害生物的分佈範圍,另以國家劃分該有害生物的基本檢疫特性,同時展現該有害生物在國際間的檢疫狀態(圖8)。未來亦擬發展成國家資料庫,將納入各國簡介、重要經濟作物、檢疫規定等資料。
洲 |
洲分區 |
國家數類 |
亞洲 |
東亞 |
6 |
西亞 |
14 |
南亞 |
7 |
北亞 |
1 |
中亞 |
10 |
東南亞 |
11 |
歐洲 |
東歐 |
5 |
西歐 |
1 |
南歐 |
16 |
北歐 |
6 |
中歐 |
7 |
北美洲 |
北美大陸 |
蔬菜瓜果菇蕈類 |
中美地峽 |
加勒比海群島 |
莖葉類 |
蔬菜瓜果菇蕈類 |
南美洲 |
東南美 |
2 |
西南美 |
5 |
南南美 |
3 |
北南美 |
4 |
非洲 |
東非 |
17 |
西非 |
9 |
南非 |
10 |
北非 |
16 |
中非 |
7 |
大洋洲 |
澳大利亞 |
1 |
密克羅尼西亞 |
7 |
美拉尼西亞 |
5 |
波里尼西亞 |
8 |
南極洲 |
南極洲大陸區 |
0 |
南極洲島嶼區 |
0 |
|
|
|
圖8、地理分布資訊及基本檢疫資料前端展示圖 |
6.文獻資料庫:
文獻為本資料庫的重要基礎資料庫之一,其重要性絕不亞於有害生物及分類資料庫。因為,本資料庫之內容均擷取自研究學者之著作,資料庫內容之正確性,以及是否需要再做更詳細的蒐尋修訂,均須不斷的由專家核對。而當專家核對資料的第一項工作,就是要知道該資料的原始來源,才能用更新的文獻資料修訂舊資料。所以,從文獻擷取資料所建置的資料庫(如本資料庫),不須不斷的以新的研究內容更新原有的資料,維護更新工作的頻度則視所擁有的資源多寡決定。嚴格來說,這類資料庫的內容,永遠不可能完全正確,而該資料庫之價值,則端視原始引用文獻是否正確而定,爰此可知,文獻資料庫的重要程度。目前本資料庫的文獻資料內容,為便利輸入及管理,僅粗分為「作者」、「發行年代」、「篇名」或「書名」、「出處」等4個欄位。
展望與結論
資訊保存以及交換最主要的目的,在於將這些資料或資訊轉化為最能為人所利用的知識(knowledge),利用這些知識我們可以解答全球性、長期性之問題,甚至作為決策之訂定。還未轉化為知識之資料(data)或資訊(information)為知識形成的基礎,若在保存或交流當中佚失而無法為專家、學者所利用,將是一大損失!將資料或資訊分為「保存」以及「交換」兩種層面;首先要能把所持有的資料有系統之整理,而資料庫(database)則提供了良好保存資料與資訊的最佳方法,而在有效管理之下的資料庫便可以提供資料搜尋的功能。資料庫簡單的定義是指一組資料有系統的整理便是一種資料庫的形式,更嚴謹的定義下則是強調這組資料必須是經過電腦格式化的檔案,所以組成資料庫的元件為:資料(datasets)、介面(interface)以及搜尋工具(searching tools),而資料庫最核心的功能便是要提供搜尋功能,讓使用者取得需要的資訊。發展多年的台灣農作物有害生物暨天敵資料庫已經初步建立了完善的資料庫要件,在資料單元、介面及搜尋工具上已漸臻成熟。
然而在長遠的資料庫發展之下,有一些基本元素及執行面上的考量必須逐步納入考量,以符合時代進步的潮流。首先是資料格式化的問題。資料庫在資料的檔案處理上必須進行格式化的動作,其中標籤欄位格式化(tagged field format)的動作是相當重要的一步,標籤欄位格式化主要是將資料分為元素(element field)以及資料值(data value)兩個欄位,利用不同元素項目描述某筆資料也就是資料值的部分。從原始資料到標籤格式化的資料形式其實是建立了所謂的後設資料(metadata);後設資料是指用來描述一組資料的內容、文字內容、架構、品質……等的資料形式,因此也可以說後設資料為一種資料中的資料。所以不同的資料類型便須訂定不同的元素項目才能精準的描述此類型資料,因此發展出針對不同類型的後設資料格式。有害生物資料庫雖為防檢疫服務之功能性導向而設,但畢竟其核心仍為一生物資料庫,對於與其他生物資料庫,特別如物種資料庫之間跨平台之資料交流與傳遞,其後設資料格式的互通性,勢必是將來不得不面對的問題。因此建立可長可久的有害生物資料庫之後設資料格式,將是當務之急。
除此之外,建立分散式公眾網域資料庫也是一個重要的發展方向。公眾網域資料庫最核心的概念就是大眾可以自由使用的資料庫,因此公眾網域資料庫的網路協定(protocol)明訂:1.投稿者的所有通訊以電子之形式,2. 投稿者必須負責所有的編輯工作,3. 提交的過程必須要能夠自動化。分散式公眾網域資料庫(distributed public domain database)的發展是建立在分散式資料庫(distributed database)的基礎之下,既然公眾網域資料庫提供大眾之參與,若將這種概念擴大便是分散式公眾網域資料庫的範疇,也就是建立一個分散於各地的公眾網域資料庫。所謂的分散式公眾網域資料庫包含了不同功能網站的參與,因此必須對於提交資料的屬性標準以及品質監控標準及程序作相關的訂定,另外對於通訊協定上亦要有所規定,像是提交資料以及校正、線上資料庫搜尋以及鏡射資料方面的協定。對於有害生物資料庫將來在增加資料提供者、資料提交流程、資料備份、資料品質控管及檔案傳輸效率上,及在整合其他國內外相關病蟲草害資訊資料庫上,分散式公眾網域資料庫的觀念都是非常值得學習與應用的方向。
參考文獻
- 石憲宗、柯乃文、吳文哲。2009。臺灣農作物有害生物資料庫查詢系統簡介。第14頁。2009國際農業資訊科技應用論壇。128頁。台北。
- 吳文哲、石憲宗。2006。台灣農作物有害生物資料庫查詢系統之功能及發展願景。動植物防疫檢疫季刊 8:20-23。
- 陳淑佩、王清玲。2007。害蟲生物防治策略知識平台 – 建立臺灣農作物害蟲天敵資料庫及查詢系統。台灣植物保護發展願景研討會專刊。台灣昆蟲特刊第九號:239-248。
- Green, D. G.. 1994. Databasing diversity – a distributed, public-domain approach. Taxon 43: 51-62.
- Shih, H. T., W. J. Wu, S. J. Fang, C. C. Chen, Y. C. Chou, and H. C. Chou. 2006. Introduction of Taiwan Agricultural Pest Database. pp. 4-1 – 4-8. In: Proceedings of International Workshop on Development of Database (APASD) for Biological Invasion. Organizers/ Sponsors: FFTC, NIAES, BAPHIQ, and TACTRI.
|