何謂原始資料 (raw data)

根據國際科學與技術資料委員會的定義:資料(Data)是經由一定程序所得到的事實(fact)內容。就本規範而言,原始資料是指依計畫建議書所述之研究方法與所須器械於野外進行調查、觀測或實驗後取得並紀錄,且未經任何統計分析、內容格式轉換、摘要處理等過程的初級資料。原始資料亦為驗證科研結果與衍生更多研究價值的基礎。

研究過程中依計畫建議書所述之研究方法進行觀測或實驗,所獲得或記錄的內容即為研究計畫之原始數據,一般皆會以試算表或文字檔方式加以整理與數位化。而本項作業因所蒐集的資料為生態分布與物種名錄,故主要參考的格式為達爾文核心集(Darwin Core),其規範資料如下:

類別 說明 詞彙
Record-level terms 關於採集或觀測資料的收藏紀錄 Modified, Language, institutionCode, collectionCode等
Occurrence 關於物種在自然、館藏、或資料集中的出現紀錄資訊 catalogNumber, recordedBy, individualCount, Preparations等
Event 關於某次採集或觀測行為的事件紀錄 eventDate, Habitat等
Location 地理與位置資訊 Country, County, locality, minimumElevationInMeters, minimumDepthInMeters, decimalLatitude, decimalLongitude, coordinateUncertaintyInMeters等
Identification 關於採集或觀測資料的鑑定資訊 identifiedBy, dateIdentified等
Taxon 關於採集或觀測資料的分類資訊 scientificName, kingdom, Phylum, Class, OrderFamily, genus, specificEpithet, infraspecificEpithet等

更多的說明請參考Darwin core 檔案