內容 簡 介本書較全面地介紹了R應用于空間數據分析的原理和方法。在介紹R中空間數據類、方法、空間對象、空間點類、空間線類、空間面類及空間網格的基礎上,首先介紹了空間數據的可視化、空間數據的導入導出、空間數據的處理及定制多點數據、六角形網格、時空網格及大型網格數據類的方法;然后介紹了空間點模式分析、插值與地統計分析、面數據和空間自相關分析和面數據建模;最后介紹了空間數據分析在疾病數據制圖及分析中的應用。本書適合作為“空間信息處理”和“空間信息可視化”課程的教材,通過大量的實例展示了空間分析方法的應用領域及其價值,較全面地展示了R在空間統計與分析中的成果與前景。本書配套網站包括了書中的所有實例、所涉及的包和數據集,對讀者學習和研究將有很大幫助。前言我們編寫本書是和用R語言處理與分析空間數據并行進行的。雖然本書已完成,但軟件開發仍然在繼續。在R社區,我們能夠與世界各地的用戶進行充分和愉快的交流,能夠在毫無壓力的情況下快速地解決我們遇到的問題,同時也能夠體會到軟件開發的快樂與沮喪。毫無疑問,如果沒有來自用戶的需求, R的發展將不會達到現在的規模,也不可能用R來分析空間數據。
然而,就狹義定義的實用性來說尚不足以描述R項目的發展。R項目不僅是一個與世界級數據分析軟件工具發展密切相關的社區項目,還對如何進行數據分析起到了引導作用。R是開源的,這不僅僅是因為開源軟件的發展(包括廣大用戶和開發者社區的動態發展)可以被認為是一種有吸引力和成功的發展模式,而最主要的原因是科學中的實例模擬數據需要進行反復分析。作為研究人員,我們都非常清楚由于用戶的錯誤或誤判而得到錯誤結論的可能性。當研究結果確實關系重大時,例如公共衛生的研究、天氣變化的研究以及涉及空間數據其他領域的研究,良好的研究實踐表明至少在原則上,其他人應該能夠核查研究結果。開源軟件意味著如果需要的話,其方法能夠接受審核并且工作會話日志能確保已經記錄了我們實際上所做的而不是想做的。貫穿本書,Sweave(http://www.statistik.lmu.de/~leisch/Sweave/)的使用提供了關鍵的支持(Leissh,2002;Leisch and Rossini,2003),它是一個允許R代碼嵌套的工具,用于在LaTex文檔中進行完整的數據分析。
對于那些繼續致力于R項目的核心成員,我們由衷感激。尤其是作為先驅的Brian Ripley教授對我們團隊非常重要,在2003年維也納召開的分布式統計計算會議中,他的支持使我們認識到在R語言中進行空間分析是一個值得推行的項目。感謝Kurt Hornik對Comprehensive R Archive Network順利運行所做的貢獻,當我們犯錯時,他的幽默意味著免費軟件正以一種友好的方式提供給R用戶。我們還感謝Martin M?chler在建立和維護R-Sig-Geo郵件列表時所提供的巨大幫助,沒有他的幫助,我們也許就沒有一種促進R空間社區發展的通道。
同時還對那些在郵件列表中參與討論的用戶心存感激,他們有時候會給出具體的建議,并且常常會提出許多富有建設性的問題,偶爾還會報告那些小bug或為修復bug做出自己的一份貢獻。其他用戶則直接與我們取得聯系并提出寶貴建議,從而幫助我們對部分研究實體有更深的理解并改進所涉及的軟件。值得一提的是,R空間數據分析課程的參與者和各種輔導班的參與者都非常勤奮和積極。
我們也很感謝那些通過初稿評論,提供更好的程序用來完善一些例子并為改進終稿做出貢獻的同事,特別要提到Juanjo Abellán,Nicky Best,Peter J. Diggle,Paul Hiemstra,Rebeca Ramis,Paulo J. Ribeiro Jr.,Barry Rowlingson和Jon O. Skien。我們還要感謝同意我們使用其數據集的同事,Luc Anselin于2002年在Santa Barbara提供了一個碩果累累的CSISS工作組討論,該支持在很長一段時間內對我們都很重要。特別是,首本R空間數據分析著作(Kopczewska, 2006)對簡化軟件和完善本書說明提供了有益的幫助。如果沒有John Kimmel的耐心鼓勵,我們不可能完成本書。
盡管我們受惠于那么多給我們提供幫助和建議的人們,但一定還存在著我們沒有掌握的東西,因此書中出現的錯誤和遺漏完全由作者負責。我們將感激指出本書錯誤的人,勘誤表可在本書網站(http://w.asdar-book.org)。目 錄第一部分 R的空間數據處理第1章 空間數據介紹 1
1.1 空間數據分析 1
1.2 為什么要用R 2
1.2.1 概述 2
1.2.2 為什么使用R進行
空間數據分析 3
1.3 R和GIS 5
1.3.1 什么是GIS 5
1.3.2 面向服務的架構 5
1.3.3 進一步了解GIS 5
1.4 空間數據的類型 6
1.5 存儲和顯示 10
1.6 空間數據分析應用 11
1.7 R空間資源 13
1.7.1 在線資源 13
1.7.2 本書的結構 14
第2章 R的空間數據類 17
2.1 概述 17
2.2 R中的類和方法 18
2.3 Spatial對象 22
2.4 SpatialPoints類 24
2.4.1 方法 25
2.4.2 空間點數據的數據框 27
2.5 SpatialLines類 31
2.6 SpatialPolygons類 35
2.6.1 SpatialPolygons
DataFrame對象 37
2.6.2 孔和環方向 39
2.7 SpatialGrid和SpatialPixel
?對象 40
第3章 空間數據可視化 47
3.1 傳統繪圖系統 47
3.1.1 繪制點、線、多邊形
和網格 47
3.1.2 坐標軸和布局元素 50
3.1.3 坐標軸標簽和參考
網格中的度 53
3.1.4 繪圖尺寸、繪圖區域、
地圖比例以及多圖
繪制 54
3.1.5 繪圖屬性和地圖圖例 56
3.2 使用spplot的Trellis/Lattice
?繪制 57
3.2.1 一個直觀的Trellis
示例 58
3.2.2 繪制點、線、面和
網格 59
3.2.3 對圖添加參考物和
布局元素 61
3.2.4 安排面板布局 63
3.3 繪圖交互 63
3.3.1 基本圖形的交互 63
3.3.2 spplot和lattice的
繪圖交互 65
3.4 彩色調色板和類區間 66
3.4.1 彩色調色板 66
3.4.2 類區間 66
第4章 空間數據導入/導出 70
4.1 坐標參考系 71
4.1.1 使用EPSG清單 72
4.1.2 PROJ.4 CRS規范 72
4.1.3 投影和坐標轉換 73
4.1.4 度、分和秒 75
4.2 矢量文件格式 76
4.2.1 使用rgdal包中的
OGR驅動程序 77
4.2.2 其他的導入/導出函數 81
4.3 柵格文件格式 81
4.3.1 使用rgdal包中的
GDAL驅動 81
4.3.2 編寫一個Google
Earth影像覆蓋 84
4.4 GRASS 86
百老街霍亂數據 91
4.5 其他的導入/導出接口 94
4.5.1 分析和可視化應用 94
4.5.2 TerraLib和aRT 954.5.3 其他GIS和Web
地圖系統 96
4.6 安裝rgdal包 97
第5章 空間數據處理高級方法 99
5.1 支撐 99
5.2 疊置 102
5.3 空間取樣 104
5.4 拓撲檢查 106
5.4.1 多邊形合并 108
5.4.2 孔狀態檢查 109
5.5 組合空間數據 110
5.5.1 組合位置數據 110
5.5.2 組合屬性數據 110
5.6 輔助函數 112
第6章 定制空間數據類和方法 117
6.1 使用類和方法編程 117
6.1.1 S3型類和方法 118
6.1.2 S4型類和方法 119
6.2 程序包trip中的動物足跡
?數據 120
6.2.1 通用函數和構造
函數 121
6.2.2 trip對象的方法 122
6.3 多點數據:空間多重點 123
6.4 六邊形網格 125
6.5 時-空網格 128
6.6 蒙特卡洛模擬的空間分析 132
6.7 大型網格的處理 134
第二部分 空間數據分析第7章 空間點模式分析 136
7.1 概述 136
7.2 空間點模式分析包 137
7.3 點模式的初步分析 140
7.3.1 完全空間隨機模式 140
7.3.2 G函數:最近鄰
事件距離 141
7.3.3 F函數:一個點到其
最鄰近事件的距離 143
7.4 空間點過程的統計分析 144
7.4.1 同質泊松過程 145
7.4.2 非同質泊松過程 145
7.4.3 強度的估計 145
7.4.4 非同質泊松過程的
似然 149
7.4.5 二階特性 151
7.4.6 非同質的K函數 152
7.5 在空間流行病中的一些
?應用 153
7.5.1 病例控制研究 153
7.5.2 二元回歸估計 158
7.5.3 使用廣義加模型的
二元回歸 159
7.5.4 點源污染 161
7.5.5 空間聚集的評估 163
7.5.6 混雜變量和協變量
的解釋 165
7.6 點模式分析更進一步的
?方法 168
第8章 插值與地統計 170
8.1 概述 170
8.2 探索性數據分析 171
8.3 非地統計學插值方法 172
8.3.1 反距離加權插值 172
8.3.2 線性回歸 173
8.4 空間相關性估計:變異
?函數 174
8.4.1 探索性變異函數
分析 175
8.4.2 截距、間隔寬度、
方向依賴性 178
8.4.3 變異函數模型 179
8.4.4 各向異性 183
8.4.5 多變量變異函數
模型 184
8.4.6 殘差變異函數模型 186
8.5 空間預測 187
8.5.1 泛克里金、普通克里
金和簡單克里金法 188
8.5.2 多變量預測:協同
克里金法 189
8.5.3 同位協同克里金法 190
8.5.4 協同克里金法對比 191
8.5.5 局部鄰域的克里
金法 191
8.5.6 塊克里金法 192
8.5.7 區域劃分 193
8.5.8 趨勢函數和它們的
系數 194
8.5.9 應變量的非線性
變換 195
8.5.10 奇異矩陣錯誤 197
8.6 模型診斷 198
8.6.1 交叉驗證殘差 199
8.6.2 交叉驗證的z-score 201
8.6.3 多變量交叉驗證 201
8.6.4 交叉驗證的局限性 202
8.7 地統計模擬 203
8.7.1 序貫模擬 203
8.7.2 非線性空間聚集和
塊均值 205
8.7.3 多變量和指示模擬 206
8.8 基于模型的地統計和貝葉
?斯方法 207
8.9 監測網絡優化 207
8.10 其他用于插值和地統計的
?R語言包 209
8.10.1 非地統計插值 209
8.10.2 spatial包 209
8.10.3 RandomFields包 209
8.10.4 geoR包和
geoRglm包 211
8.10.5 fields包 211
第9章 面數據和空間自相關 212
9.1 概述 212
9.2 空間鄰域 214
9.2.1 鄰居對象 215
9.2.2 創建近鄰域 217
9.2.3 創建基于圖的近鄰 219
9.2.4 基于距離的近鄰 220
9.2.5 高階近鄰 223
9.2.6 網格近鄰 224
9.3 空 間 權 重 225
9.3.1 空間權重模式 225
9.3.2 一般空間權重 227
9.3.3 空間近鄰與權重的
導入、導出和轉化 229
9.3.4 使用權重模擬空間自
相關 230
9.3.5 操作空間權重 231
9.4 空間自相關檢驗 232
9.4.1 全局檢驗 234
9.4.2 局部檢驗 240
第10章 面數據建模 246
10.1 概述 246
10.2 空間統計方法 246
10.2.1 同步自回歸(SAR)
模型 249
10.2.2 條件自回歸(CAR)
模型 253
10.2.3 擬合空間回歸模型 255
10.3 混合效應模型 257
10.4 空間計量經濟學方法 259
10.5 其他方法 265
10.5.1 GAM、GEE、
GLMM 265
10.5.2 Moran特征 269
10.5.3 地理加權回歸 272
第11章 疾病制圖 276
11.1 簡介 277
11.2 統計模型 278
11.2.1 Poisson-Gamma
模型 280
11.2.2 Log-Normal模型 282
11.2.3 Marshall全局EB
?估計器 283
11.3 空間結構統計模型 285
11.4 貝葉斯層次模型 286
11.4.1 再探Poisson-
Gamma模型 287
11.4.2 空間模型 291
11.5 疾病聚集探測 298
11.5.1 相對風險的同質性
檢驗 29911.5.2 空間自相關的
Moran’s I檢驗 301
11.5.3 一般聚集的Tango’s
檢驗 301
11.5.4 聚集位置探測 302
11.5.5 地理分析機 303
11.5.6 Kulldorfft統計 304
11.5.7 局部聚集的Stone
的測試 305
11.6 疾病制圖的其他主題 306
結語 307
參考文獻 311