ปฐมบท “GDAL/OGR “ สุดยอดไลบรารีสำหรับการพัฒนาโปรแกรม GIS

200px-GDALLogoColor.svg

  • ตอนก่อนๆผมเคยแนะนำ GDAL (Geospatial Data Abstraction Library) เป็น Library แบบ opensource ใช้จัดการอ่านและเขียนภาพ (Raster) ที่อ้างอิงกับระบบพิกัดภูมิศาสตร์ ไลบรารีพัฒนาด้วยภาษา glibc/glibc++
  • ส่วน OGR ก็เช่นเดียวกันเป็นส่วนหนึ่งของ GDAL แต่ใช้กับจัดการกับไฟล์ Vector
  • GDAL/OGR เดิมที่ก่อนหน้าเวอร์ชั่น 1.3.2 พัฒนาโดย Frank Warmerdam ภายหลังโอนย้ายภาระกิจไปยังสมาคม GDAL/OGR Project Management ซึ่งอยู่ภายใต้ Open Source Geospatial Foundation ซึ่งมั่นใจได้ว่าโครงการนี้จะดำเนินการพัฒนาต่อไปเรื่อยๆ
  • ในฐานะนักพัฒนาโปรแกรมอื่นๆเช่น Perl, Python, Ruby, C#, Java สะดวกมากสามารถนำไลบรารีนี้ไปใช้ได้เลย โค๊ดของ glibc++ สามารถแปลหรือ การทำ Wrapper ไปหาภาษาเหล่านี้ได้ด้วย SWIG (Simplified Wrapper and Interface Generator) แค่ดาวน์โหลด sourcecode ของ GDAL/OGR ไปก็ใช้งานได้เลย
  • ส่วน Visual Basic 6 (แต่ยังไม่มี VB.Net) ก็มีคนทำ Wrapper ไปใช้งานซึ่งไม่ได้ทำผ่าน SWIG เพราะ SWIG ไม่ได้รองรับ VB เช่นเดียวกันกับ Delphi หรือ Lazarus ถ้าดาวน์โหลด sourcecode ก็จะได้ wrapper สำหรับ VB6 ไปใช้ การดาวน์โหลดถ้าผ่าน subversion ก็สะดวกเพราะจะได้เวอร์ชั่นที่ update ไปใช้งานได้ตลอด และตัว sourcecode ตัวนี้สามารถคอมไพล์ด้วย MS C++ เพื่อให้ได้ไลบรารี *.dll ไปใช้งาน แต่สำหรับผมแล้วไม่ได้ใช้ MS C++ จึงสะดวกที่จะดาวน์โหลดไลบรารีที่ผ่านการคอมไพล์เป็น .dll แล้วจาก website ไปใช้งาน
  • ในเบื้องต้นผมใช้ตัว wrapper ของ VB6 เป็นแนวทางของการทำ wrapper ด้วย Lazarus ภายหลังเพิ่มฟังก์ชั่นของ GDAL เข้าไปมากกว่าของ VB6 หลักการทำ wrapper คือเขียน class ขึ้นมาห่อฟังก์ชั่นที่เรียกใช้งานไลบรารีของ GDAL ทำให้สะดวกในการเรียกใช้งานเมื่อนำไปใช้พัฒนาโปรแกรม
  • GDAL ออกเสียงเรียกเป็น “จี ดอล” หรือ “กู ดอล” เนื่องจาก OGR เป็นส่วนหนึ่งของ GDAL ดังนั้นเมื่อเรียก GDAL ให้หมายถึง GDAL/OGR

การสนับสนุนฟอร์แมต

  • ผมจะยังไม่พูดถึง OGR ในตอนนี้ขอกล่าวถึงเฉพาะ GDAL (Raster) ก่อน ซึ่ง GDAL เองสนับสนุนฟอร์แมตของ Raster file มากถึง 75 ฟอร์แม็ต ซึ่งครอบคลุมฟอร์แม็ตที่สำคัญไว้ครบถ้วน เช่น GeoTIFF, Erdas Imagine, SDTS, ECW, MrSID, JPEG2000, DTED, NITF
  • รายละเอียดเต็มๆดูได้ที่นี่ http://www.gdal.org/formats_list.html

Download & Install

  • ผมจะขอพูดถึง platform เฉพาะของวินโดส์ก่อน ส่วนใน Linux ผมพยายามใช้ library (libgdal1.6.0.so) ของ GDAL แต่ยังไม่สำเร็จตอนทำ linking เกิด error ยังหาสาเหตุไม่พบ จึงขอข้ามไปก่อน ผมจะดาวน์โหลดที่เป็นไบนารีไฟล์ของ GDAL ไปก่อน ซึ่งที่จะดาวน์โหลดต่อไปนี้ จะรวม utility หลายๆตัวซึ่งเป็น execute file ไปใช้งานได้ด้วย แต่เป็น command line นะครับ ซึ่งผมใช้บ้างแต่ไม่บ่อย
  • เริ่มกันเลยไปดาวน์โหลดได้ที่ http://download.osgeo.org/gdal/win32/1.6/gdalwin32exe160.zip แล้วทำการติดตั้ง โปรแกรมติดตั้งจะเลือกติดตั้งที่รากของ Drive C ที่โฟลเดอร์ c:\gdalwin32-1.6 ตอนนี้เป็นเวอร์ชั่น 1.6 ดูรูปด้านล่างจะเห็นในโฟลเดอร์ย่อนคือ bin จะมี execute file (*.exe) ซึ่งเป็น command line และที่เหลือเป็นไลบรารี Dynamic Link Library (*.dll) ที่ผมจะทำ wrapper ด้วย Lazarus เพื่อดึงไลบรารีมาใช้งาน แต่ที่เราเรียกใช้จริงๆคือ gdal16.dll ซึ่งในไฟล์นี้จะรวม OGR (vertor) มาเรียบร้อยแล้ว

gdalbinfolder

การตั้ง Path ให้ Library

  • ถ้าต้องการใช้ execute file ซึ่งเป็น command line ให้ใช้งานได้สะดวกจะต้องตั้ง library path ให้วินโดส์ได้รับรู้ก่อน ซึ่งเป็นวิธีค่อนข้างโบราณตั้งแต่ DOS ไม่เป็นไร ไม่ใช่เรื่องลำบากนัก ที่ My Computer ของวินโดส์ คลิกขวาเลือก Properties คลิกไปที่แท็บ Advance แล้วคลิกต่อที่ Environment Variables ดูรูปด้านล่างประกอบ setpath01
  • จากนั้นคลิกไปที่บรรทัด Path แล้วคลิกที่ปุ่ม Edit

setpath02

  • พิมพ์ path ของไลบรารีของ GDAL เข้าไปดังรูป (อย่าลืมปิดท้ายด้วยเครื่องหมาย 😉 เท่านี้ก็เรียบร้อย เวลาเราใช้ Lazarus ตอน compile & linking โปรแกรมที่เราพัฒนา Lazarus จะได้หาไฟล์ gdal16.dll มา link ได้ถูกต้อง

setpath03

Tools ที่ต้องการมาช่วยการ Export ไลบรารี

  • แต่ละฟังก์ชั่นที่เราจะดึงมาใช้เช่นดูโค๊ดของ c++ มี export name เป็นอย่างไร

[sourcecode language=”cpp”]
CPLErr GDALSetMetadataItem (GDALMajorObjectH hObject, const char *pszName,
const char *pszValue, const char *pszDomain)
[/sourcecode]

  • ใน website ของ GDAL ไม่ได้แสดงไว้ให้เราดู ต้องการ tools ซึ่งผมจะแนะนำต่อไป มาดูโค๊ดทีของ Lazarus ที่เรียกใช้ฟังก์ชั่นนี้ จะเห็นฟังก์ชั่นมี export name เป็น ‘_GDALSetMetadataItem@16’ ซึ่งถ้าชื่อตรงนี้ไม่ถูก Lazarus ไม่สามารถ link ได้

[sourcecode language=”delphi”]
function GDALSetMetadataItem (const Handle : TGDALMajorObjectH;
const Name : PCHAR;
                 const Value : PCHAR;
const Domain : PCHAR
) : longint; stdcall;
external External_Lib name ‘_GDALSetMetadataItem@16’;
[/sourcecode]

  • ดูโค๊ดด้านบนจะเห็น External_Lib เป็นตัวแปร string constant ผมให้เก็บ ‘gdal16.dll’ ถ้าฝั่ง Linux เปลี่ยนเป็น ‘libgdal1.6.0.so’  อะไรประมาณนี้

Download โปรแกรม Dllexp (Dll Export Viewer 1.36)

  • tool ตัวนี้มีขนาดเล็กมากๆ แค่ 44 KB เองแต่เก่งมาก สิ่งที่ต้องการมีครบหมด ไปดาวน์โหลดได้ที่ http://www.download3k.com/Install-DLL-Export-Viewer.html ได้ zip file มาก็ unzip ไปวางไว้ที่โฟลเดอร์ตรงไหนก็ได้แล้วทำ shortcut ก็เรียกใช้ได้เลย มาลองดู tool ตัวนี้ผมลองรันดังรูปด้านล่าง

dllexp01

  • จากรูปด้านบน เราคลิกไปที่ browse เพื่อเลือกไลบรารีดังรูป คลิกที่ OK เพื่อดูชื่อ export function

dllexp02

  • ที่ผมทำลูกศรชี้ไว้ด้านบนเป็น tools ที่เราใช้บ่อย ตัวซ้ายมือเป็น property ของฟังก์ชั่นที่เราเลือก ตัวขวามือเป็นเครื่องค้นหาชื่อฟังก์ชั่น ส่วนลูกศรด้านล่างเป็นฟังก์ชั่นที่ผมกล่าวไปแล้วคือ _GDALSetMetadataItem@16 ชื่อที่เราเห็นใน sourcecode คือ GDALSetMetadataItem ลองคลิก property ที่ toolbar ดู

dllexp03

  • ส่วน toolbar ค้นหาผมจะใช้ชื่อฟังก์ชั่นภาษาซี มาป้อนแล้วค้นหาเมื่อพบฟังก์ชั่นแล้วเราจะ copy ชื่อ function name นี้ไปวางที่ฟังก์ชั่น wrap ด้วย Lazarus หลัง external library name (‘gdal16.dll’)
  • ถ้าเราดูโค๊ดของ GDAL มีฟังก์ชั่นเป็นจำนวนมากไม่ได้ export แต่โปรแกรม Dllexp ช่วยเราได้ในตรงจุดนี้ ตัวอย่างเช่นฟังก์ชั่นสร้าง memory คือ CPLMalloc() ไปดูใน DllExp เห็น ไม่มีปัญหาใช้งานได้ แต่ฟังก์ชั่นตัวคืน momery คือ CPLFree() กลังไม่พบใน gdal16.dll ซึ่งแปลกมากให้สร้างแต่ไม่ export ฟังก์ชั่นคืน memory ให้ใช้

ปัญหาความแตกต่างของตัวแปรระหว่าง C/C++ และ Lazarus

  • ปัญหาการรับส่งตัวแปรในฟังก์ชั่นของ C++ จะเห็นว่าเต็มไปด้วย Pointer ซึ่งในภาษาซีการใช้ pointer เป็นเรื่องปกติ แต่ถ้าเป็น Lazarus จะยุ่งยากในการใช้ตัวแปรเพื่อให้ compatible กับ C++ แต่ผมดูแล้ว Lazarus คงเล็งเห็นปัญหาในจุดนี้เตรียม Type ของตัวแปรมาให้ค่อนข้างดี (ผมว่าดีกว่า Delphi ที่ผมใช้เมื่อก่อนเสียอีก) ดูตัวอย่างโค๊ดของภาษาซีด้านล่าง

[sourcecode language=”cpp”]
CPLErr GDALSetRasterCategoryNames(GDALRasterBandH hBand, char **papszNames)
[/sourcecode]

  • ตัว CPLErr เป็น Type ข้อมูลแบบ enumerate ใน Lazarus ผม declare ให้เทียบเท่าเป็น

[sourcecode language=”delphi”]
TCPLErr = (CE_None = 0, CE_Debug = 1,
CE_Warning = 2, CE_Failure = 3,
CE_Fatal = 4);
[/sourcecode]

  • ส่วนในโค๊ดภาษาซี ตัวถัดไปคือ GDALRasterBandH เป็น pointer (เก็บ handle ของ object) ใน Lazarus เรา declare ได้ง่ายๆเป็น

TGDALMajorObjectH = POINTER;

  • โค๊ดถัดไปของฟังก์ชั่นภาษาซีตัวต่อไป คือ char **papszNames (Pointer to pointer of char) จะเทียบเท่ากับ Lazarus อย่างไร ใน VB6 ใช้ variant แทนแต่ Lazarus ใช้ variant ไม่ได้ แต่โชคดี Lazarus เตรียมตัวแปรแบบนี้มาให้พร้อมคือ PPCHAR ผมหลงไปตั้งนาน เมื่อมารู้ว่า Lazarus เตรียมมาให้แล้ว งานก็ดูง่ายขึ้นเป็นอันมาก ฟังก์ชั่นใน Lazarus ก็ declare ได้ดังนี้

[sourcecode language=”delphi”]
function GDALSetRasterCategoryNames(hBand : TGDALRasterBandH;
papszNames : PPCHAR
) : TCPLErr; stdcall;
external External_Lib name ‘_GDALSetRasterCategoryNames@8’;
[/sourcecode]

Pointer to Array

  • ดูโค๊ดของภาษาซีตรง double *padfTransform ตัวแปร padfTransform จะเป็นตัวแปร pointer ชี้ไปที่ array ของตัวแปรแบบ double

[sourcecode language=”cpp”]
CPLErr GDALSetGeoTransform(GDALDatasetH hDS,double *padfTransform)
[/sourcecode]

  • ใน Lazarus เปลี่ยนชื่อตัวแปรให้สอดคล้อง และ pointer to array  แทนด้วย PDOUBLE ซึ่ง Lazarus ก็เตรียมมาให้เช่นเดียวกันคือ PDOUBLE ฟังก์ชั่นของ Lazarus จึงเขียนได้ดังนี้

[sourcecode language=”delphi”]
function GDALSetGeoTransform (const Handle : TGDALDatasetH;
Geotransform : PDOUBLE) : TCPLErr;
stdcall; external External_Lib name ‘_GDALSetGeoTransform@8’;
[/sourcecode]

Pointer to Function

  • ในฟังก์ชั่นไลบรารีของ GDAL จะมีตัวแปร pointer to function ด้วย ดูโค๊ดของภาษาซีด้านล่าง จะเห็นตัวแปร GDALProgressFunc pfnProgress

[sourcecode langulage=”cpp”]
CPLErr GDALBuildOverviews(GDALDatasetH hDataset,
const char *pszResampling,
int  nOverviews,
int *panOverviewList,
int  nListBands,
int *panBandList,
GDALProgressFunc pfnProgress,
void *  pProgressData)
[/sourcecode]

  • ใน Lazarus เรา declare  type และฟังก์ชั่นดังนี้

[sourcecode language=”delphi”]
TGDALProgressFunc = function(dfComplete : double; const pszMessage : PCHAR;
function GDALBuildOverviews(hDataset : TGDALDatasetH;
const pszResampling : PCHAR;
nOverviews : longint;
panOverviewList : PINTEGER;
nListBands : longint;
panBandList : PINTEGER;
pfnProgress : TGDALProgressFunc;
pProgressData : POINTER
) : TCPLErr; stdcall; external External_Lib name ‘_GDALBuildOverviews@32’;
[/sourcecode]

  • ส่วนตัวแปร void *pProgressData ใน Lazarus แทนด้วย pProgressData : POINTER

ตัวแปร 16 bit, 32 bit และ 64 bit

  • เนื่องจากฟอร์แม็ตไฟล์ข้อมูลจำพวก Raster จะหลากหลายมากบางฟอร์แม็ตข้อมูลแต่ละ pixel ใช้ Byte บ้าง ใช้ integer  16 bit แบบ signed และ unsigned บ้าง ดังนั้น type ตัวแปรที่จะอ่านเขียน pixel ต้องสอดคล้องกัน ดูโค๊ดของภาษาซี ที่ declare ชนิดข้อมูลของ pixel ใน web

[sourcecode language=”cpp”]
enum  GDALDataType {GDT_Unknown = 0, GDT_Byte = 1, GDT_UInt16 = 2,
GDT_Int16 = 3, GDT_UInt32 = 4, GDT_Int32 = 5,
GDT_Float32 = 6, GDT_Float64 = 7, GDT_CInt16 = 8,
GDT_CInt32 = 9, GDT_CFloat32 = 10, GDT_CFloat64 = 11,
GDT_TypeCount = 12
}
[/sourcecode]

  • ใน website อธิบายตัวแปรแบบ enumerate ชื่อ GDALDataType

enum GDALDataType

Pixel data types

Enumerator:

GDT_Unknown – Unknown or unspecified type

GDT_Byte – Eight bit unsigned integer

GDT_UInt16 – Sixteen bit unsigned integer

GDT_Int16 – Sixteen bit signed integer

GDT_UInt32 – Thirty two bit unsigned integer

GDT_Int32 – Thirty two bit signed integer

GDT_Float32 –  Thirty two bit floating point

GDT_Float64  – Sixty four bit floating point

GDT_CInt16  – Complex Int16

GDT_CInt32  – Complex Int32

GDT_CFloat32  – Complex Float32

GDT_CFloat64  – Complex Float64

  • ใน Lazarus เรา declare ดังนี้

[sourcecode langulage=”delphi”]
type
GInt32 = longint;
GUInt32 = longword;
GInt16 = shortInt;
GUInt16 = word;
GByte = byte;
GBool = boolean;
GFloat32 = single;
GFloat64 = double;
TGDALDataType = (GDT_Unknown = 0, GDT_Byte = 1, GDT_UInt16 = 2,
 GDT_Int16 = 3, GDT_UInt32 = 4, GDT_Int32 = 5,
GDT_Float32 = 6, GDT_Float64 = 7, GDT_CInt16 = 8,
 GDT_CInt32 = 9, GDT_CFloat32 = 10, GDT_CFloat64 = 11,
GDT_TypeCount = 12);
[/sourcecode]

โครงสร้างของ Model ของ GDAL

  • โครงสร้าง Class ของไลบรารี GDAL เป็นไปดังรูปด้านล่างผมพยายาม wrapper เป็น class ให้สอดคล้องกับ model ของ GDAL เช่นเดียวกัน ต่อไปผมจะอธิบายแต่ละ class พอเป็นสังเขป

  • จากรูป model ด้านบน จะมี classs “GDALMajorObject” ซึ่งลักษณะเป็น abstract class หรือ class ต้นแบบ ส่วนใน Lazarus ผม declare เป็น TGDALMajorObject (อยู่ในยูนิตไฟล์ gdalcore.pas)
  • class “GDALDataset” จะเกี่ยวข้องกับ Raster band ทั้งหมดรวมทั้งข้อมูลบางอย่างของ raster file เช่นขนาดของรูปเป็น pixel และจัดเก็บ Metadata พร้อมทั้งระบบพิกัดภูมิศาสตร์ รวมทั้งการแปลงค่าพิกัดจากระบบหนึ่งไปอีกระบบหนึ่ง ใน Lazarus ผม declare เป็น TGDALDataset (อยู่ในยูนิตไฟล์ gdaldataset.pas)
  • class “GDALDriverManager” เกี่ยวข้องกับฟอร์แม็ตข้อมูล ทาง GDAL จะเรียกเป็น driver สามารถหาจำนวนฟอร์แม็ตที่สนับสนุน ค้นหา รวมทั้งสามารถ register ฟอร์แม็ตข้อมูลก็ได้ ใน Lazarus ผม declare เป็น TGDALDriverManager อยู่ในยูนิต gdaldrivermanager.pas)
  • class “GDALDriver” เกี่ยวข้องกับ Dataset แต่จะเป็นลักษณะการสร้าง เปลี่ยนชื่อ การ copy และลบไฟล์ข้อมูล ใน Lazarus คือ TGDALDriver (อยู่ในยูนิตไฟล์ gdaldriver.pas)
  • class “GDALRasterBand” เกี่ยวข้องกับ raster band เพียงแค่หนึ่งแบนด์เท่านั้น เช่นในไฟล์หนึ่งๆอาจจะมี 3 แบนด์ (แดง เขียว น้ำเงิน) สามารถอ่านและเขียนในระดับ pixel หรือ อ่านและเขียนเป็น block ได้ สามารถอ่าน Color table ได้ผ่าน class “GDALColorTable” ใน Lazarus คือ TGDALRasterBand (อยู่ในยูนิตไฟล์ gdalrasterband.pas) และ TGDALColorTable (อยู่ในยูนิตไฟล์ gdalcolortable.pas) ตามลำดับ
  • และต่อไปเป็นคลาสที่ไม่ได้อยู่ใน model แต่ก็ถูกใช้เมื่ออ้างอิงถึงระบบพิกัด ได้แก่ class “OGRSpatialReference” และ class “ogrcoordinatetransformation” ให้บริการเรื่องระบบพิกัดทั้งเส้นโครงแผนที่และพื้นหลักฐาน(Projections&Datums) ใน Lazarus เป็น class “TOGRSpatialReference” (ogrspatialreference.pas) และ class “TOGRCoordinateTransformation” (ogrcoordinatetransformation.pas)
  • และที่เพิ่มเติมสำหรับโค๊ดของ Lazarus คือยูนิตไฟล์ gdal.pas เก็บ constant และ data type และอีกไฟล์คือ gdalcore.pas สำหรับเก็บ export function จาก GDAL library

TOGRSpatialReference และ TOGRCoordinateTransformation งานยังไม่จบ

  • สำหรับสอง class ข้างต้นมีฟังก์ชั่นมากเกี่ยวกับเส้นโครงแผนที่และพื้นหลักฐาน การแปลงพิกัด ผมยัง port เข้าหา Lazarus ยังไม่เสร็จต้องใช้เวลาอีกมากแต่ก็มีฟังก์ชั่นที่สำคัญเอาไปใช้งานก่อน ความจริงที่ผมเขียนโปรแกรมเกี่ยวกับด้านการแปลงพิกัดตอนก่อน เราสามารถใช้ GDAL มาทำแทนได้เลยเพียงแต่ต้องศึกษาก่อนว่าอะไรเป็นอะไร จะลดงานลงไปได้มาก (สองคลาสนี้ในเบื้องต้นผู้พัฒนา GDAL ได้ port โค๊ดมาจากโครงการ Proj4 ที่จริงผู้พัฒนา Proj4 ก็คือ Frank Warmerdam คนๆเดียวกันที่พัฒนา GDAL) ยุคนี้ไม่ใช่ยุคแต่ก่อนที่โปรแกรมเมอร์ต้องโค๊ดโปรแกรมด้วยตัวเองทั้งหมด ถ้าพัฒนาโปรแกรมด้าน GIS จะได้มีเวลาและพุ่งโฟกัสไปที่จุดมุ่งหมาย ไม่ต้องห่วงเรื่องการอ่านไฟล์ raster & vector เพราะ GDAL ทำให้แล้ว ไม่ต้องห่วงเรื่องระบบพิกัดเพราะ GDAL ทำให้แล้วเช่นเดียวกัน ถ้าสามารถหา component เก่งๆที่ช่วยเรื่องระบบกราฟฟิคได้ก็ดีมาก จะลดงานไปอีกได้มาก
  • โชคดียุคนี้เป็นยุคของ opensource เป็นโลกของการแบ่งปันและร่วมกันพัฒนา จึงมีอะไรดีๆอีกมากในโลกของอินเทอร์เน็ต ถ้าหาให้เจอแค่นั้นเอง ที่ผมเขียน blog ส่วนหนึ่งเพราะต้องการแบ่งปันประสบการณ์ และก็มีความสุขครับ
  • ตอนหน้าจะมาดูเรื่องโปรแกรมมิ่งด้วย Lazarus ในเบื้องต้น ส่วน sourcecode ของ GDAL library ผมหาที่ฝากได้แล้ว ผู้อ่านสามารถจะ download ไปลองรันดูได้

Leave a Reply

Your email address will not be published.