ค้นหา

Excellent Map

GIS, GPS, Maps, and GeoDataScience

ผู้เขียน

pkgis

Tencent invests in mapping company to serve driverless cars

มีโอกาสได้สนทนากับ ชาวจีนท่านหนึ่ง ที่ทำงานด้าน system development ให้กับ google เขาเล่าให้ฟังว่า อนาคต ข้อมูลแผนที่ น่าจะเป็นข้อมูลฐาน ที่เอกชน เข้ามาพัฒนาและกลายเป็นข้อมูลสำคัญ ในการทำธุรกิจ

เขาพูดถึงเทคโนโลยี ที่เขามาปฏิวัติวงการ รถยนต์อย่าง auto car หรือ เรียกว่า  driverless car รถไฟฟ้า ที่ขับเคลื่อนเองอัตโนมัติ ตอนนี้ได้เริ่มเปลี่ยนวงการรถยนต์โลกแล้ว ทั้งของ Tesla และอีกหลายเจ้าคู่แข่งเช่น Google , Apple รวมไปถึง บริษัทผลิตรถยนต์เดิม ก็เริ่มมาวิจัยพัฒนา ด้านนี้มากขึ้นเรื่อยๆ

ยังไม่นับรวม third party อย่าง Uber บริษัท Startup มูลค่าหลายพันล้านเหรียญที่เดิบโตและเข้ามามีบทบาทต่อวงการรถยนต์ ที่ตอนนี้เริ่มทดลองบริการ รถแท็กซี่แบบไร้คนขับ Uber car แล้วในสหรัฐ

โยงมาถึงเรื่องเกี่ยวกับ Map และ GIS บ้าง ซึ่งตอนนี้กลายเป็นว่า งานด้านข้อมูลถนน กลายเป็น ข้อมูลสำคัญในการขับเคลื่อน ธุรกิจและบริการ มูลค่าหมื่นล้าน นี่

อย่างข่าวล่าสุด Tencent บริษัทเทคโนโลยีจีน ก็เข้าซื้อบริษัท navigation systems & mapping services  ของเยอรมัน ที่มีระบบสำรวจและสร้างข้อมูลถนน ความถูกต้องสูงระดับ 10 เมตร เพื่อรองรับระบบนำร่องใน  driverless cars  โดยดีลนี้เป็นการร่วมมือกันกับอีกสองพาร์ทเนอร์ ได้แ่ก่ บริษัทผลิตแผนที่ในจีน ชื่อ NavInfo และกองทุน GIC (Singapore’s sovereign wealth fund) โดยดีลนี้ มูลค่า €241m

mtk0odu0mq

น่าจะเป็นอีกก้าว ที่  Tencent กำลังเพิ่มศักยภาพของระบบบริการข้อมูลแผนที่ เพื่อมาแข่งขันกับ คู่แข่งเจ้าอื่นๆโดยเฉพาะตลาดในจีน เช่น Baidu และ Alibaba’s maps ปัจจุบันให้บริการข้อมูลแผนที่ มีคนใช้งาน 200 ล้านรายต่อเดือน ถ้ารวมจาก application ด้าน location base service จาก social media ด้วยก็มากถึง 850 ล้านรายต่อเดือนเลยที เดียว

volvo-stepping-up-to-rival-google-in-autonomous-car-technology

ระบบบริการข้อมูลแผนที่และถนน ของจีน ปัจจุบัน ซึ่งระบบบริการข้อมูลแผนที่และถนนของ Baidu รองรับ navigation systems ใน autonomous car ที่ออกจำหน่ายในปี 2018 -2019

https://www.ft.com/content/c090b4d2-cbeb-11e6-864f-20dcb35cede2 

Self driving car

นักวิจัยด้าน ITS ของ Seoul National University ประเทศเกาหลีใต้ ทำ self driving car สำเร็จแล้ว โดยสาธิตรถอัจฉริยะไร้คนขับ ในการรับส่งคนแบบ taxi ที่สามารถเรียกบริการผ่าน app บนมือถือ

ความน่าสนใจคือ นักวิจัยเกาหลีใต้ เลือกใช้ laser scanners(LIDAR) เก็บข้อมูลวัตถุ เรียลไทม์ แล้วประมวลผลสำหรับการขับเคลื่อน โดยทีมวิจัยเขาเคลมว่าการทดสอบ 6 เดือนรถสามารถวิ่งในถนนจริง ไม่เกิดอุบัติเหตุใดๆ เชื่อว่า อนาคตอีกไม่ถึง 30 ปีสถิติความปลอดภัยจากรถประเภทนี้จะมากกว่า มนุษย์ขับเอง

รถอัจริยะของ Seoul National University ต่างจาก auto car ของ Tesla ที่ Elon musk ไม่เอาเทคโนโลยี LIDAR แต่เลือกใช้ image processing อย่างเดียว เหตุผลด้านวิศวกรรม รวมถึงต้นทุนและการประมวลผลข้อมูล

f-soko-auto-car-a-20160106-870x578


นอกจากนี้จะเห็นว่า self-driving technology กลายเป็นกระแสหลักที่หลายบริษัทกำลังเข้ามาพัฒนา เช่น Hyundai Motor Co. และ Samsung Electronics ที่ประกาศตัวออกมาแล้ว หรือบริษัทอย่าง General Motors Co ที่ลงทุนใน Lyft Inc(บริษัทคล้าย uber) ก็กำลังพัฒนาเทคโนโลยีด้านนี้ อยู่เหมือนกัน

http://www.japantimes.co.jp/news/2016/01/05/asia-pacific/driverless-taxi-south-korean-entry-race-develop-hands-free-auto

opentopography & mongo DB

มีโอกาสเข้าไปเล่นที่ opentopography.org ไปลองโหลดฐานข้อมูล lidar และ dem ของพื้นที่สำรวจในสหรัฐมาดู เป้าหมายอยากทดลองการทำงานกับ machine learning ด้วย

mongodb

อีกประการที่ลองแล้ว วันนี้คือการแปลง point could เข้าไปใน NoSQL Database อย่าง mongo DB  ลองไป แสน Document ยังพอได้อยู่ ไอเดียของ Mongo DB กับข้อมูล GIS ไม่ใช่เรื่องใหม่อะไร เพราะถ้าเคยใช้ Geojson หรือ WKT มาน่าจะพอเข้าใจไอเดียของ open-source document database

12-23-2016-3-12-05-pm

แต่เชิงของการ implement แง่การพัฒนาระบบ Mongo DB ดูได้เปรียบกว่า WKT มาก โดยเฉพาะการ Query ข้อมูล อีกอันที่ชอบคือการเก็บข้อมูล Geometries object ประเภท Multiple features

และที่ผมกำลัง develop ตอนนี้พวกเป็น multi temporal spatial data เช่นพวก ข้อมูลหลายช่วงเวลา หรือพวกเป็น moving object พวก document database จะได้เปรียบแง่โครงสร้าง และการพัฒนาระบบการ Query ที่ซับซ้อนกว่า relational database แบบเดิมๆ

 

 

Use machine learning to map poverty

งานวิจัยนี้ เป็นอีกตัวอย่างของ Geoinformatic สมัยใหม่ ที่ใช้เรื่อง data science และ machine learning มาใช้ ได้เป็นอย่างดี

ทีมวิจัยของ Stanford ได้แก่  Neal Jean, Marshall Burke, Michael Xie,W. Matthew Davis,David B. Lobell, Stefano Ermon ได้พัฒนาระบบ พยากรณ์และสร้างแผนที่ติดตามความยากจน (poverty map) ขึ้นมา

โดยโจทย์ ต้องการติดตาม การพัฒนาเศรษฐกิจ ความเป็นอยู่ของสังคม ชุมชนในประเทศด้อยพัฒนา เพื่อให้ได้ information สำหรับใช้ติดตามการแก้ปัญหาความยากจน การสนับสนุน หลักการก็คือ ทีมวิจัย ใช้ ข้อมูลจาก ภาพถ่ายดาวเทียม เพื่อประมวลผล หาพื้นที่โซน ชุมชนยากจน โดยเทียบภาพถ่ายดาวเทียม high-resolution daytime กับ nightlight image ภาพกลางวัน รายละเอียดสูง

12-16-2016-7-06-38-pm

ทำให้จำแนกเขต ชุมชน เมือง ได้ จากอาคาร ถนน และรูปทรงของพื้นที่การทำเกษตร จากนั้น ติดตาม กิจกรรมกลางคืน จากแสงสว่างด้วยภาพถ่ายดาวเทียม เพื่อเปรียบเทียบ พื้นที่ยากจน หรือขาดแคน ส่วนมากจะ ไม่มีไฟฟ้า และชุมชน จะไม่มีกิจกรรม ในตอนกลางคืน เหมือนเมืองที่เจริญ

transferlearning2-795x634
ทีมวิจัย ใช้ข้อมูลเศรษฐกิจ และการสำรวจอื่นๆ เช่น ฐานข้อมูล The Living Standards Measurement Study – Integrated Surveys on Agriculture (LSMS-ISA) ของ world bank เป็น feature ร่วม ในการ training ตัว  machine learning ด้วยเทคนิคการจำแนกแบบ convolutional neural network เพื่อให้มันสามารถจำแนกโซน พื้นที่ขาดแคลน เพื่อทำแผนที่ชุมชนที่ยากจน ออกมาอัตโนมัติ รวมถึงพยากรณ์ตัวเลขกิจกรรมทางเศรษฐกิจ จากข้อมูลภาพถ่ายดาวเทียม และข้อมูลประกอบอีกด้วย

ลองเข้าไปอ่าน paper ฉบับเต็มได้ จะเห็นแนวทางการพัฒนาระบบ GIS และ remote sensing ยุคใหม่ ที่ใช้ machine learning มาเพิ่มความสามารถในการ พัฒนาระบบ การวิเคราะห์ขั้นสูง(มากกว่าคนทั่วไปแปลความเองได้)

maxresdefault

link ตัวอย่าง Vdo อธิบายโครงการ
https://www.youtube.com/watch?v=DafZSeIGLNE

 

อ้างอิงบทความเต็ม

http://news.stanford.edu/2016/08/18/combining-satellite-data-machine-learning-to-map-poverty/

ดาวน์โหลด paper
http://science.sciencemag.org/content/353/6301/790

GeoData Science Lib(Python)

Python เป็นภาษาที่กลายเป็น tools สำคัญในงานด้าน Data Science ไปแล้วในปัจจุบัน ดูได้จากการเติบโตของ คอมมูนิตี้ และจำนวน user ที่ก้าวกระโดดในสองปีที่ผ่านมา

ผมเองใช้ Python ในงานด้าน Spatial analysis มาก่อนแล้ว พอมาทำด้าน Machine Learning พบว่ามันเป็นอะไรที่สะดวกมาขึ้น เพราะ Lib ใน Python มันมีเยอะ และเชื่อมเข้ากับงานด้าน spatial analysis ได้ทันทีเลย วันนี้ผมมาแนะนำ Lib สำคัญ ด้าน Spatial analysis สำหรับงาน geo data science ให้ผู้อ่านได้รู้จัก 4 ตัวที่ผมใช้งานประจำ

1. PySAL — Python Spatial Analysis Library

ตัวนี้เป็น Lib ที่ใช้เชิง Math ประมวลผลงานด้าน spatial analysis functionsได้ดีอีกตัว แถมทำงานกับ nunpy และ scipy ได้สะดวกมาก งาน app ด้าน Geostatistic เช่น Knn , IDW,Spatial Markov และอื่นๆ  ถ้าลองใช้ ตัวนี้แล้วรับรองไม่ผิดหวังครับ

https://pysal.readthedocs.io/en/v1.11.0/index.html

socal_2

2. Shapely

ถ้าต้อง process data ต้องปรับแก้ แปลงระบบพิกัด หรือประมวลผลตัว geometry object (Point, LineString, and LinearRing ) เลือก Shapely น่าจะเป็น tools ที่ดีในการทำงาน ความสามารถรองรับ format ของ geometry file หลากหลาย ประมวลผลข้อมูลขนาดจำนวนหลายหมื่นโหนด ได้เร็ว และมี algorithm ที่สุดติ่ง อยู่เบื้องหลัง lib ดังอย่าง GEOS ที่ทำงานใน Postgis หรือ JTS

687474703a2f2f6661726d332e737461746963666c69636b722e636f6d2f323733382f343531313832373835395f623538323230343362375f6f5f642e706e67

https://github.com/Toblerity/Shapely

3.GeoPandas

สาย Python คงรู้จัก Pandas ดีอยู่แล้ว ตัวนี้็คือ data model ด้าน geometry ที่เพิ่มเข้าไปในการทำงานร่วมกับ pandas เพิ่มประสิทธิภาพการ read / write file ด้าน geospatial data

การจัดการไฟล์แบบ GeoSeries และ GeoDataFrame สนับสนุนการประมวลผลเชิงเลข การรวมข้อมูล การวิเคราะห์ข้อมูล , รองรับการทำงานด้าน Mapping การกำหนดระบบ coordinate system และอื่นๆ นอกจากนี้ สามารถสร้างแผนที่จาก geometry object ในรูปแบบ ภาพ ได้อีกด้วย

holes

http://geopandas.org/index.html

4.pyproj
ทำงานด้าน GIS หนีไม่พ้นต้อง จัดการกับระบบพิกัดโลก ในรูปแบบต่างๆ รวมถึงการกำหนดรายละเอียดอ้างอิง การแปลงพิกัดให้กับ ข้อมูลเชิงพื้นที่ของเรา ด้านนี้ ทำให้งานง่าย ด้วย PROJ4 ตัวนี้เป็น Lib ที่ครอบคลุมระบบพิกัดแบบสากล และมีฟังก์ชั่น การแปลงระบบพิกัด ใน Python ก็มี Lib ชื่อ pyproj ที่เป็น interface สำหรับเรียกใช้งาน class ของ PORJ4 ในการประมวลผลข้อมูล ด้าน  transformations และ geodetic computation

https://pypi.python.org/pypi/pyproj

Spatio-temporal pattern recognition

พอดีทำงานเรื่อง Spatio temporal analysis ไปค้นบทความแล้วไปเจอ vdo นี้น่าสนใจมาก เลยเอามาแชร์ เนื้อหาสาระของคลิปนี้ Dr. Rajiv Maheswaran เขานำเสนอแนวคิดการนำ Data Science มาใช้ในกีฬา Basketball โดยทำการสอนให้ machine วิเคราะห์ moving dot data ที่เกิดจำนวนมหาศาลซึ่งเกินความสามารถของคนที่จะประมวลผล จากนั้นทำการวิเคราะห์ spatio-temporal pattern recognition เพื่อ สกัดเอา value ที่ได้จากข้อมูล

12-1-2016-3-06-39-pm

 

ความน่าสนใจคลิปนี้ Dr. Rajiv Maheswaran สาธิตเทคนิค pick&roll กลยุทธ์การเล่นของ 4 players(2 offense และ 2 defense) ที่กลายเป็น key ในการทำคะแนนของ modern basketball โดยนักวิจัยเอา machine leaning มาวิเคราะห์ข้อมูล moving dot สอนให้มันจำแนกการเกิด pick&roll ความท้าทายคือการวิเคราะห์ความสัมพันธ์ของ feature ต่างๆเช่น velocity, player movement, player location, ball location, distance และอื่นๆ จนทำให้ machine สามารถบอกได้ว่า จะเกิด pick&roll เมื่อไหร่, ความน่าจะเป็นในการสำเร็จเท่าไหร่และอื่นๆ insight นี้ช่วยให้ โค้ชวางแผนการรับมือ รูปแบบการเล่น pick&roll และสอนให้ player พัฒนารูปแบบการเล่น ให้ดียิ่งขึ้นด้วย

 

12-1-2016-3-08-49-pm12-1-2016-3-09-55-pm

นอกจากนี้ยังรวมไปถึงการ training จาก moving dot data ให้ machine มันดูเกมส์ Basketball รู้เรื่อง เข้าใจ แทคติกการเล่นต่างๆแบบอาชีพและมองเห็นการเล่นในมุมที่ต่างจากคน โดยการ tracking ข้อมูลแบบเรียลไทม์ ทั้งตำแหน่งบอลและผู้เล่นในสนาม การวิเคราะห์ ขั้นสูงทำให้เกิด value ต่างๆเช่น การประเมิน probability ในการทำคะแนน(shot) การรีบาว์ด(rebound) รวมถึงการประเมินคุณภาพการยิงทำคะแนน ของผู้เล่น ในสถานการณ์ยาก/ง่าย (ตรงนี้น่าสนใจเพราะมันได้กลายเป็น key การ valuation ค่าตัวนักบาสเก็ตบอล)

machine leaning เข้ามามีบทบาทใน NBA มากและทางทีมวิจัยเขาเชื่อว่า อนาคตมันเข้าเปลี่ยน ปรับปรุงเกมส์การเล่นให้ดีขึ้นและกลายเป็นอาวุธสำคัญในการแข่งขันต่อไป

เข้าฟังได้จาก

12-1-2016-3-15-23-pm

Geospatial+Data science

ยุคนี้ถ้ากระแสเทคโนโลยี ที่กำลังมาแรง คงหนีไม่พ้น Data science คำนี้ในช่วง 2 – 3 ปีที่ผ่านมากลายเป็น top hit และมีการเผยแพร่ความรู้ และมีการเติบโตของกลุ่ม community ทั่วโลกมากขึ้น ยิ่งเราเห็นภาพในสหรัฐที่ภาครัฐบาล และภาคเอกชนออกมาสนับสนุนเรื่องของ Data science อย่างมาก อันหนึ่งที่เป็นตัวขับดันสำคัญคงหนีไม่พ้นเทคโนโลยีคอมพิวเตอร์ที่เกี่ยวข้อง และรวมถึงความต้องการ นักวิทยาศาสตร์ข้อมูล ในบริษัท IT ใหญ่ๆ เพื่่อเข้ามาวิเคราะห์ สังเคราะห์ สร้างมูลค่าจากข้อมูลมหาศาลที่มี

Data science อธิบายง่ายๆ ก็คือ เรื่องของวิทยาศาสตร์ ที่มาผนวกรวมกับ ข้อมูล(Data) เรื่องราวของศาสตร์ที่ผนวกรวมเทคโนโลยีแขนงต่างๆขึ้นมา เพื่อใช้ในการสร้างกระบวนการทดลอง(เชิงวิทยาศาสตร์)และพัฒนาระบบประมวลผล รวมถึง algorithm (เครื่องมือในการทดสอบสมมติฐาน) เพื่อใช้ในการสกัดเอา คุณค่า(value) ออกจากข้อมูลขนาดใหญ่(Big Data)

datasciencecircle

Data science เป็นเทอมที่รวมเอาศาสตร์และเทคโนโลยีแขนงต่างๆผูกโยงเข้าด้วยกัน เช่น Data Mining, Cloud computing , Machine Learning(ML) ,Statistic, Big Data

เราจะพบว่า งาน Data science จำเป็นต้องอาศัยผู้ร่วม พัฒนาที่มีความรู้หลายแขนง มาทำงานร่วมกัน โดยมี นักวิทยาศาสตร์ข้อมูล(Data Scientist) ผู้ที่มีพื้นฐานความรู้พื้นฐาน และเข้าใจในตัวข้อมูลอย่างดี เป็นผู้ประสานการทำงานระหว่างผู้เชี่ยวชาญด้านต่างๆ รวมถึงออกแบบการทดลอง สร้าง algorithm เพื่อ สกัดเอา Knowledge  ออกจากกลุ่มข้อมูล เพื่อทำให้เกิดมูลค่า เชิงธุรกิจหรือประโยชน์เชิงบวก จากข้อมูลเหล่านั้นมากที่สุด

Data_visualization_process_v1 (1)

Continue reading “Geospatial+Data science”

บลอกที่ WordPress.com .

Up ↑