ยุคนี้ถ้ากระแสเทคโนโลยี ที่กำลังมาแรง คงหนีไม่พ้น Data science คำนี้ในช่วง 2 – 3 ปีที่ผ่านมากลายเป็น top hit และมีการเผยแพร่ความรู้ และมีการเติบโตของกลุ่ม community ทั่วโลกมากขึ้น ยิ่งเราเห็นภาพในสหรัฐที่ภาครัฐบาล และภาคเอกชนออกมาสนับสนุนเรื่องของ Data science อย่างมาก อันหนึ่งที่เป็นตัวขับดันสำคัญคงหนีไม่พ้นเทคโนโลยีคอมพิวเตอร์ที่เกี่ยวข้อง และรวมถึงความต้องการ นักวิทยาศาสตร์ข้อมูล ในบริษัท IT ใหญ่ๆ เพื่่อเข้ามาวิเคราะห์ สังเคราะห์ สร้างมูลค่าจากข้อมูลมหาศาลที่มี

Data science อธิบายง่ายๆ ก็คือ เรื่องของวิทยาศาสตร์ ที่มาผนวกรวมกับ ข้อมูล(Data) เรื่องราวของศาสตร์ที่ผนวกรวมเทคโนโลยีแขนงต่างๆขึ้นมา เพื่อใช้ในการสร้างกระบวนการทดลอง(เชิงวิทยาศาสตร์)และพัฒนาระบบประมวลผล รวมถึง algorithm (เครื่องมือในการทดสอบสมมติฐาน) เพื่อใช้ในการสกัดเอา คุณค่า(value) ออกจากข้อมูลขนาดใหญ่(Big Data)

datasciencecircle

Data science เป็นเทอมที่รวมเอาศาสตร์และเทคโนโลยีแขนงต่างๆผูกโยงเข้าด้วยกัน เช่น Data Mining, Cloud computing , Machine Learning(ML) ,Statistic, Big Data

เราจะพบว่า งาน Data science จำเป็นต้องอาศัยผู้ร่วม พัฒนาที่มีความรู้หลายแขนง มาทำงานร่วมกัน โดยมี นักวิทยาศาสตร์ข้อมูล(Data Scientist) ผู้ที่มีพื้นฐานความรู้พื้นฐาน และเข้าใจในตัวข้อมูลอย่างดี เป็นผู้ประสานการทำงานระหว่างผู้เชี่ยวชาญด้านต่างๆ รวมถึงออกแบบการทดลอง สร้าง algorithm เพื่อ สกัดเอา Knowledge  ออกจากกลุ่มข้อมูล เพื่อทำให้เกิดมูลค่า เชิงธุรกิจหรือประโยชน์เชิงบวก จากข้อมูลเหล่านั้นมากที่สุด

Data_visualization_process_v1 (1)

จากการผมมีโอกาสได้ ศึกษาเรื่อง Data science จากครอสฟรีบนอินเตอร์เน็ต เช่น coursera ทำให้ผมมองว่า งานด้าน Geospatial เป็นอีกประเภทกลุ่มข้อมูลขนาดใหญ่ที่ เราสามารถนำเข้าไปประยุกต์กับ Data science ผมมีโอกาสได้ฟังการบรรยาย Geospatial analysis ด้วย R ของ Domino Data Lab ยิ่งทำให้ เห็นอะไรเยอะขึ้น เช่นเดียวกับพอมาพบงานของ IBM และ DigitalGlobe ที่วิจัยพัฒนาทั้งเครื่องมือและ algorithm ด้านนี้ ยิ่งทำให้เห็นภาพของการนำ ข้อมูล Geo spatial ไปใช้งานทางธุรกิจ หรืองานที่ซับซ้อนมากขึ้น

2-26-2016 12-04-54 PM

เราไม่ได้กำลังพูดถึง shape file ไม่กี่หมื่นเรคคอร์ค ไม่ได้พูดถึงภาพถ่ายดาวเทียม ไม่กี่ซีน แต่งานด้านนี้เป็นงานที่โยงไปถึงข้อมูลขนาดใหญ่ ฐานข้อมูลจำนวนมากหลัก ล้าน เรคคอร์ด ที่มีทั้งการเก็บข้อมูลเชิงพื้นที่ + ข้อมูลแบบหลายช่วงเวลา หรือประเภท moving object data ข้อมูลที่มีทั้งความซับซ้อนเชิง geometry และความซับซ้อนเชิงเวลา

ในต่างประเทศมีการใช้ Spatial database และ Raster database (ไม่ได้เก็บภาพเป็นไบนารี แต่เป็นการเก็บเป็น GRID ที่อ้างอิงแบบหลายช่วงเวลา่และแยกหลายช่อง pixel value) เชื่อมโยงการบริหารจัดการข้อมูลที่ได้จาก  หลายๆแขนงเช่น geo-sensor network, LIDAR, UAV, RS ,indoor mapping, LBS, Geocoding เป็นต้น

GSAR620x394

ตัวอย่างงานวิจัยของ IBM

ข้อมูลถูกสร้างทำเป็นกลุ่มข้อมูลขนาดใหญ่ Big Data สร้าง algorithm ในการค้นหา สอบถาม วิเคราะห์โจทย์เชิงตำแหน่งและการประมวลผลเชิงพื้นที่ เพื่อ จำแนก สกัดจัดกลุ่ม(ETL) เอา Knowledge ออกมาเพื่อ ตอบสนอง การแก้ปัญหา หรือโจทย์ด้านต่างๆ เช่นทางธุรกิจ งานการตลาด  งานสุขภาพ งานการวางแผนต่างๆ

blog_geolayout6

เขียนหัวข้อนีั้ เพราะอยากให้ มีการทดลองหรือนำศาสตร์ด้านนี้เข้ามา ร่วมในงาน Geospatial information มากๆ อาจจะไม่จำเป็นต้องเป็นผู้เชี่ยวชาญทั้งหมด เพียงแต่เข้าใจภาพรวมและเพิ่มความเชี่ยวชาญด้านการเป็น นักวิทยาศาตร์ข้อมูลให้มากๆ ฝึกตั้งคำถาม ทำโจทย์ที่เป็น real world application หรือโจทย์เชิงธุรกิจ สร้างสมมติฐานเชิงพื้นที่ สร้าง algorithm ในการทดสอบโมเดล และสกัดเอาองค์ความรู้ออกมาจาก รูปแบบหรือความสัมพันธ์ของข้อมูลที่นำมาสร้างโมเดลให้ได้

2-26-2016 12-36-12 PM

เพราะถ้าฝึก ให้ นัก GIS มีทักษะมากไปกว่าการสร้างแผนที่ หรือทำข้อมูลอย่างเดียว อดีต Data ถูกทำให้เป็น information ก็จบ แต่ยุค Data science เราต้องเรียนรู้ไปถึง Data >> information >> Knowledge(แปลงให้เป็นองค์ความรู้) >> Value(เลยไปถึงการขายมูลค่าซ่อนที่อยู่ในข้อมูลนั้นๆ)

ถ้าเพิ่มศักยภาพในการสามารถสร้าง algorithm ในการตอบคำถามเชิงพื้นที่ขั้นสูง ไปอีก โอกาส ที่นัก GIS จะมีงานเพิ่ม หรือถูกเข้าไปรวมในทีมของ Data science ที่กำลัง เป็นที่ต้องการของบริษัท ธุรกิจเอกชนหลายแห่ง มันก็จะมีมากขึ้น ต่อไปครับ ลองดูตัวอย่างเช่น Uber ก็ได้เบื้องหลัง Lab นี้ก็ใช้การวิเคราะห์ข้อมูล geospatial เยอะโดยเฉพาะจากพฤติกรรมการเดินทางของลูกค้า หรือระบบบริการ/ค้นหาที่พักของ AIRBNB เป็นต้น

ตรงนี้น้องๆก็จะมีงานดีๆ มีโอกาสเปิดทางเลือก ของการทำงานเพิ่มมากขึ้นไปอีก

 

เพิ่มเติม

https://en.wikipedia.org/wiki/Data_science

https://www.coursera.org/course/datasci

http://datascience.in.th/

https://th.airbnb.com/careers/departments/data-science-analytics

http://www-01.ibm.com/software/data/infosphere/data-scientist/

http://geospatial.blogs.com/geospatial/data-science/