ความก้าวหน้าของ search engine ระยะนี้

ส่วนมากแล้วคนที่ผมรู้จักก็มักจะใช้ Google เป็น search engine กัน. แต่ก็ไม่ใช่ว่าคนอื่นจะอยู่เฉยๆ ก็พยายามพัฒนาอะไรไปเรื่อยๆ เหมือนกัน โดยเฉพาะในวงการวิจัย ผมก็ได้ยินหัวข้อเรื่อง information extraction question answering system หรือแม้แต่ classification แบบที่เอาไว้ใช้กับ search engine อยู่บ่อยๆ.

information extraction นี้ก็ประมาณว่าดึงข้อมูลออกมาให้เป็นแบบมีโครงสร้าง อย่างเช่น ผมค้นหาคำว่า กรุงเทพฯ คำตอบก็น่าจะออกมาเป็นตารางเลยว่า กรุงเทพฯ ตั้งอยู่ที่ “พิกัด” ที่เท่าไหร่, อยู่ในประเทศอะไร, ก่อตั้งเมื่อปีไหน เป็นต้น ผมหวังจะเป็นคำอธิบายที่ไม่ถูกนะ ถ้าผิดก็ขออภัย. ส่วน question answering (q&a) ก็บอกตรงๆ อยู่แล้วคือระบบถามตอบ เราก็ถามไปตรงๆ เลย เช่น “Where is Bangkok?” ระบบๆ ก็จะตอบเลยว่า “Bangkok is a city near Chonburi.” ตัวอย่างนี้ผมมั่วขึ้นมาเองนะครับ ตอบแบบนี้อาจจะไม่ค่อยมีประโยชน์เท่าไหร่ แต่ก็อาจจะมีนะสำหรับบางคน. classification นี้ก็ตรงๆ เลยคือพยายามแบ่งแยกชนิดของเว็บที่หาพบว่าเป็นเว็บชนิดไหน.

ผมก็ติดตามข่าวสารทางเว็บอยู่เรื่อยๆ โดยเฉพาะ blognone เพราะว่าเป็นภาษาไทย ผมก็อ่านถนัดหน่อย ถึงแม้ว่านานๆ ทีจะอ่านความคิดเห็นเห็นที่โพสอยู่ด้านล่างข่าวก็ตาม. ก็เห็น search engine ใหม่ๆ ที่แต่ก่อนอาจจะเคยเห็นแต่ว่าเป็นงานวิจัยทดลองในกลุ่มแคบๆ ตอนนี้เริ่มออกมาสู่สาธารณะแล้ว

  1. Wolfram|alpha ที่วันนี้เริ่มใช้ได้จริงๆ แล้ว ผมมองว่า Wolfram|Alpha ดูจะคล้าย Information extraction มากที่สุดคือพยายามดึงเอาข้อมูลจากเว็บ (ไม่รู้ว่าเว็บไหนบ้าง) เอามาทำตารางสรุปเลย แถมแสดงเป็นตารางยังไม่พอก็มีกราฟด้วย เช่น ใส่ Bangkok ไประบบก็บอกเลยว่า กรุงเทพฯ มีประชากรกี่คน เวลาท้องถิ่นเป็นเวลาอะไร ฯลฯ
  2. Kumo จาก microsoft อันนี้ข่าวล่ามาแรง ผมก็ยังไม่เคยใช้ Kumo เหมือนกัน แต่ดูจาก screenshot เขาใส่คำค้นว่า “Bose Lifestyle 48 คำตอบก็ตอบมาแบบ search engine ธรรมดา แต่ว่ามี tab ขึ้นมาข้างๆ ให้เลือก ชนิดๆ ของเว็บที่ค้นเจอ ว่าจะดูเรื่องเกี่ยวกับ การซ่อมแซม ราคา ฯลฯ
  3. Wikia search ตัวนี้เป็นข้าวมานานพอควรแล้ว อาจจะเพราะความดังของคนก่อตั้งด้วย ที่ใช้แนวความคิดคล้าย Wikipedia คือทุกคนช่วยกันทำให้คำตอบออกมาดีขึ้นได้ กระบวนการข้างในโปร่งใส แต่มาวันนี้เองเข้าไปเว็บนี้แล้วถูกส่งไป Wikia answer แทน. Wikia answer นี้เห็นชัดๆ เลยว่าเป็นระบบ Question answering แทนที่จะดึงข้อมูลอะไรออกมาก็ไม่รู้ เราก็ใส่คำถามเข้าไปตรงๆ เลย เช่น “Where is Bangkok” หาไม่เจอ😛. เลยใส่ “Where is Rayong” แทน ก็เจอแต่ว่าไปหามาจาก Yahoo answer ไม่แน่ใจว่าหาคำตอบจากเว็บอื่นได้ด้วยหรือเปล่า. นอกจากนั้นก็ยังมีอะไรแบบ ช่วย e-mail มาตอนมีคนมาตอบด้วย หรือมีกด rephrase ได้ ประมาณว่าลองถามคำถามเดิมแต่เขียนแบบอื่น อาจจะเจอ.
    wikiaans (คลิกดูรูปใหญ่ได้นะครับ)

เท่าที่ดูจาก 3 เว็บข้างบน ผมเห็นว่าทุกเว็บพยายามจะประมวลผลข้อมูลที่ได้จากการค้นหาเพิ่มขึ้น เพื่อที่จะได้ข้อมูลที่ตรงใจมากขึ้น แต่ก็อาจจะเป็นไปได้ว่า ความพยายามจะประมวลผลให้มาก แหล่งข้อมูลก็อาจจะถูกจำกัดให้แคบลง เช่น ดึงข้อมูลจาก blog ก็อาจจะงงๆ หน่อย เพราะรูปแบบไม่ค่อยแน่นอน ดึงจาก วิกิพีเดีย หรือ เว็บอะไรที่มีรูปแบบแน่นอนก็อาจจะพอทำได้หน่อย เป็นต้น จริงๆ จะเป็นแบบที่ผมคิดหรือเปล่าผมก็ไม่แน่ใจ. แต่ถ้าเป็นแบบนั้น โครงการที่จะพยายามวิเคราะห์ข้อมูลจากเว็บที่รูปแบบไม่แน่นอนก็ดูจะสำคัญมากๆ หรือไม่อีกทางหนึ่งคือคนเขียนเว็บเองก็อาจจะทำให้เว็บมีรูปแบบแน่นอนสักหน่อย. แต่แน่นอนก็คงมีโครงการทั้งสองแบบไปพร้อมกัน. เท่าที่ผมรู้การทำเว็บให้มีรูปแบบแน่นอน เหมาะกับการค้นหา คือ Semantic web (อาจจะมีอื่นๆ อีก แต่ผมรู้แค่นี้). ถ้ามาทาง Semantic web จริง ก็อาจจะเป็น Yahoo ที่จะรุ่งโรจน์ เพราะดูเหมือนมีโครงการนำหน้าคนอื่นไปแล้วอย่าง SearchMonkey.

ป.ล. ผมก็ไม่ได้รู้เรื่องพวกนี้มากมายเท่าไหร่ เขียนไปก็คงมั่วๆ ซะมากอะนะ ผิดพลาดก็ขออภัย

One thought on “ความก้าวหน้าของ search engine ระยะนี้

ใส่ความเห็น

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / เปลี่ยนแปลง )

Twitter picture

You are commenting using your Twitter account. Log Out / เปลี่ยนแปลง )

Facebook photo

You are commenting using your Facebook account. Log Out / เปลี่ยนแปลง )

Google+ photo

You are commenting using your Google+ account. Log Out / เปลี่ยนแปลง )

Connecting to %s