chamkho – โปรแกรมตัดคำเขียนด้วย Rust ออกรุ่น 0.1.0 แล้ว

chamkho ก็คล้าย ๆ wordcutpy ล่ะครับ แต่เขียนด้วย Rust ใน version 0.1.0 ก็เปลี่ยนมาใช้ prefix tree บน hash map แทน sorted word list ผมลองเอาไฟล์ภาษาไทยประมาณ 20 MB มาลองตัดคำดู พบว่า version 0.0.13 ใช้เวลา 9.005 วินาที (เฉลี่ยมาจากการทดลอง 2 ครั้ง) พอแก้มาใช้ prefix tree ก็ใช้เวลาเหลือ 5.724 วินาที (เฉลี่ยจาก 2 ครั้งเหมือนกัน) สรุปว่าเร็วขึ้น 1.57 เท่า

ถ้าเทียบกับรุ่นที่ใช้ Python, Chamkho ก็ยังไวกว่าอยู่ประมาณ 11 เท่า

นอกจากเรื่อง data structure แล้วก็ยังมี option เพิ่มคือ  wordcut -s  เอาไว้ใส่ delimter ที่ต้องการได้ เช่นอยากจะเปลี่ยน delimiter จาก | เป็น whitespace ก็ใช้ wordcut -s ‘ ‘ ได้

ป.ล. chamkho ภาษาไทยคือ “ชำฆ้อ” ตั้งไว้เป็นที่ระลึกตำบลชำฆ้อ อำเภอเขาชะเมา จังหวัดระยอง

https://crates.io/crates/chamkho

Advertisements
This เรื่อง was posted in ไม่มีหมวดหมู่. Bookmark the permalink.

ใส่ความเห็น

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / เปลี่ยนแปลง )

Twitter picture

You are commenting using your Twitter account. Log Out / เปลี่ยนแปลง )

Facebook photo

You are commenting using your Facebook account. Log Out / เปลี่ยนแปลง )

Google+ photo

You are commenting using your Google+ account. Log Out / เปลี่ยนแปลง )

Connecting to %s