KUCut – โปรแกรมตัดคำ ที่เขียนด้วย Python

หลายคนแม้แต่ในหน่วยวิจัยเดียวกันมักจะถามผมว่าใช้โปรแกรมตัดคำตัวไหนอยู่. โปรแกรมตัดคำตัวที่ผมใช้เป็นหลักชื่อว่า KUCut จาก NAiST @KUมี license แบบ GPL และ download ได้จาก http://naist.cpe.ku.ac.th/pkg/kucut-1.2.2_python25_fix.zip. โปรแกรมตัดคำตัวนี้เขียนด้วยภาษา Python. หลักการที่แปลกจากตัวอื่นคือใช้เทคนิค unsupervised machine learning ด้วย อ่านเพิ่มได้จาก “การตัดคําภาษาไทยดวยเทคนิคการเรียนรูแบบไมใชตัวอยาง”.

ส่วน Python sdk และ runtime (ภาษาเรียกแบบ Java :-P) สามารถ download ได้จาก http://www.python.org/download/

5 thoughts on “KUCut – โปรแกรมตัดคำ ที่เขียนด้วย Python

  1. วิธีการใช้งาน อยู่ตรงไหนครับ เริ่มที่ไฟล์อะไรครับ หาไม่เจอครับ
    แบบคอมไพล์ แล้วใช้งานได้เลย ต้องทำอย่างไรครับ โดยไม่ต้องเข้า Python

  2. ถ้าตัดคำได้แล้ว ต้องการวิเคราะห์อักขระ สถิติทำที่ใช้บ่อย อักษรตัวใดที่มักใช้ใกล้ กัน
    พอจะแนะนำโปรแกรม หรือเครื่องมือในปัจจุบันได้ใหมคะ หรือต้องเขียนโปรแกรมเองคะ

ใส่ความเห็น

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / เปลี่ยนแปลง )

Twitter picture

You are commenting using your Twitter account. Log Out / เปลี่ยนแปลง )

Facebook photo

You are commenting using your Facebook account. Log Out / เปลี่ยนแปลง )

Google+ photo

You are commenting using your Google+ account. Log Out / เปลี่ยนแปลง )

Connecting to %s