โปรแกรมตัดคำภาษาไทยอย่างง่าย สำหรับใช้กับ Python 3

#! -*- coding: UTF8 -*-
from wordcut import Wordcut
if __name__ == '__main__':
    with open('bigthai.txt') as dict_file:
        word_list = [w.rstrip() for w in dict_file.readlines()]
        word_list.sort()
        wordcut = Wordcut(word_list)
        print(wordcut.tokenize("กากา cat หมา"))

ใช้แบบข้างบนเลยครับ โปรแกรมโหลดได้จาก https://gitlab.com/veer66/wordcutpy บน github ก็มีครับชื่อเดียวกันถ้าทนใช้ gitlab ไม่ไหว

ตัวนี้พยายามจะให้มันง่ายนะครับไฟล์เดียวเสร็จเลย ยังไม่ได้ test เยอะ ถ้าเจอปัญหาอะไรแจ้งใน gitlab ได้เลยครับ ถ้ามี testcase ให้เลยจะดีมาก ถ้ามี testcase ด้วย pull request มาด้วยเลยก็จะดีมาก ๆ ครับ🙂

ป.ล. ใช้ได้กับ Python 3 ขึ้นไปเท่านั้นครับ เพราะว่าพี่ bact ใช้ Python 3😛

2 thoughts on “โปรแกรมตัดคำภาษาไทยอย่างง่าย สำหรับใช้กับ Python 3

ใส่ความเห็น

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / เปลี่ยนแปลง )

Twitter picture

You are commenting using your Twitter account. Log Out / เปลี่ยนแปลง )

Facebook photo

You are commenting using your Facebook account. Log Out / เปลี่ยนแปลง )

Google+ photo

You are commenting using your Google+ account. Log Out / เปลี่ยนแปลง )

Connecting to %s