XMLChid – This product is created with the use of ORCHID corpus jointly developed by NECTEC and NICT

Orchid เป็นคลังข้อความที่มีคำ ชนิดของคำ (ทางภาษาศาสตร์) และข้อมูลอื่นๆ อยู่ มีมาตั้งแต่ พ.ศ. 2540 ตอนนี้มีหน้าเว็บที่เข้าไปดาวโหลดได้แล้ว http://www.hlt.nectec.or.th/orchid/

ผมลองเปิดดูคิดว่าถ้าเป็น xml ก็น่าจะใช้ได้ง่ายดีเหมือนกัน ก็เลยลองแปลงเป็น xml ดู ทำมาได้ปี 2 แล้วมั้ง แต่ว่าพึ่งเอามาปล่อย เพราะว่า พึ่งเห็น license ของ orchid ที่ชัดเจน และจะเอาไปใช้ในการเรียนการสอนวิชา NLP

license ของ Orchid ซึ่งก็รวมถึง XMLChid มีว่าแบบนี้

     	

@1997 National Electronics and Computer Technology Center (NECTEC). All
rights reserved.

LICENSE AGREEMENT

License agreement (LA) is a legal agreement between you and NECTEC.Please read it carefully before redistribution, reproduction or downloading from ORCHID services. This license agreement consists of the above copyright notice, definitions, the acceptance of license agreement, terms of use, and disclaimer information. In addition, it provides warranty information, specific terms and conditions that depart from other "free" softwares or corpora and "open source" softwares or copora.

1. Definitions

(a) "NECTEC" refers to National Electronics and Computer Technology Center which is an organization under National Science and Technology Development Agency (NSTDA), Ministry of Science and Technology, Thailand.

(b) "NICT" refers to National Institute of Information and Communications Technology, Japan.

(b) "ORCHID" refers to a database or corpus jointly developed by NECTEC and NICT.

(c) "Services" refer to any supplies for accessing to a variety of resources, including tools, downloading, communication and collected information, and also any update, enhancement, new features, and/or the addition of any new Web property.

(d) "Terms of Use" or "TOU" refers to terms and conditions for utilizing ORCHID.

(e) "You" refers to any end users and/or government and private contributors who download program and data from ORCHID website in order to reproduce, redistribute and update content, material, or any products corresponding to ORCHID.

2. Acceptance of License Agreement
NECTEC reserves the right to update the license agreement at any time without prior notice.

3. Terms of Use

Redistribution and use of ORCHID, with or without modification, are permitted provided that all of the following conditions are met:

(a) Redistribution of ORCHID must retain the above copyright notice, Acceptance of License Agreement, TOU, and the disclaimer in section 4.

(b) Any product, created and redistributed by you, which is composed or uses of any part from ORCHID must include the following acknowledgement:

"This product is created with the use of ORCHID corpus jointly developed by NECTEC and NICT."

(c) Products derived from the adaptation of ORCHID must not be called "ORCHID", nor may "ORCHID" appear in their name, without prior written permission of NECTEC.

(d) You must not use "ORCHID" in a manner likely to cause any damage to NECTEC, NICT, or third person. NECTEC shall reserve our rights to demand any compensation, retaining fee, costs of action and execution, and expenses occurred out of such manner.

(e) Neither the name of the National Electronics and Computer Technology Center (NECTEC) / National Science and Technology Development Agency (NSTDA) / National Institute of Information and Communications Technology (NICT) nor the names of its contributors may be used to endorse or promote product derived from this software without specific prior written permission.

4. Disclaimer of Warranty

ORCHID, INFORMATION, CONTENT, MATERIAL, OR PRODUCT JOINLY PROVIDED OR RELEASED BY NECTEC AND NICT ARE THE COPYRIGHTED WORK OF NECTEC AND NICT. MOREOVER, ORCHID, INFORMATION, CONTENT, MATERIAL, OR PRODUCT JOINTLY PROVIDED OR RELEASED BY NECTEC, NICT AND CONTRIBUTORS ARE ALSO ON AN "AS IS" AND "AS AVAILABLE" BASIS. ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NECTEC, NICT OR CONTRIBUTORS BE LIABLE FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT LIABILITY, OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE OF THE SOFTWARE, INFORMATION CONTENT, MATERIAL, OR PRODUCT, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.

พอดีเขาห้ามใช้ชื่อเดิมก็เลยตั้งชื่อให้ใหม่ว่า XMLChid ซึ่งดาวโหลดได้ที่ http://naist.cpe.ku.ac.th/pkg/xmlchid-20091123.tar.gz

10 thoughts on “XMLChid – This product is created with the use of ORCHID corpus jointly developed by NECTEC and NICT

  1. ไม่ทราบว่า orchid corpus ต้อง run ด้วยอะไรคะ คือปรกติเคยใช้แต่ ANTCONC แต่พออยากลองวิเคราะห์ตัวหน้าที่ของคำในภาษาไทย และข้อมูลที่มีเป็น text file เลยงงค่ะว่าหากอยากใช้ ORCHID ต้องทำอย่างไรบ้าง จำเป็นต้องใช้คำสั่งหรือ Run ด้วย dos หรือเปล่าคะ หรือว่าเราต้องแปลง text file เป็น html ก่อนค่ะ ขอบคุณค่ะ

      1. ขอบคุณที่ให้ความรู้ค่ะ ตอนนี้ใช้ SWATH กับ THAI ORCHID ค่ะหลังจากลองพยายามตั้งนาน

      2. ใช่ค่ะ แต่ไม่เที่ยงตรง เพราะโมนาใช้กับภาษาไทย Chat ค่ะ ที่เน้นคือการหาหน้าที่ POS มากกว่าค่ะ

  2. ยังไงก็ขอบคุณนะคะ ได้ความรู้บางส่วนจาก web นี้แล้วก็การอ่านเรื่องภาษาศาสตร์คลังข้อมูล หากใช้แต่ ORCHID บางครั้งจะเกิด UNK เยอะมาก เนื่องจากว่าตัวสะกดมันมีความหลากหลายสูงมากค่ะ

      1. ไม่หรอกค่ะ เอาตรงก็คือโมนาสนใจเรื่องคนเราเวลาพูดจริงและโกหกในภาษาThai chat ต่างกันอย่างไร พอต้องใช้โปรแกรมจากคนที่เรียนแต่ภาษาเป็นโรคแขยงคอมพิวเตอร์ ตอนนี้ต้องเรียนรู้เยอะมากค่ะ แต่เพวกภาษาจะไม่เข้าใจ command หรือการใช้ระบบเฉพาะทางเยอะมากค่ะอย่างน้อยที่สุด ตอนที่พยายามหาข้อมูลเรื่อง ORCHID ก็ได้ข้อมูล จาก blog อีกส่วนหนึี่่ง ขอกราบขอบพระคุณค่ะที่เผยแพร่ความรู้ค่ะ

ใส่ความเห็น

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / เปลี่ยนแปลง )

Twitter picture

You are commenting using your Twitter account. Log Out / เปลี่ยนแปลง )

Facebook photo

You are commenting using your Facebook account. Log Out / เปลี่ยนแปลง )

Google+ photo

You are commenting using your Google+ account. Log Out / เปลี่ยนแปลง )

Connecting to %s