Skip to content
This repository has been archived by the owner on Feb 15, 2023. It is now read-only.

Commit

Permalink
GH-22: update report
Browse files Browse the repository at this point in the history
  • Loading branch information
rain1024 committed Jan 15, 2019
1 parent a984e4a commit 7a0fd58
Show file tree
Hide file tree
Showing 2 changed files with 3 additions and 1 deletion.
Binary file modified docs/technique_report.pdf
Binary file not shown.
4 changes: 3 additions & 1 deletion docs/technique_report.tex
Original file line number Diff line number Diff line change
Expand Up @@ -35,6 +35,8 @@ \section{Giới thiệu}

Tách từ là một bài toán quan trọng trong việc xử lý rất nhiều ngôn ngữ. Đối với tiếng Việt, nhiệm vụ này khá khó khăn do một từ tiếng Việt thường gồm nhiều tiếng ghép lại. Ví dụ như từ \textit{giáo viên} gồm hai tiếng \textit{giáo} và \textit{viên}.

Trong nghiên cứu này, chúng tôi xây dựng chương trình dựa trên giải thuật Conditional Random Fields trên bộ dữ liệu VLSP 2013.

\section{Các công trình liên quan}

Bài toán tách từ tiếng Việt đã được nghiên cứu từ khá lâu.
Expand Down Expand Up @@ -74,7 +76,7 @@ \section{Thực nghiệm}

\subsection{Data sets}

Dữ liệu VLSP 2013.
Dữ liệu huấn luyện gồm 75 nghìn câu được lấy từ dữ liệu huấn luyện của bài toán tách từ trong VLSP 2013. Dữ liệu kiểm thử gồm 2120 câu lấy từ bộ dữ liệu gán nhãn từ loại trong VLSP 2013.

\subsection{Evaluation Measures}

Expand Down

0 comments on commit 7a0fd58

Please sign in to comment.