Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Encode & decode tiếng Việt có dấu #2

Open
ithieund opened this issue Jan 6, 2023 · 0 comments
Open

Encode & decode tiếng Việt có dấu #2

ithieund opened this issue Jan 6, 2023 · 0 comments

Comments

@ithieund
Copy link

ithieund commented Jan 6, 2023

Dear anh @phuonglh ,
Em đang tìm hiểu cách sử dụng viBERT để làm thực nghiệm cho luận văn TN, em thấy trên cả git này lẫn huggingface đều không có sample code hướng dẫn encode & decode nên viết thử 1 đoạn encode & decode bằng AutoTokenizer và AutoModel, kết quả là nó chạy nhưng khi decode lại thì lại ra chuỗi tiếng Việt không dấu. Vậy không biết làm như nào để vẫn giữ được tiếng Việt có dấu vậy anh?
image

Anh hướng dẫn giúp em nhé. Cảm ơn anh rất nhiều :)

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

1 participant