Giới thiệu về TopDup

TopDup là dự án cộng đồng được khởi xướng bởi Forum Machine Learning Cơ bản nhằm hỗ trợ các website, blog công nghệ bảo vệ bản quyền bài viết và chống sao chép.

Ý tưởng cơ bản cuả dự án là quét toàn bộ tin tức từ các website, blog công nghệ phổ biến tại Việt Nam, sử dụng NLP để xác định những bài viết giống nhau. Qua đó giúp chủ bài viết dễ dàng phát hiện nếu bài viết cuả mình bị sao chép trái phép.

Dự án là một nỗ lực nhằm chống lại tình trạng vi phạm bản quyền bài viết phổ biến trong giới công nghệ Việt Nam. Xem thêm Vụ việc Topdev sao chép nhiều bài viết từ Viblo mà không xin phép

Tiến độ và kết quả dự án

Tính đến ngày 26/9/2020, dự án đã cơ bản hoàn thành bộ quét bài viết từ các trang công nghệ phổ biến tại Việt Nam trên cơ sở bộ quét Đọc báo. Model phát hiện bài viết trùng lặp và frontend hiển thị dữ liệu cơ bản cũng đã được hoàn tất.

Để đóng góp cho dự án, mời bạn tham khảo CONTRIBUTING.md

Cấu trúc thư mục

/src: chứa toàn bộ mã nguồn cuả dự án
    /docbao: mã nguồn quét dữ liệu 
    /topdup_open: mã nguồn lọc bài viết trùng và frontend

Name		Name	Last commit message	Last commit date
Latest commit History 29 Commits
src		src
.gitignore		.gitignore
.gitmodules		.gitmodules
CONTRIBUTING.md		CONTRIBUTING.md
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Giới thiệu về TopDup

Tiến độ và kết quả dự án

Cấu trúc thư mục

About

Releases

Packages

Languages

ITersDesktop/topdup

Folders and files

Latest commit

History

Repository files navigation

Giới thiệu về TopDup

Tiến độ và kết quả dự án

Cấu trúc thư mục

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages